热门

最新

红包

立Flag

投票

同城

我的

发布
weixin_37992011
imxiaohu
1 年前
trueweixin_37992011

【GPTPDF:是一个使用GPT-4o将PDF解析为Markdown的工具。

仅293行代码,它可以几乎完美地解析任何PDF文件,包括排版、数学公式、表格、图片和图表等内容,平均每页成本为$0.013。

工作原理:

使用PyMuPDF库,首先对PDF进行解析出所有非文本区域,并做好标记

然后使用GPT-4o进行解析,得到markdown文件。

GitHub:
https://github.com/CosmosShadow/gptpdf

案例展示

原始PDF:https://github.com/CosmosShadow/gptpdf/blob/main/examples/attention_is_all_you_need/output.md

解析后的PDF:https://github.com/CosmosShadow/gptpdf/blob/main/examples/attention_is_all_you_need/output.md】

CSDN App 扫码分享
分享
4
54
  • 复制链接
  • 举报
下一条:
Gradio 应用:https://huggingface.co/spaces/Koi953215/DiffIR2VR
立即登录