热门
最新
红包
立Flag
投票
同城
我的
发布
【GPTPDF:是一个使用GPT-4o将PDF解析为Markdown的工具。
仅293行代码,它可以几乎完美地解析任何PDF文件,包括排版、数学公式、表格、图片和图表等内容,平均每页成本为$0.013。
工作原理:
使用PyMuPDF库,首先对PDF进行解析出所有非文本区域,并做好标记
然后使用GPT-4o进行解析,得到markdown文件。
GitHub:https://github.com/CosmosShadow/gptpdf
案例展示
原始PDF:https://github.com/CosmosShadow/gptpdf/blob/main/examples/attention_is_all_you_need/output.md
解析后的PDF:https://github.com/CosmosShadow/gptpdf/blob/main/examples/attention_is_all_you_need/output.md】
CSDN App 扫码分享
4
54
- 复制链接
- 举报