ChatGPT扫地僧:使用GPT-4o将 PDF 解析为 Markdown 的工具,实现pdf转word完美转档 仅 293 行代码,该程序几乎可完美解析任何 PDF 文件,包括排版、数学公式、表格、图片和图表等内容,每页成本仅为$0.013。如有免费 API,则成本为零。工作原理是先使用 PyMuPDF 库解析 PDF 并标记非文本区域,再使用 GPT-4o 解析,得到 markdown 文件。项目名为 gptpdf。 使用方法:在 python 环境下安装 gptpdf,在代码中导入 parse_pdf,输入参数包括输入 pdf 文件、gpt api 等。可测试 CNKI 下的文章,整体识别较好,但存在个别图片未解析文字的情况。可通过 markdown 转 docx 完成最后一步,目前存在 word 文档多空行和表格处理问题,作者后续可优化。可在后台回复“gptpdf”获取代码。

未分类 徐 自远 76℃

ChatGPT扫地僧:使用GPT-4o将 PDF 解析为 Markdown 的工具,实现pdf转word完美转档
仅 293 行代码,该程序…https://m.toutiao.com/w/1803960903676995/?app=&timestamp=1720413225&use_new_style=1&tt_from=system&utm_source=system&utm_medium=toutiao_android&utm_campaign=client_share&share_token=ccbe03dc-09c0-4c54-b757-97a85dec32ef

转载请注明:徐自远的乱七八糟小站 » ChatGPT扫地僧:使用GPT-4o将 PDF 解析为 Markdown 的工具,实现pdf转word完美转档 仅 293 行代码,该程序几乎可完美解析任何 PDF 文件,包括排版、数学公式、表格、图片和图表等内容,每页成本仅为$0.013。如有免费 API,则成本为零。工作原理是先使用 PyMuPDF 库解析 PDF 并标记非文本区域,再使用 GPT-4o 解析,得到 markdown 文件。项目名为 gptpdf。 使用方法:在 python 环境下安装 gptpdf,在代码中导入 parse_pdf,输入参数包括输入 pdf 文件、gpt api 等。可测试 CNKI 下的文章,整体识别较好,但存在个别图片未解析文字的情况。可通过 markdown 转 docx 完成最后一步,目前存在 word 文档多空行和表格处理问题,作者后续可优化。可在后台回复“gptpdf”获取代码。

喜欢 (0)

苏ICP备18041234号-1 bei_an 苏公网安备 32021402001397号