热门
最新
红包
立Flag
投票
同城
我的
发布
CSDN App 扫码分享
评论
9
- 复制链接
- 举报
下一条:
IBM Research 开源 Docling:一种用于高精度 PDF 文档转换和复杂布局结构完整性维护的 AI 工具IBM Research 推出了 Docling,一个专门用于 PDF 文档转换的开源软件包。Docling 通过利用专门的 AI 模型进行布局分析和表格结构识别而脱颖而出。这些模型,包括 DocLayNet 和 TableFormer,已经在大量数据集上进行了训练,能够处理多种文档类型和格式。Docling 高效运行在普通硬件上,且功能多样,提供批量处理和交互式使用的配置选项。该工具能够在最小的资源下运行,同时提供高质量的结果,这使其成为学术研究人员和商业企业的有吸引力的选择。通过弥合商业软件和开源工具之间的差距,Docling 提供了一个强大且适应性强的文档转换解决方案。Docling 功能的核心在于其处理流水线,它通过一系列线性步骤来确保准确的文档转换。最初,该工具解析 PDF 文档,提取文本标记及其几何坐标。接下来,应用 AI 模型分析文档的布局,识别诸如表格和图形等元素,并高保真地重建原始结构。例如,Docling 的 TableFormer 模型能够识别复杂的表格结构,包括那些部分或没有边界线、跨多行或多列或包含空白单元格的表格。这些分析结果随后被聚合和后处理,以增强元数据、确定文档语言并校正阅读顺序。这种全面的方法确保了转换后的文档能够保留其原始完整性,无论是以 JSON 还是 Markdown 格式输出。阅读我们对此的完整看法:https://www.marktechpost.com/2024/09/06/ibm-research-open-sources-docling-an-ai-tool-for-high-precision-pdf-document-conversion-and-structural-integrity-maintenance-across-complex-layouts/论文:https://arxiv.org/abs/2408.09869GitHub:https://github.com/DS4SD/docling@老凯撒的钱 @老凯撒的钱News