开发者社区> 问答> 正文

文档智能pdf2word是类似PP-Structure那样的结果嘛?

文档智能pdf2word是类似PP-Structure那样的结果嘛? 就是格式化的有没有pdf2md的接口啊?

展开
收起
青城山下庄文杰 2023-12-02 14:02:27 123 0
2 条回答
写回答
取消 提交回答
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    文档智能pdf2word和PP-Structure是两种不同的技术。PP-Structure是飞桨社区开发者基于最新发布的PP-Structurev2文档分析模型开发的一款PDF转Word工具,它通过版面分析和表格识别等基本功能,支持文字、表格、标题、图片的完整恢复。 最新版本的PP-StructureV2智能文档分析系统,进一步支持了关键信息抽取与版面恢复等功能模块。

    另一方面,关于你提到的pdf2md接口,存在多种工具可以实现这一需求。一种实现方式是使用由Johannes Zillmann创建的pdf-to-markdown项目。此外,Mozilla的PDF解析和渲染平台pdf.js也可以作为原始解析器来使用。另一个实用的在线工具是pdf2md.morethan.io,它可以在网页上直接将PDF文件转换为Markdown语法的网页,并且该工具也提供了命令行模式以支持本地处理文件。

    2023-12-02 17:14:44
    赞同 展开评论 打赏
  • 暂时没有~这个目前正在规划这一块,有上线时间会通知到群和公有云文档,文档到markdown功能 此回答整理自钉群“【官方】阿里云文档智能客户交流群”

    2023-12-02 16:46:56
    赞同 展开评论 打赏
问答地址:
问答排行榜
最热
最新

相关电子书

更多
对象存储实战指南-试读 立即下载
OpenAnolis 龙蜥操作系统开源社区技术创新白皮书 立即下载
使用CNFS搭建弹性Web服务 立即下载