开发者社区> 问答> 正文

解析 word 读取 内容的 好的思路:报错

目前有一个上传习题的需求:

目前的实现方案是:按照我们提供的word、excel模板, 按照关键字解析文档中的单选、多选、判断、并提取习题,选项、答案、解析 关键字段,

目前存在一个问题:word上传解析:问题很多,解析出来各种不稳定;

                         excel上传解析:大部分习题都是word,客户觉得换成excel太麻烦

想问一下大家,在解析word文档,提取内容的时候,有没有一个比较稳定的 解决思路(比如对简历的解析提取关键信息是如何实现的,是不是准确率会不那么高)

展开
收起
kun坤 2020-06-07 13:40:35 669 0
1 条回答
写回答
取消 提交回答
  • POI  解析还是不过的 个人感觉######Aspose Word,最好的Office组件, 功能效率都比较强悍,梯子网用的这个做成了在线组卷。不过Aspose公司的所有产品是商业版,Aspose公司还有OCR、PPT等等。######回复 @zoakerc : 曾经我规定了试题模板,让他们用效果很不好,大多数人都不习惯######回复 @抓瓦工人 : 需求可能不太一样,要开学再和老师调研确定......######回复 @zoakerc : 你们组卷能做到word上传卷子,然后自动解析出题目吗######回复 @zoakerc : 我也是想做组卷,和你的需求一样######回复 @抓瓦工人 : 如果线下用的话可以干掉SHA1withRSA签名验证,线上涉及版权问题,我在的公司涉及Word这一块比较复杂,物理题组卷和试卷题库是和国内的某个组件厂商百万合作,目前还在整合。你说的这个提取内容,如果使用Aspose的话,可以用word书签内置一些数据区块在模板里,然后导出模板再给客户进行数据域填充,POI的木有研究过......

    2020-06-07 13:40:39
    赞同 展开评论 打赏
问答分类:
问答地址:
问答排行榜
最热
最新

相关电子书

更多
神龙云服务器产品及技术深度解析 立即下载
弹性创造价值:基于ECS的最佳性价比实践解析 立即下载
又快又稳:阿里云下一代虚拟交换机解析 立即下载

相关镜像