开发者社区 问答 正文

文档智能中文档理解的结果中图片的subType是none是为什么呢?

问题一:文档智能中文档理解的结果中图片的subType是none是为什么呢?
805de9b706725711e188eca1bc2db6a4.png

问题二:如果识别正常可以拿到图片的在线地址之类的吗?

展开
收起
青城山下庄文杰 2023-07-30 12:00:50 78 分享 版权
3 条回答
写回答
取消 提交回答
  • 北京阿里云ACE会长

    一般来说是由于以下原因:

    图片质量不佳:如果图片质量不好,可能会导致文档智能无法正确识别和解析图片内容,从而无法生成对应的subType标记。

    图片类型较为特殊:如果图片类型比较特殊,例如二维码、条形码、手写图等,可能会导致文档智能无法正确识别和解析图片内容,从而无法生成对应的subType标记。

    文档智能算法限制:文档智能算法目前还处于不断发展和完善的阶段,可能会存在一定的局限性和限制。如果图片内容较为复杂或者特殊,可能会导致文档智能无法正确识别和解析图片内容,从而无法生成对应的subType标记。

    2023-07-31 23:15:55
    赞同 展开评论
  • 回答一:算法识别是有问题的,已提交到算法同学badcase样例,后期会持续优化
    回答二:那不行,识别的是图片里面包含的内容 可以拿到页面转图片后的图片URLd4580df85ef41cb68f7a9e0b197a01b9.png-此回答整理自钉群“【官方】阿里云文档智能客户交流群”

    2023-07-31 21:03:08
    赞同 展开评论
  • 当文档智能中文档理解的结果中图片的subType为"none"时,这通常表示该图片的内容被认为不包含与文档主题相关的信息。"subType"字段用于指示图片的类型或内容子类型。

    有时候,文档中的图片可能是装饰性的、重复的或与文档主题无关的,因此文档智能系统可能将其分类为"none",即没有特定的子类型。

    这种情况下,可以考虑以下原因:

    1. 装饰性图片:图片可能只是文档的装饰元素,对文档的内容并没有实质性的贡献,因此被分类为"none"。

    2. 重复图片:如果文档中包含多个相同或类似的图片,系统可能仅选择其中一个,并将其分类为"none",以避免重复处理和分析。

    3. 与主题无关图片:有些图片可能与文档主题无关,例如广告、页眉、页脚、社交媒体图标等。这样的图片在文档理解中可能被视为与主题无关的内容,因此被归类为"none"。

    2023-07-30 21:19:34
    赞同 展开评论