问题一:文档智能中文档理解的结果中图片的subType是none是为什么呢?
问题二:如果识别正常可以拿到图片的在线地址之类的吗?
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
一般来说是由于以下原因:
图片质量不佳:如果图片质量不好,可能会导致文档智能无法正确识别和解析图片内容,从而无法生成对应的subType标记。
图片类型较为特殊:如果图片类型比较特殊,例如二维码、条形码、手写图等,可能会导致文档智能无法正确识别和解析图片内容,从而无法生成对应的subType标记。
文档智能算法限制:文档智能算法目前还处于不断发展和完善的阶段,可能会存在一定的局限性和限制。如果图片内容较为复杂或者特殊,可能会导致文档智能无法正确识别和解析图片内容,从而无法生成对应的subType标记。
回答一:算法识别是有问题的,已提交到算法同学badcase样例,后期会持续优化
回答二:那不行,识别的是图片里面包含的内容 可以拿到页面转图片后的图片URL-此回答整理自钉群“【官方】阿里云文档智能客户交流群”
当文档智能中文档理解的结果中图片的subType
为"none"时,这通常表示该图片的内容被认为不包含与文档主题相关的信息。"subType"字段用于指示图片的类型或内容子类型。
有时候,文档中的图片可能是装饰性的、重复的或与文档主题无关的,因此文档智能系统可能将其分类为"none",即没有特定的子类型。
这种情况下,可以考虑以下原因:
装饰性图片:图片可能只是文档的装饰元素,对文档的内容并没有实质性的贡献,因此被分类为"none"。
重复图片:如果文档中包含多个相同或类似的图片,系统可能仅选择其中一个,并将其分类为"none",以避免重复处理和分析。
与主题无关图片:有些图片可能与文档主题无关,例如广告、页眉、页脚、社交媒体图标等。这样的图片在文档理解中可能被视为与主题无关的内容,因此被归类为"none"。