作者:谢宣松(星瞳),达摩院开放视觉智能资深算法专家
一、 视觉技术发展史
视觉是人类获取信息的最大渠道,它的应用非常广泛。在视觉领域,所有的信息都从感知增强开始,通过压缩传输、评估安全、搜索挖掘、生成编辑、认知理解,直至最后的重建互动。
视觉分类有很多维度,可以从技术、模态等维度进行分类。比如识别分割、缺陷检测、语义分割、外在识别等等。因此不管从技术维度、模态维度、其他应用维度来看,视觉分类非常广泛。
与此同时,视觉开放也有多种形态。比如开放学术圈的方法与思想,开放中高级开发者的模型与数据,开放初中级开发者的API,开放开发者的SDK组件,以及开放用户产品的解决方案等等。
为此,阿里巴巴在视觉开放方面,做了很多努力。比如达摩院针对API形态,开放的视觉智能开放平台。该平台开放了15类能力,200多种API能,日均调用达到亿级,目前开通的用户达到了七万人。