谷歌AI系统图像配文准确率高达 93.9%-阿里云开发者社区

开发者社区> 人工智能> 正文
登录阅读全文

谷歌AI系统图像配文准确率高达 93.9%

简介:


5c2b01b476a05d00f08207d408b3a83a6bf73eee

要真正解释和描述一张照片,人工智能不仅需要了解图片中是什么,更要了解图像中这些对象有什么相互关系。谷歌的开发人员表示这不只是一个数据的倒推。该算法必须能够自然地理解图像中的对象和它们的用途。

谷歌研究的博客发文说:“令人兴奋的是,在展示全新情境时,我们的模型的确可以产生准确的配文,这显示出系统对图像中目标和背景的理解更深了。”同样重要的是,“它还学会了如何用自然的英语短语表达知识,尽管它只读了人类给的说明字幕,没有在接受其他额外的训练。”

至少从目前来说,相对于视频,机器学习算法能更好地理解静止图像的内容。

文章转载自 开源中国社区 [http://www.oschina.net]

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

分享: