6月4日,百度公司最近宣称在ImageNet(图像识别最大数据库)的图像识别人工智能基准测试中击败了谷歌(微博)和微软。但是周二,ImageNet宣称百度在测试中存在违规行为,百度已经为自己“误导公众”而道歉。
百度的行为凸显了人工智能领域竞争中存在的高度风险。目前,全球顶级科技公司都在争相研发人工智能技术,包括允许计算机识别图像、控制机器人、理解口语以及执行其他任务等。而积累起巨大计算资源的互联网巨头承受着巨大压力,它们需要竭力维持自己的领先地位,无论是声望还是潜在商业利益方面。
除了百度、谷歌、微软外,苹果、Facebook、IBM等科技巨头也都在重金招募大量人工智能研究人员,并且各具雄心。
5月份,百度宣称其在ImageNet测试中取得了全球最好结果,其图像识别错误率仅为4.58%,而微软是4.94%,谷歌为4.8%。在这种测试中,人类辨识ImageNet照片的错误率为5%左右。
可是,周二,ImageNet的计算机科学家发表声明指出,百度在测试中存在违规行为,百度采用了密集测试的方法以提高成绩。按照规定,ImageNet只允许参与者每周向测试服务器提交2次测试结果。可是在3月份的5天时间内,百度却提交了40次结果。ImageNet表示,百度还使用了30个不同的账号,在过去6个月中提交了约200次测试结果。
在ImageNet测试中,人工智能需要扫描拥有100多万张图片的数据库,然后将它们分为1000个不同类别。大多数研究人员通常使用数据库中的部分图片,对软件进行图像识别测试。而通过密集测试,百度工程师可以通过调整他们的软件熟悉这些图片的信息,从而获得优势。
人工智能公司Clarifai首席执行官、ImageNet竞赛上届赢家马休·泽勒尔(Matthew Zeiler)表示:“这种做法是非常糟糕的,这也是为何要限制参赛者向独立服务器提交测试结果的原因。如果你知道了测试内容,你就可以调整参数模型,从而获得更好的测试结果。”
ImageNet已经要求百度在今后一年停止递交ImageNet测试结果。百度拒绝回答相关问题,但在ImageNet网站发表声明称,百度科学家吴韧已经为他所谓的“失误”道歉。他写道:“我们已经在研究中添加了注释……我们将继续提供相关更新。”
原文发布时间为:2015-06-5
本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号