“虽然我们没能完成最终作品的提交,但还是学到了不少知识。”
“这次的考题完全找不到头绪,如果给我一周时间,也许可以给出更好答案。”
“居然没有有效的标注数据,几乎奔溃了,这比赛太真实了吧。”
“我们是搞图像识别的,这回领教了语义识别的难度。”
在刚刚结束的第三届大赛中,AI参赛者们遇到了“巨大”的困难。这究竟是个什么比赛,为什么大家叫苦不迭,让小编给大家说说看。
9月2日,第三季 “Power AI 人工智能马拉松编程大赛”在马哥孛罗酒店开幕,此次大赛主题是“挖掘制造工艺和流程的金矿”,活动由CSDN、IBM、e-works联合举办,旨在推动人工智能在传统制造业的应用落地。大赛的消息放出去以后,在国内人工智能算法领域引起广泛关注,报名踊跃。活动报名123人,主办方经过严格选拔后由76位开发者自由组队形成的20个团队参加了现场决赛圈的比赛(因为题目很难,只有11支团队提交了可以运行的作品), 10000+以上用户通过映客平台观看了活动直播。
跟其他人工智能算法大赛相比,本次Power AI马拉松大赛有三个特点:
亮点1:技术架构领先
PowerAI架构可独享 NVIDIA NVLink 技术的 AI 计算平台,开发平台支持TensorFlow,训练速度可提升100倍以上,与x86架构形成鲜明对比……优势多多,绝非俗流,未来在金融、电信、保险、制造等核心业务领域中将有广泛的应用。
亮点2:紧贴行业
本次大赛面向AI技术精英及在校优秀学生,通过开放真实的制造业数据,结合行业难点课题,向算法天才征集AI解决方案。参赛选手将通过对大量非结构化文本数据建立相关模型,分析和理解其中语义。类似模型可以在制造业的新产品设计、工艺和流程改进等方面,帮助设计和研究人员更快速借鉴既有经验从而加速产品设计、工艺和流程改进的过程,从而有力的推动人工智能在传统制造业中的创新应用。
活动亮点3:AI评判
比赛使用了自己开发的一套裁判程序。其中包括一个“抢答”部分一个答案自动判断部分。主办方从两个方面来考察选手的模型和程序:一个是inference的速度,另一个是答案的准确性。
选手通过每一轮的问题进行抢答,只有第一个送回正确答案的队伍才能在这一题得分。关于如何判断答案的时间顺序,程序中使用了消息队列来记录选手送回答案的时间。正确性的判断通过使用的语料构建了一个模型来进行自动判断。
除此之外,如果选手的模型中使用到了大赛说明中提到的一些比较前沿的算法的话,评奖嘉宾也会有相应的额外附加分,基本上还是以抢答部分的得分为主的。
(AI比赛,AI自己评判结果,这个创意绝了!)
考官挖了哪些坑?
1、数据没有清洗
这里面涉及到中文的繁体、简体问题,有编码问题,全角、半角的问题,这些其实都是中文里非常常见的问题。数据一旦清洗的不是很好,一定会影响到后面训练的过程。如果这方面经验不足,就会很容易与其他团队拉开差距。
2、特意规避了一些字词
你如果试图用关键字、关键词、关键短语来搜索问题的答案是找不到的,因为有很多问题的答案是跨行的,甚至是有顺序关系的。我们想看看这些选手在这种最新的领域里面,是不是能够很快地把新的paper转换成能够实验、尝试的模型。
(画外音:大部分考生都哭晕在考场)
这么难的题,谁获奖了?
一等奖团队合影
一等奖团队,来自中科院声学所,现金奖10000元。
二等奖两支获奖团队,分别由来自中国科学院自动化研究所和腾讯公司(北京)组成的第五组,以及来自北京大学&微软亚洲研究院的第十九组,现金奖8000元。
三等奖三支获奖团队,现金奖5000元。
为啥她们是第一名?
IBM中国系统实验室高性能计算部门开发部经理宋煜表示:“就技术而言,大赛看重模型的设计能力,不只是复制和使用既有的模型,更重要的是能够有模型设计上的创新。来自中科院声学所的冠军团队使用了两种方案。在最后的方案中使用了Bi-direction LSTM+Attention-LSTM。由于标签数据量有限,他们用R-Net的Attention机制对问题和篇章进行表示,然后再次使用Attention-RNN在篇章上进行Auto Encoder最后使用带Attention的Decoder生成答案,替换掉原来R-Net的输出层,巧妙降低了标签数据不足的影响。同时,在比赛中,该团队有着良好的项目分工,在转码,异常字符处理,词和字的特征提取以及匹配算法上都做了相应的调整和优化,最后达到一个良好的效果,从而赢得了比赛。”
(画外音:小伙子们,你们不行啊!)
一等奖的美眉团队(唯一男组员哭了)有技术、有分工,巾帼不让须眉,又一次把男同胞拍在了沙滩上!
获奖MM选手感言
“最大的收获,我们能在一个团队中工作搭配的很完美,这是最重要的。借用一句话独狼死,群狼生。”“有了这一万元明天先吃顿大餐,我们组写代码都没吃晚饭。”嘉宾寄语
“当下,人工智能正处于深耕行业应用的关键点,中国也将人工智能上升为国家战略。但把新技术应用到实践中,不是一蹴而就的。比如,开发者学了模型、训练数据后,并不一定能真地用在生产线。相信一天的比赛下来,选手们遇到不少挑战,而赛题的设计就是一步一步地带领大家解决这些难题,在其中体验、学习人工智能最新的技术,学会用人工智能解决行业中的实际问题。IBM希望通过举办这样的活动,发掘、培养更多人工智能创新人才和团队,共同引领人工智能在行业实现新的突破、新的繁荣。” ——IBM全球副总裁、IBM中国系统开发中心总经理谢东博士表示。
除此之外,CSDN &《程序员》总编孟迎霞前往现场致辞, TCL集团副总裁、亏联网事业本部总裁、豪客亏联网有限公司CEO孙良先生带来远方寄语。
赛后合影
小结
云计算、大数据、VR/AR、人工智能、区块链……技术圈每几年都会出现各种新的技术潮流,对于开发者来说,如果我们选对了未来技术方向,那必将事半功倍。现在,最火的技术非人工智能莫属了,我们转型AI的决心就差这一场实战马拉松了。CSDN 作为中国最大的开发者社区,还将携手IBM等合作伙伴共同主办了多场不同行业、不同技术点的人工智能大赛,希望大家继续关注我们的更多报道。
本次大赛的一等奖团队美眉主打天下,下次比赛男同胞们要加油了。
本文转自d1net(转载)