问答环节
雷鸣教授:GAN、BERT、RL,这三个方向,会有什么样的突破?
颜水成副总裁:GAN,会对视频方向,比如文章配图,可以采用自动生成与style相关,不会侵权等。但是不好的一点是,会利用明星的图片作假,导致信息真假混乱。BERT在未来,会比较看好。RL有时候要保证当前利益,不想损失已得利益,怕不robust,会带来弊端。
雷鸣教授:DL的发展与算力的关系,怎么看待?暴力求解?
颜水成副总裁:应该是算力和有效的数据,图像的问题解决的不错了,但是NLP还是不太好,要把词的排列组合(不考虑语义),需要的样本更多,张量更大,尤其还需要多轮对话,尤其当下data还处于不够。也许随着数据增多和算力增强,NLP处理会更好,但是人机交互,在理论理解方面,还是很难做的更好!
雷鸣教授:关于多模态融合,理解视频,还要结合NLP,前不久,微软通过视频理解来导航,如何看待?
颜水成副总裁:大家都在讲AGI,有人强调可以通过训练走向AGI,我个人认为AGI还有很长的路要走。关于多模态,其实人的认知,是有一个学习的过程,它是需要视觉和听觉,要去了解它是如何协同工作的,比如,如何背下一首诗。融合机制,其实是比较简单的,最后的decision,还是缺少。现在的多模态做的还是比较简单的,还是需要一段路要走。
雷鸣教授:AI落地,两种方法,自下而上,从身边自身的应用,比如起床需要闹钟,累了需要骑自行车;2004年,我在美国参加party的时候,曾见过小扎,穿的比较时髦,关于小扎的成长,感悟,人真的不可貌相!关于视觉的发展,如何看待?
颜水成副总裁:视觉方向,教育是刚需,父母和奶奶也愿意为孩子在教育上花钱。用视觉帮助5G时代下的产品,尤其是AI眼镜,特别好。视觉具有普适性,而大数据的互异形特别大,所以不太适用性。视频分析的时候,资源的bias,中国和美国的高校,还没有达到要做一些算力的要求。
雷鸣教授:对于自动驾驶,您怎么看?
颜水成副总裁:才开始有涉及自动驾驶,我们转为自动机器人,其实也有路径规划等。以前对AI眼镜,特别看好,但是五年过去了,其实没差别多大。
雷鸣教授:未来还是很难预期,还是需要从量变走向质变。年轻人,需要更多感知社会发展的方向和趋势,把握大势者得天下。机会很好,但是竞争也更激烈了,社会永远是公平的。由于AI的兴起,带来有哪些安全性课题(包括漏洞等)?
颜水成副总裁:AI本身就是软件,所以黑客通过软件可以进行攻击。黑客有可能利用DL框架来进行攻击,比如tensorflow、caffe等。以后AI会帮助自媒体产生内容,有些自媒体会造假信息,进而引发信息安全问题。虽然人也不完美,比较坚信,没有完美的算法。
雷鸣教授:AI时代,还有哪些机会?自下而上,年轻人创业,更能直接解决身边的问题。
颜水成副总裁:很大体量起来的是一个方向;可以寻找一个领域,找这个领域的专家,并且用你的AI,与其结合,能够更快成功!有的人创业,就是喜欢到一定程度被收购。
雷鸣教授:AI人才已经饱和了么?从其他专业转过来可以吗?
颜水成副总裁:当下,中国人才没有被饱和,其实,比如做语音的,国内就比如科大,就那么几个实验室,每年就那么有数学生。特别是自动驾驶,对CV领域人才的需求,会比较多。但是随着时代发展,数据驱动的人才,会比CV人才需求更庞大的。
雷鸣教授:办个培训班,工资翻一番,哈哈。AI领域的人才,不会那么容易形成的,高端人才,始终是稀缺的。
颜水成副总裁:AI领域,算法模型,更新的非常快,在这个领域要不断的学习,所以,也不是那么容易转行的。五年后,AI和Big data。中国TTS的人才,就像熊猫一样稀缺。
雷鸣教授:数据壁垒和技术壁垒,哪个更重要?像BAT大企业的数据不共享,对于初创企业,很难屯到数据。还是要建立起AI驱动的业务。现在如何商汤比人脸识别,几乎不可能了,人家可以用大量的数据来打压暴力算法。
颜水成副总裁:只有AI没有数据,是不可能成的,所以必须要有数据。data有两种一个是public data,另一个是private data。像public data,比如商汤都有了,已经有数据壁垒。
雷鸣教授:作为师兄,在学校如何积累,才能利于未来的成长?
颜水成副总裁:先想出自己究竟要干什么,若是学术界方向,呆在学校就可以了。若是工业界方向,自己尽早去了解商业。
个评:一个犹太人,开了加油站,另一个犹太人会想到开超市,而不是也开加油站,所以,我们也需要这种差异性思维。
备注:以上对话环节的文本编辑,为博主总结,与原文稍微有异,请以原文录音为准,时间比较紧,如编辑有错误,敬请指出,欢迎网友留言探讨。