继互联网引起第三次工业革命以后,以大数据驱动的人工智能技术正推动第四次工业革命。下述为杨强教授针对人工智能与大数据的一点问答与思索:
一问:您怎样定义深度学习与大数据的关联?
杨强:假如人工智能系统设计得好,产品就会更为方便运用、更为精准,因而也更为实用,那样就会产生更多用户。伴随着用户量的增多,数据也会随着增多,这反过来又会改善人工智能系统。两者是一种相互加强的关系。
大数据和人工智能能够结合变成一种新的人工智能,称之为「数据智能」。
二问:您能定义一下什么是大数据思维吗?企业如何才能融入这种思维模式,必须做出什么更改?
杨强:大数据思维,第一点就是有意识地去采集数据。也就是在开拓市场之前,需先想好怎样采集数据。
第二,数据采集和核心算法息息相关。要从算法之中认识自己缺乏哪些,随后有的放矢地去搜集数据,包含搜集不一样来源的数据等。
第三,要建立一个闭环。系统软件提供的服务能够刺激来源产生更多的数据,而这些数据又可以返回系统当中,进而形成闭环。这就使系统可以实现持续的自我改进和自我完善。闭环需要采用特殊设计,它与以往商业所用的设计大不相同。
三问:您可否深化说明什么是人工智能与大数据的闭环设计?
杨强:最先要考虑的是数据提供方,例如用户。所有的用户行为必须以数据的方式表达出来。其次是服务提供方,例如像我国的移动钱包微信付款和中国电子商务网站淘宝。依据数据转化成自动化反馈,目的是掌握用户的需求。用户将反馈数据提供给服务方,服务方又将服务数据提供给用户,如此就产生了闭环。
要想快速发展,第一,闭环要足够短,最好不要有人的参与,由于有了人的参与,闭环就没法完全实现智能化。第二,要常常升级环路,较好每天进行数次升级,因为这样才能保证系统持续得到升级。第三,务必不断进行升级,那样才能驱使用户持续提供反馈。因此,这个过程总结下来就是三个字:短、频、快。
四问:在您来看,这个闭环实际形成需要多久?
杨强:我觉得,人工智能发展会分成两个阶段。第一个阶段是所有行业都会去试着采用人工智能。比如,安保业务能用人脸识别系统,银行单位要用人工智能应用进行风控,这些。
第二阶段将会出现以人工智能为核心的全新产业。比如,将人工智能作为核心技术的银行,它在投资、服务、信贷等层面能够充分使用人工智能,只有在开展微调时才需要员工。
我觉得,第二阶段才是人工智能真正带给人类社会的未来形式。好比互联网刚刚兴起的时候,在第一阶段,传统书店做了一个网页,就觉得自己是网上书店了,但实际并非如此。到了第二阶段,亚马逊这类的网上平台出现了,它们与传统书店完全不一样。
五问:大数据和人工智能的融合也可能给信息流通和社会公平造成威胁。怎样确保大规模的数据正常流动,而又不危害私人信息呢?
杨强:利用大数据和人工智能技术造就出的产品,会产生极好的新商业运营模式。但其规模性运用的先决条件是要保证用户隐私。这儿有三点考虑:
最先,我们要有套法规和社会规范来保障数据的所有权,明确数据在哪里可用、在哪里不可用。我觉得,用户数据理应分门别类。比方说,红区数据不能动,黄区数据只让某些人接触,绿区数据则人人可用。
其次是从技术层面保障数据隐私。例如,第四范式公司(一家总部设在北京的人工智能技术服务提供商)现阶段正研究用“迁移学习”来保障隐私,它是一个较为新的方面。它能够帮助不同公司相互互换数据,例如,A做了一个模型,随后把这一模型转移到B场景,数据不是在A和B中间直接交换,而是被载入了模型之中。那样就能够更好地保障用户隐私。
第三,我们需要深入研究用户隐私和数据定价。例如,用户通过人工智能推荐系统在网上点击了一个广告,这一推荐系统是否也应当从中获得某些好处呢?如果搜索引擎有收入,是不是应该分给用户一些?这些问题都值得探讨。
六问:从全球角度来说,大数据和人工智能相结合会对发展中国家带来哪些影响?
杨强:我认为大数据与人工智能技术能够使一些新兴国家追上、以至于超过传统发达国家。因为在未来,经济竞争不仅仅是比拼金融和经济的规模,更关键的是比拼数据的规模,比拼拥抱数据经济的速率。例如,中国互联网和移动互联网的迅速发展,使人们得以搜集很多数据。这也将加快中国人工智能产业的发展,世界格局或者会因此而改变。
另一方面,一个国家假如已经拥有良好的基础设备和优质的教育,就可以运用人工智能提升生产率,如同当初的工业革命一样,蒸汽机的运用让一些国家获得了迅速转型。