吴伯凡对话吴军、涂子沛:大数据是智能的母体

简介:

0?wx_fmt=jpeg

智能能给普通人带来什么?语音识别什么时候才能真正实现?


◆ ◆ 

摘要


2016年11月13日,第二届万物互联创新大会「创业下一潮水:大数据与智能时代」在杭州召开。“铿锵三人行”环节请到了硅谷风险投资人、《智能时代》的作者吴军博士,观数科技联合创始人、前阿里巴巴集团副总裁涂子沛先生,以及伯凡时间创始人吴伯凡先生,并针对大数据和人工智能相关话题进行了探讨。


大数据文摘记者带来现场第一手报道,以下为对话原文,在不改变原意的前提下有部分删改:

0?wx_fmt=png

 

◆ ◆ 

大数据和人工智能的关系

 

吴伯凡:今年三场黑天鹅,AlphaGo取胜,英国脱欧,以及川普当选美国总统,这里都有一个很重要的问题,就是智能预测。第一个问题,大数据和人工智能到底有什么样的关联,区别显而易见,关联是什么?


0?wx_fmt=png


吴军:这一次川普和希拉里竞选,希拉里是一个什么样的势态,传统营销能够想到的办法,砸钱、铺广告位,找意见领袖、代言人,就是好莱坞的,传统方法全用上了,但是不产生结果。为什么呢,很多程度上过去这种传播方式,一个单点到多点的传播出来以后,什么结果不知道,接下来该怎么调整,不知道。

 

今天大众每一个人都是制造思想想法的这么一些人。通过移动互联网,大家互相抱团,一个个小社区。有这么一些人,他们的思想很相近,这些意见在过去淹没在汪洋大海之中没有人知道。支持川普很多人就是这样的,在今天看来这是一群很奇怪的动物,千奇百怪的想法,在过去媒体时代根本体现不出来。

 

今天,到了大选前几天,在facebook上,这些大数据的体现,好像facebook已经能够感觉到味道不大对了,虽然传统媒体都清一色说希拉里能够当选。在社交媒体上好像反映出要变天了,从这个角度来看也不完全是“黑天鹅”。就像在座各位参与到了大数据时代,智能时代之中了。这是我的看法。

 

涂子沛:伯凡的问题是大数据和智能有什么关系,我们简单的说,直接回答就是大数据是智能的基础,大数据是智能的母体。我用了一句比较性感的话来说,大数据是智能的土壤。也可以简单的这么说,没有数据就根本不会有智能,所有的智能都是建立在数据的基础之上。

 

我要来看,过了互联网时代之后是大数据时代,智能时代其实还是大数据时代的一个组成部分,一个巅峰。刚刚谈到今年美国大选,我们在关注大洋彼岸的选举,大家有没有关注浙江发生的事情,5月份阿里淘宝上就看到了和希拉里,川普的各种宣传旗帜出货量,川普是希拉里的5倍。

 

义乌人民说川普的货不要定金都敢做,而希拉里不行,所以数据是什么。刚才我们说数据是目前预测未来最有效,最有力的工具,因为数据表述的是过去,记录是过去的事情,但是表达的是未来,它告诉我们未来,因为整个世界是有因果关系的。黑天鹅是怎么来的,美国是怎么解释,我觉得可以看义乌。

 

吴伯凡:涂总是数据的代言人,吴军老师是智能时代的代言人,你认为涂总说的数据是大脑,智能只不过是一个延伸,你同意这个观点吗?

 

吴军:我同意,机器获取智能的方式和人不一样,它很大程度上靠数据。关键的是,机器获得智能在哲学层面和人还是有很大差别,人是强调逻辑推理,很严格导出知识。而机器某种程度上来说是一步到位,因为有这个数据一步到位,通过相关性直接找出知识,它对我们的认知是挑战。过去我们说要知其然,知其所以然,在计算机不是这样的,它知其然,不知所以然。你对这个结论用还是不用,信还是不用。举个例子,比如阿里的好多商品,包括亚马逊很多商品,它之间的关联,你根本说不出是什么原因的。但是你把这两个商品房在一起去卖,结果就是好,实际上这对过去人的认知也是一个蛮大的挑战,所以数据可以讲是机器智能的一个基础

 

◆ ◆ 

大数据的相关性与因果关系

 

吴伯凡:知其然,不知其所以然,万物都是有因果关系的,基本关于大数据的尝试,大数据是相关关系,不是因果关系,这个怎么解释?


涂子沛:吴军早上说到一个案例,沃森看病,沃森看疑难杂症比普通病还准确,为什么?我觉得这个问题在某个阶段可以去回答伯凡先生的问题,为什么这么讲呢,我其实还是相信因果性。相关性是没有因果的相关性,我们一定要验证这种相关性之后,才证明它是科学的。

 

比如伯凡说很多东西摆在一起,它们就是会卖得更好,它们有原因吗。啤酒和尿布是最经典的认知,开始沃尔玛也搞不清楚原因,啤酒和尿布摆在一起,双双销量都上升呢。它是有真实原因的,每一个最后有价值的相关性,它是有因果性的。如果没有价值的相关性,它背后这个因果性是不成立的。

 

◆ ◆ 

吴伯凡:有时候我们做决策时没有必要追溯因果,来不及。

 

涂子沛:对,我一定程度上同意,从数据上看相关性,我们一分析,杭州啤酒销量和硅谷犯罪率是相关的。这在数据上完全可以出现的,那我们怎么去解释。

 

吴伯凡:这个问题很深刻,过去说的雄鸡一唱天下白。大公鸡每天一叫,天就亮了,人们就认为天亮是被它叫亮了,实际上没有因果关系。我们听见鸡叫了,一会天亮了,这个我们可以用。这个问题思辨,大数据与思辨。

 

涂子沛:我认为这个东西已经上升到哲学层面,因和果,我们永远说不清楚。说了果,前面有因。因又是另外一个事情的果,整个事件是错综复杂,上升到哲学层面。最终解决这个问题,一定程度上是数据解决了这个问题。

 

吴伯凡:最近大数据不像前几年那么火,最近谈人工智能比较多。但是大数据,大家已经往深处在挖掘。比如最近我看到好几篇文章在谈林彪与大数据的关系,说林彪是一个数据分析的高手。

 

涂子沛:我相信这个例子来自于我的书,我是中国最早讲这件事的人。其实延伸过去,军事战争对数据的应用是非常密集的。为什么?因为数据就是情报的载体,就是信息的载体,所以他要收集数据。

 

这个故事说什么呢,说林彪他有一个很好的习惯,什么习惯?他时刻兜里带一个小本子,他见到什么东西,有人报告什么东西,他就记下来。记下来干什么,他把所见所得变成数据,一到决策的时候他什么情况就知道了。

 

我们今天要看,刚刚说了无数据无智能,事实上还有一个东西,在管理学上来说无数据无决策。我们所有的决策事实上建立在情报收集基础上,今天的情报是什么,今天的情报就是数据,不是其它的东西。

 

◆ ◆ 

智能能给普通人带来什么

 

吴伯凡:数据如果是一个情报的话,为我们提供了做决策的依据。但智能好像关心的还是数据,普通消费者关注的就是智能,智能无非让每个人都当上官,有秘书,有司机,吴老师怎么看待这个问题?

 

吴军:发展机器智能还要有医生,任何科技最终目的就是为了你的生活变得更好一点,这是终极目标。延年益寿,医疗,刚才很多人都讲到医疗,还有出行各方面要方便,要有人替你管理这些事。最好这个计算机足够聪明,把你的时间省下来,自己干一些喜欢的事,安排你日常活动的这些事,让他去干了。

 

以前最早是像林彪似的用一个小本子,用一个手册。然后就变成了你的日历,计算机上了。以后像日历,它可以管理得很好,涂老师、吴老师给我打一个电话,什么时候在这里搞活动,等等安排,我跟工作人员的邮件来往、微信来往,完完全全记下,严格来讲用科大讯飞理解语言的部分都记下来了。

 

久而久之,哪些活动,这么多活动,吴老师的活动,他做的内容和我写的有相似性,我可能会接受。或者涂老师刚才讲到数据和智能是相关的,所以他邀请的活动,我可能参加。另外有一个什么八竿子打不着的,根据以前习惯就拒绝了。它每天在整理决策优先级的时候,事先排好序了等等,就是很小的例子。

 

这些东西也是从数据到智能,这是我们生活的便利性。它知道我每天工作安排时,以后也不用我天天打电话给滴滴,或者易到用车,今天6点50在哪儿等我,这个时间是自动安排好了。到了6点50我该出门时,车已经准备好了,当然有无人驾驶。未来我们想象一个生活场景有极大的方便性,我们到时候能够腾出非常多的时间去思考问题,来发动人脑的特征。

 

◆ ◆ 

语义识别什么时候能实现

 

吴伯凡:还有一个听话听音,察言观色。就像现在说的例子,野蛮女友和男朋友打电话,你要是到晚了,没有到,你就等着。我要是到了,你没有到,你就等着;我要是到了,你不等我,你就等着!这个智能可能就无法理解,吴老师你觉得什么时候能够实现?


 

吴军:刚才我看讯飞的,基本上没有挑出什么错误,这个还可以。理解,这里有两个难点。第一,本身绕口令,计算机比较容易解决这个问题。一个是它理解上下文这个意思,同样说一句话,我就表达一般的陈述,可能是个反意。那我得看前面是个什么场景,这是一个常识或者人生活的知识,这是计算机现在,我还看不到一个前景。我今天说十年,我说错了,十年后你也不会找我。大概在这么短的时间内,我觉得这个事还不能最好的解决。

 

0?wx_fmt=png


最典型是在北京公共汽车上,你踩了一个北京40多岁的女同胞。踩了她一下脚,她会跟你说这么一句话,没硌着你的脚吧,她其实是怪你踩着他的脚了。第二,刚才讲的善解人意这件事,数据叠加之后会改进得非常快,包括航班今天晚了,发现哪儿有车祸,堵车了,让你今天早走半小时。甚至闹钟提前闹醒半小时,这个事做起来会是比较快。一般生活上的善解人意,这件事能够比较快,可能有个三到五年,生活助手应该能解决。

 

◆ ◆ 

便利VS隐私

 

涂子沛:我补充两个案例,今天人工智能到底在做什么,今天人工智能在做一些重复性的工作,帮助人类从这些工作当中解脱出来。

 

我原来在美国的时候都用Gmail邮箱,有一次我的朋友在家里给我写了一封信,从中国来到美国,什么时候抵达。到了那个时刻我就准备开车出去接人,这时候我收到了Googleplay发出的信息,说这班航班晚点了,我当时就惊讶。Google在读这些邮件,读这些邮件之后给你提供个性化的服务,可能会牵涉到另外一个问题,伯凡会感兴趣,就是隐私。

 

如果你说要做到察言观色,就必须读懂你的每一句话,这就是问题。当时我接到这条短信的时候非常惊讶,但我认为这条短信非常有用,为什么?我正准备出门,你说有用没有用,那当然有用。我们的一个结论,我们今天享受这种人工智能的便利,事实上是让度了我的一份权力。

 

这是我们说的第一个案例,第二个案例就说到AlphaGo。AlphaGo确实是计算机打赢了人类,但是我很快看到网上有段子,有什么段子呢,他说那是下围棋,你打打麻将试试看,我抓一下头发,揪一下耳朵,那就有配合了,我们会察言观色,计算机不会。

 

◆ ◆ 

技术的可能性和商业的可能性

 

吴军:触一下耳朵打麻将,也不是说做不到,因为你把视觉这些都加进去也能够做到,是成本的问题。之所以不做,商业上很多事不做是因为没利可图。像刚才涂老师讲的,提供一个航班晚点的信息,这个事以后你会更加相信我给你的推荐,它有一个商业逻辑在后面,这是比较好的。包括AlphaGo下棋这件事,是非常好的宣传。

 

如果哪天说打麻将,给你监测场景,你们大家如果觉得有用,它就会去做,你们大家要觉得没用就不会做。包括无人驾驶汽车也是,我们过去说眼观六路,耳听八方,过去好多事情发生了计算机监测不到。实际上它现在每秒钟各种传感器,几十种数据传进来,这个察言观色,像无人驾驶汽车出错率比人类还好一些。很大程度上做到做不到,看你砸多少钱了。

 

吴伯凡:这就是一个问题,技术的可能性和商业的可能性,成本的问题有没有人买单,厂商有没有利益的问题,很多技术实际上早就已经有了,但是它没有办法找到一个市场,所以就搁置了。刚才我看到前面一个演讲,一个词叫“部分辅助性智能”,可能我们下一步看到的无人驾驶汽车,就是那种老人车,货场和机场里固定场景,固定道路的,这种无人驾驶车率先会进入市场。那种高智能走盘山公路的车,可能到很晚才会出现。

 

吴军:无人驾驶要分六个阶段,第一是特斯拉,辅助驾驶,但还是人驾驶。第二个阶段,它驾驶,人监控。接下来有些分场景的,就是从小区到地铁站,每天只走这一条路,这个比较容易。再往后一个阶段,比如说你可以全市走,但最好晚上10点钟之后再上路。最后一个阶段,Google现在做的,没有条件限制,所以每个公司切入点不一样。特斯拉是切入第一个点,几个主要汽车厂,奔驰、宝马是切入第二个点。吴老师基本上切入三四个点,比如园区里、商场里,小区和地铁站之间的,各家目标也不太一样。

 

涂子沛:这是一个纬度,从技术本身来讲有这些发展阶段。但是我认为今年事实上是一个点,技术怎么去发展,怎么去提高,它最终市场结果就是大众接不接受,这是一个点。

 

今年AlphaGo战胜人类的围棋冠军就是一个转折点,这意味着越来越多的人接受智能。比如说吴军博士上午讲的例子,我认为也是很有借鉴意义的。他提了两个,第一,推荐。今天网站上很多东西,亚马逊上40%的销量是由于推荐,你不买这个东西,你没有说要买这个东西,我向你推荐最后成交了,40%的东西都是这么卖的,推荐。

 

他又讲了一个,沃森。我们要问的一个问题,计算机推荐一件衣服给你,你就买了,这不是问题。如果计算机推荐一个药给你,你就吃了,我认为这是一个问题。他上午说了三个数据,你的症状,你的历史,还有化验结果,有这三个数据提交给计算机,如果未来在手机上提交。手机告诉你该吃什么药物,你敢吃吗。如果你敢吃,我认为就是人工智能又一大跃升。

 

◆ ◆ 

吴伯凡:秘书、司机、医生,医生是最难的。

 

吴军:还有第四个,可以给你推荐老婆。以色列做了婚配的工具,犹太人做的,他的推荐准确率特别高。不光是犹太人去用这个,美国很多白人也去用这个。他说人类找老婆有一个特大的误区,女的找男的也有一个特大的误区。比如他是一个60分的男性,他想象女神是95分的。95分女神都不会看他一眼,他最高目标就是70分的,能找着这个就不错了,当然他对20分的也不会看一眼。

 

他做了什么事呢?把每个人重新做了画像,他不让你看到所有人。比如你是一个60分的,他让你看到最好的就是70分。这个60分,70分不是说长相,是各方面综合评估。这个成功率非常高,而且回访以后,他们的日常生活满意程度还很高。因为他找一些内在价值,不是外在的。60分一定要找95分的,最后你有钱也能办到,但最终差异是很难弥补的。当最后说找老婆这个事也不是你自己筛选,不是你自己的意愿,是机器在给你做,这个很有意思。

 

◆ ◆ 

机器会撒谎吗?

 

吴军:人有一些善意的撒谎,这个机器现在很难做到。

 

涂子沛:人类会撒谎,机器不会撒谎。图灵测试中存在这样的悖论,人会撒谎,到底能不能骗过他,这个图灵测试,吴老师你怎么看?

 

吴军:机器撒谎是很容易的,只是说你有什么顾虑,机器没有顾虑。AlphaGo赢李世石很容易,让它故意输棋不容易,故意设两个BUG,让它输棋是容易的。如果为了什么利益,为了赌博,中国的足球,要挣钱,要赌博,那就可以设计输棋了。但是善意的撒谎,这个是揣摩圣意,随便撒一个谎,今天天晴天阴,这个事很容易撒谎。

 

涂子沛:察言观色,人类有这种厉害之处,相比于机器。察言观色正是撒谎的基础,因为机器不会察言观色,它就不会撒谎。察言观色意味着你要去迎合,扭曲事实,机器不会。从这个角度上讲,我觉得未来人工智能世界还更靠谱一些。比人类管这个世界海更靠谱一些,因为机器不撒谎。

 

吴伯凡:人工智能的科幻电影里,一个丈夫车祸死了,可以根据他过往所有数据,用软件合成成一个真实的人,而且把这个女的对丈夫不好的评价知道以后,比如说他的脾气原来不太好。

 

涂子沛:这也是图灵测试,这个妻子最后能不能判断这个丈夫。

 

吴伯凡:越聊越多,人工智能,大数据,吴军老师说的第四点婚配,司机、秘书、医生,如果我们不当官,不有钱有势也能够拥有这三个,那对我们未来的的确确是一个福音,由此看来也的确是一个大产业,人人都拥有私人医生,拥有司机、秘书的时代。


◆ ◆ 

寄语


吴军:这是一个非常有希望的时代,这是一个最好的时代,也是一个最坏的时代。因为好坏是看你站在哪个角度,你是否参与了,你参与进来,对你来说就是一个最好的时代。你如果拒绝这件事情,可能对你来讲未来是一个很坏的时代。

 

涂子沛:我们要更多适应和机器共存共生,越来越多的依赖于机器。但是这并不是代表我们去否认艺术,其实吴军开始演讲的PPT,我记得很清楚,一开始弹钢琴很好的人最后成为了人工智能的专家,我认为还是要在这当中找到一个平衡。大数据会给你很多建议,告诉你怎么找到自己的另外一半,什么样的人才适合你。但是如果没有你自己的体验,没有每一次约会的心跳,没有那种察言观色所带来的愉悦感,或者说恶作剧感,小小的使坏,我相信这个世界的吸引力也会大大的下降。人之所以为人,还是要善用数据,善用智能,它归根到底还是工具。本质上,我认为这个世界上最可爱的东西还是人,还是人性,不是机器,只是我们要适应它。

 原文发布时间为:2016-11-20

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号


相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
3月前
|
人工智能 自然语言处理 大数据
AI大数据智能导诊系统源码 Springboot框架
智能导诊系统是在医院中使用的引导患者自助就诊挂号,在就诊的过程中有许多患者不知道需要挂什么号,要看什么病,通过智慧导诊系统,可输入自身疾病的症状表现,或选择身体部位,再经由智能导诊系统多维度计算,AI智能引擎分析、准确推荐科室,引导患者挂号就诊,实现科学就诊,不用担心挂错号。
57 0
|
4月前
|
存储 NoSQL 大数据
IDC 中国数字化转型盛典:兴业银行「基于悦数图数据库」的「智能大数据云平台」获奖
近日,2023 第八届 IDC 中国数字化转型年度盛典在北京盛大开幕。会上,IDC 中国为 2023 年度“IDC 中国未来企业大奖”卓越奖获奖企业颁奖。兴业银行凭借「基于悦数图数据库」的「智能大数据云平台」荣获“2023 IDC 中国未来企业大奖——未来数字基础架构领军者”殊荣。
IDC 中国数字化转型盛典:兴业银行「基于悦数图数据库」的「智能大数据云平台」获奖
|
11月前
|
存储 SQL 分布式计算
MaxCompute 物化视图智能推荐最佳实践
MaxCompute 发布 “物化视图智能推荐”,CU算力节省14%
|
11月前
|
存储 SQL 分布式计算
MaxCompute 发布“物化视图智能推荐”,CU算力节省14%
物化视图智能推荐支持自动对用户历史作业进行分析,自动识别周期性作业,智能提取作业集合中的公共计算逻辑作为物化视图计算逻辑,最终转换为对用户友好的SQL文本形式,按照推荐程度排序展示给用户,并支持将物化视图使用效果可视化展现。
|
11月前
|
存储 分布式计算 数据挖掘
MaxCompute 物化视图智能推荐最佳实践
本文主要介绍什么是五话题以及MaxCompute 发布的“物化视图智能推荐”具体内容。
12840 0
|
11月前
|
存储 SQL 分布式计算
MaxCompute 发布“物化视图智能推荐”,CU算力节省14%
物化视图智能推荐支持自动对用户历史作业进行分析,自动识别周期性作业,智能提取作业集合中的公共计算逻辑作为物化视图计算逻辑,最终转换为对用户友好的SQL文本形式,按照推荐程度排序展示给用户,并支持将物化视图使用效果可视化展现。
1698 0
MaxCompute 发布“物化视图智能推荐”,CU算力节省14%
|
数据采集 人工智能 算法
TICA解读:AI智能体与大数据构造在智能测试领域的运用
导读:各位小伙伴,TICA2022已于2022年12月15日圆满落幕。想必大家还畅游在知识的海洋里无法自拔吧?应大家要求,小编将为大家深入解读一些Topic。本次给大家带来的Topic,是由又仁老师在大会中分享的“AI智能体与大数据构造在智能测试领域的运用”。
290 0
TICA解读:AI智能体与大数据构造在智能测试领域的运用
|
机器学习/深度学习 人工智能 Cloud Native
【大数据趋势白皮书下载】IDC: 发挥数据智能价值,推动企业数字化创新
IDC认为,从提升企业中长期发展质量、降低综合投入成本的角度出发,大数据技术领域将呈现出两个显著趋势:一体化和融合化。企业应以战略和顶层设计为先导,用体系化的思维全面构建大数据能力架构,避免形成新的数据、业务和能力孤岛。 【下载地址见文末】
【大数据趋势白皮书下载】IDC: 发挥数据智能价值,推动企业数字化创新
|
人工智能 运维 监控
大数据在城市智能轨道交通的应用
随着城市轨道交通体系建设的逐渐普及,我国城市轨道交通网路愈加复杂,接入站点、旅客运输量等不断提高,为城市轨道交通的运行带来了一定的压力。
大数据在城市智能轨道交通的应用
|
存储 SQL 人工智能
贾扬清演讲实录:阿里云一体化大数据智能平台的演进丨2022云栖一体化大数据智能峰会
贾扬清在一体化大数据智能峰会论坛上分享立足于数据这个领域,数据和智能之间创新的火花。
贾扬清演讲实录:阿里云一体化大数据智能平台的演进丨2022云栖一体化大数据智能峰会

热门文章

最新文章