吴伯凡对话吴军、涂子沛:大数据是智能的母体

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:


智能能给普通人带来什么?语音识别什么时候才能真正实现?


◆ ◆ 

摘要


2016年11月13日,第二届万物互联创新大会「创业下一潮水:大数据与智能时代」在杭州召开。“铿锵三人行”环节请到了硅谷风险投资人、《智能时代》的作者吴军博士,观数科技联合创始人、前阿里巴巴集团副总裁涂子沛先生,以及伯凡时间创始人吴伯凡先生,并针对大数据和人工智能相关话题进行了探讨。


大数据文摘记者带来现场第一手报道,以下为对话原文,在不改变原意的前提下有部分删改:


 

◆ ◆ 

大数据和人工智能的关系

 

吴伯凡:今年三场黑天鹅,AlphaGo取胜,英国脱欧,以及川普当选美国总统,这里都有一个很重要的问题,就是智能预测。第一个问题,大数据和人工智能到底有什么样的关联,区别显而易见,关联是什么?




吴军:这一次川普和希拉里竞选,希拉里是一个什么样的势态,传统营销能够想到的办法,砸钱、铺广告位,找意见领袖、代言人,就是好莱坞的,传统方法全用上了,但是不产生结果。为什么呢,很多程度上过去这种传播方式,一个单点到多点的传播出来以后,什么结果不知道,接下来该怎么调整,不知道。

 

今天大众每一个人都是制造思想想法的这么一些人。通过移动互联网,大家互相抱团,一个个小社区。有这么一些人,他们的思想很相近,这些意见在过去淹没在汪洋大海之中没有人知道。支持川普很多人就是这样的,在今天看来这是一群很奇怪的动物,千奇百怪的想法,在过去媒体时代根本体现不出来。

 

今天,到了大选前几天,在facebook上,这些大数据的体现,好像facebook已经能够感觉到味道不大对了,虽然传统媒体都清一色说希拉里能够当选。在社交媒体上好像反映出要变天了,从这个角度来看也不完全是“黑天鹅”。就像在座各位参与到了大数据时代,智能时代之中了。这是我的看法。

 

涂子沛:伯凡的问题是大数据和智能有什么关系,我们简单的说,直接回答就是大数据是智能的基础,大数据是智能的母体。我用了一句比较性感的话来说,大数据是智能的土壤。也可以简单的这么说,没有数据就根本不会有智能,所有的智能都是建立在数据的基础之上。

 

我要来看,过了互联网时代之后是大数据时代,智能时代其实还是大数据时代的一个组成部分,一个巅峰。刚刚谈到今年美国大选,我们在关注大洋彼岸的选举,大家有没有关注浙江发生的事情,5月份阿里淘宝上就看到了和希拉里,川普的各种宣传旗帜出货量,川普是希拉里的5倍。

 

义乌人民说川普的货不要定金都敢做,而希拉里不行,所以数据是什么。刚才我们说数据是目前预测未来最有效,最有力的工具,因为数据表述的是过去,记录是过去的事情,但是表达的是未来,它告诉我们未来,因为整个世界是有因果关系的。黑天鹅是怎么来的,美国是怎么解释,我觉得可以看义乌。

 

吴伯凡:涂总是数据的代言人,吴军老师是智能时代的代言人,你认为涂总说的数据是大脑,智能只不过是一个延伸,你同意这个观点吗?

 

吴军:我同意,机器获取智能的方式和人不一样,它很大程度上靠数据。关键的是,机器获得智能在哲学层面和人还是有很大差别,人是强调逻辑推理,很严格导出知识。而机器某种程度上来说是一步到位,因为有这个数据一步到位,通过相关性直接找出知识,它对我们的认知是挑战。过去我们说要知其然,知其所以然,在计算机不是这样的,它知其然,不知所以然。你对这个结论用还是不用,信还是不用。举个例子,比如阿里的好多商品,包括亚马逊很多商品,它之间的关联,你根本说不出是什么原因的。但是你把这两个商品房在一起去卖,结果就是好,实际上这对过去人的认知也是一个蛮大的挑战,所以数据可以讲是机器智能的一个基础

 

◆ ◆ 

大数据的相关性与因果关系

 

吴伯凡:知其然,不知其所以然,万物都是有因果关系的,基本关于大数据的尝试,大数据是相关关系,不是因果关系,这个怎么解释?


涂子沛:吴军早上说到一个案例,沃森看病,沃森看疑难杂症比普通病还准确,为什么?我觉得这个问题在某个阶段可以去回答伯凡先生的问题,为什么这么讲呢,我其实还是相信因果性。相关性是没有因果的相关性,我们一定要验证这种相关性之后,才证明它是科学的。

 

比如伯凡说很多东西摆在一起,它们就是会卖得更好,它们有原因吗。啤酒和尿布是最经典的认知,开始沃尔玛也搞不清楚原因,啤酒和尿布摆在一起,双双销量都上升呢。它是有真实原因的,每一个最后有价值的相关性,它是有因果性的。如果没有价值的相关性,它背后这个因果性是不成立的。

 

◆ ◆ 

吴伯凡:有时候我们做决策时没有必要追溯因果,来不及。

 

涂子沛:对,我一定程度上同意,从数据上看相关性,我们一分析,杭州啤酒销量和硅谷犯罪率是相关的。这在数据上完全可以出现的,那我们怎么去解释。

 

吴伯凡:这个问题很深刻,过去说的雄鸡一唱天下白。大公鸡每天一叫,天就亮了,人们就认为天亮是被它叫亮了,实际上没有因果关系。我们听见鸡叫了,一会天亮了,这个我们可以用。这个问题思辨,大数据与思辨。

 

涂子沛:我认为这个东西已经上升到哲学层面,因和果,我们永远说不清楚。说了果,前面有因。因又是另外一个事情的果,整个事件是错综复杂,上升到哲学层面。最终解决这个问题,一定程度上是数据解决了这个问题。

 

吴伯凡:最近大数据不像前几年那么火,最近谈人工智能比较多。但是大数据,大家已经往深处在挖掘。比如最近我看到好几篇文章在谈林彪与大数据的关系,说林彪是一个数据分析的高手。

 

涂子沛:我相信这个例子来自于我的书,我是中国最早讲这件事的人。其实延伸过去,军事战争对数据的应用是非常密集的。为什么?因为数据就是情报的载体,就是信息的载体,所以他要收集数据。

 

这个故事说什么呢,说林彪他有一个很好的习惯,什么习惯?他时刻兜里带一个小本子,他见到什么东西,有人报告什么东西,他就记下来。记下来干什么,他把所见所得变成数据,一到决策的时候他什么情况就知道了。

 

我们今天要看,刚刚说了无数据无智能,事实上还有一个东西,在管理学上来说无数据无决策。我们所有的决策事实上建立在情报收集基础上,今天的情报是什么,今天的情报就是数据,不是其它的东西。

 

◆ ◆ 

智能能给普通人带来什么

 

吴伯凡:数据如果是一个情报的话,为我们提供了做决策的依据。但智能好像关心的还是数据,普通消费者关注的就是智能,智能无非让每个人都当上官,有秘书,有司机,吴老师怎么看待这个问题?

 

吴军:发展机器智能还要有医生,任何科技最终目的就是为了你的生活变得更好一点,这是终极目标。延年益寿,医疗,刚才很多人都讲到医疗,还有出行各方面要方便,要有人替你管理这些事。最好这个计算机足够聪明,把你的时间省下来,自己干一些喜欢的事,安排你日常活动的这些事,让他去干了。

 

以前最早是像林彪似的用一个小本子,用一个手册。然后就变成了你的日历,计算机上了。以后像日历,它可以管理得很好,涂老师、吴老师给我打一个电话,什么时候在这里搞活动,等等安排,我跟工作人员的邮件来往、微信来往,完完全全记下,严格来讲用科大讯飞理解语言的部分都记下来了。

 

久而久之,哪些活动,这么多活动,吴老师的活动,他做的内容和我写的有相似性,我可能会接受。或者涂老师刚才讲到数据和智能是相关的,所以他邀请的活动,我可能参加。另外有一个什么八竿子打不着的,根据以前习惯就拒绝了。它每天在整理决策优先级的时候,事先排好序了等等,就是很小的例子。

 

这些东西也是从数据到智能,这是我们生活的便利性。它知道我每天工作安排时,以后也不用我天天打电话给滴滴,或者易到用车,今天6点50在哪儿等我,这个时间是自动安排好了。到了6点50我该出门时,车已经准备好了,当然有无人驾驶。未来我们想象一个生活场景有极大的方便性,我们到时候能够腾出非常多的时间去思考问题,来发动人脑的特征。

 

◆ ◆ 

语义识别什么时候能实现

 

吴伯凡:还有一个听话听音,察言观色。就像现在说的例子,野蛮女友和男朋友打电话,你要是到晚了,没有到,你就等着。我要是到了,你没有到,你就等着;我要是到了,你不等我,你就等着!这个智能可能就无法理解,吴老师你觉得什么时候能够实现?


 

吴军:刚才我看讯飞的,基本上没有挑出什么错误,这个还可以。理解,这里有两个难点。第一,本身绕口令,计算机比较容易解决这个问题。一个是它理解上下文这个意思,同样说一句话,我就表达一般的陈述,可能是个反意。那我得看前面是个什么场景,这是一个常识或者人生活的知识,这是计算机现在,我还看不到一个前景。我今天说十年,我说错了,十年后你也不会找我。大概在这么短的时间内,我觉得这个事还不能最好的解决。

 



最典型是在北京公共汽车上,你踩了一个北京40多岁的女同胞。踩了她一下脚,她会跟你说这么一句话,没硌着你的脚吧,她其实是怪你踩着他的脚了。第二,刚才讲的善解人意这件事,数据叠加之后会改进得非常快,包括航班今天晚了,发现哪儿有车祸,堵车了,让你今天早走半小时。甚至闹钟提前闹醒半小时,这个事做起来会是比较快。一般生活上的善解人意,这件事能够比较快,可能有个三到五年,生活助手应该能解决。

 

◆ ◆ 

便利VS隐私

 

涂子沛:我补充两个案例,今天人工智能到底在做什么,今天人工智能在做一些重复性的工作,帮助人类从这些工作当中解脱出来。

 

我原来在美国的时候都用Gmail邮箱,有一次我的朋友在家里给我写了一封信,从中国来到美国,什么时候抵达。到了那个时刻我就准备开车出去接人,这时候我收到了Googleplay发出的信息,说这班航班晚点了,我当时就惊讶。Google在读这些邮件,读这些邮件之后给你提供个性化的服务,可能会牵涉到另外一个问题,伯凡会感兴趣,就是隐私。

 

如果你说要做到察言观色,就必须读懂你的每一句话,这就是问题。当时我接到这条短信的时候非常惊讶,但我认为这条短信非常有用,为什么?我正准备出门,你说有用没有用,那当然有用。我们的一个结论,我们今天享受这种人工智能的便利,事实上是让度了我的一份权力。

 

这是我们说的第一个案例,第二个案例就说到AlphaGo。AlphaGo确实是计算机打赢了人类,但是我很快看到网上有段子,有什么段子呢,他说那是下围棋,你打打麻将试试看,我抓一下头发,揪一下耳朵,那就有配合了,我们会察言观色,计算机不会。

 

◆ ◆ 

技术的可能性和商业的可能性

 

吴军:触一下耳朵打麻将,也不是说做不到,因为你把视觉这些都加进去也能够做到,是成本的问题。之所以不做,商业上很多事不做是因为没利可图。像刚才涂老师讲的,提供一个航班晚点的信息,这个事以后你会更加相信我给你的推荐,它有一个商业逻辑在后面,这是比较好的。包括AlphaGo下棋这件事,是非常好的宣传。

 

如果哪天说打麻将,给你监测场景,你们大家如果觉得有用,它就会去做,你们大家要觉得没用就不会做。包括无人驾驶汽车也是,我们过去说眼观六路,耳听八方,过去好多事情发生了计算机监测不到。实际上它现在每秒钟各种传感器,几十种数据传进来,这个察言观色,像无人驾驶汽车出错率比人类还好一些。很大程度上做到做不到,看你砸多少钱了。

 

吴伯凡:这就是一个问题,技术的可能性和商业的可能性,成本的问题有没有人买单,厂商有没有利益的问题,很多技术实际上早就已经有了,但是它没有办法找到一个市场,所以就搁置了。刚才我看到前面一个演讲,一个词叫“部分辅助性智能”,可能我们下一步看到的无人驾驶汽车,就是那种老人车,货场和机场里固定场景,固定道路的,这种无人驾驶车率先会进入市场。那种高智能走盘山公路的车,可能到很晚才会出现。

 

吴军:无人驾驶要分六个阶段,第一是特斯拉,辅助驾驶,但还是人驾驶。第二个阶段,它驾驶,人监控。接下来有些分场景的,就是从小区到地铁站,每天只走这一条路,这个比较容易。再往后一个阶段,比如说你可以全市走,但最好晚上10点钟之后再上路。最后一个阶段,Google现在做的,没有条件限制,所以每个公司切入点不一样。特斯拉是切入第一个点,几个主要汽车厂,奔驰、宝马是切入第二个点。吴老师基本上切入三四个点,比如园区里、商场里,小区和地铁站之间的,各家目标也不太一样。

 

涂子沛:这是一个纬度,从技术本身来讲有这些发展阶段。但是我认为今年事实上是一个点,技术怎么去发展,怎么去提高,它最终市场结果就是大众接不接受,这是一个点。

 

今年AlphaGo战胜人类的围棋冠军就是一个转折点,这意味着越来越多的人接受智能。比如说吴军博士上午讲的例子,我认为也是很有借鉴意义的。他提了两个,第一,推荐。今天网站上很多东西,亚马逊上40%的销量是由于推荐,你不买这个东西,你没有说要买这个东西,我向你推荐最后成交了,40%的东西都是这么卖的,推荐。

 

他又讲了一个,沃森。我们要问的一个问题,计算机推荐一件衣服给你,你就买了,这不是问题。如果计算机推荐一个药给你,你就吃了,我认为这是一个问题。他上午说了三个数据,你的症状,你的历史,还有化验结果,有这三个数据提交给计算机,如果未来在手机上提交。手机告诉你该吃什么药物,你敢吃吗。如果你敢吃,我认为就是人工智能又一大跃升。

 

◆ ◆ 

吴伯凡:秘书、司机、医生,医生是最难的。

 

吴军:还有第四个,可以给你推荐老婆。以色列做了婚配的工具,犹太人做的,他的推荐准确率特别高。不光是犹太人去用这个,美国很多白人也去用这个。他说人类找老婆有一个特大的误区,女的找男的也有一个特大的误区。比如他是一个60分的男性,他想象女神是95分的。95分女神都不会看他一眼,他最高目标就是70分的,能找着这个就不错了,当然他对20分的也不会看一眼。

 

他做了什么事呢?把每个人重新做了画像,他不让你看到所有人。比如你是一个60分的,他让你看到最好的就是70分。这个60分,70分不是说长相,是各方面综合评估。这个成功率非常高,而且回访以后,他们的日常生活满意程度还很高。因为他找一些内在价值,不是外在的。60分一定要找95分的,最后你有钱也能办到,但最终差异是很难弥补的。当最后说找老婆这个事也不是你自己筛选,不是你自己的意愿,是机器在给你做,这个很有意思。

 

◆ ◆ 

机器会撒谎吗?

 

吴军:人有一些善意的撒谎,这个机器现在很难做到。

 

涂子沛:人类会撒谎,机器不会撒谎。图灵测试中存在这样的悖论,人会撒谎,到底能不能骗过他,这个图灵测试,吴老师你怎么看?

 

吴军:机器撒谎是很容易的,只是说你有什么顾虑,机器没有顾虑。AlphaGo赢李世石很容易,让它故意输棋不容易,故意设两个BUG,让它输棋是容易的。如果为了什么利益,为了赌博,中国的足球,要挣钱,要赌博,那就可以设计输棋了。但是善意的撒谎,这个是揣摩圣意,随便撒一个谎,今天天晴天阴,这个事很容易撒谎。

 

涂子沛:察言观色,人类有这种厉害之处,相比于机器。察言观色正是撒谎的基础,因为机器不会察言观色,它就不会撒谎。察言观色意味着你要去迎合,扭曲事实,机器不会。从这个角度上讲,我觉得未来人工智能世界还更靠谱一些。比人类管这个世界海更靠谱一些,因为机器不撒谎。

 

吴伯凡:人工智能的科幻电影里,一个丈夫车祸死了,可以根据他过往所有数据,用软件合成成一个真实的人,而且把这个女的对丈夫不好的评价知道以后,比如说他的脾气原来不太好。

 

涂子沛:这也是图灵测试,这个妻子最后能不能判断这个丈夫。

 

吴伯凡:越聊越多,人工智能,大数据,吴军老师说的第四点婚配,司机、秘书、医生,如果我们不当官,不有钱有势也能够拥有这三个,那对我们未来的的确确是一个福音,由此看来也的确是一个大产业,人人都拥有私人医生,拥有司机、秘书的时代。


◆ ◆ 

寄语


吴军:这是一个非常有希望的时代,这是一个最好的时代,也是一个最坏的时代。因为好坏是看你站在哪个角度,你是否参与了,你参与进来,对你来说就是一个最好的时代。你如果拒绝这件事情,可能对你来讲未来是一个很坏的时代。

 

涂子沛:我们要更多适应和机器共存共生,越来越多的依赖于机器。但是这并不是代表我们去否认艺术,其实吴军开始演讲的PPT,我记得很清楚,一开始弹钢琴很好的人最后成为了人工智能的专家,我认为还是要在这当中找到一个平衡。大数据会给你很多建议,告诉你怎么找到自己的另外一半,什么样的人才适合你。但是如果没有你自己的体验,没有每一次约会的心跳,没有那种察言观色所带来的愉悦感,或者说恶作剧感,小小的使坏,我相信这个世界的吸引力也会大大的下降。人之所以为人,还是要善用数据,善用智能,它归根到底还是工具。本质上,我认为这个世界上最可爱的东西还是人,还是人性,不是机器,只是我们要适应它。

 原文发布时间为:2016-11-20

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号


相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
6月前
|
存储 机器学习/深度学习 算法
大数据时代下的智能洞察:大规模数据处理的创新与应用
在信息爆炸的时代,大规模数据处理成为了科技领域的核心挑战之一。本文将探讨大规模数据处理的定义、创新技术和广泛应用,并阐述数据驱动的决策和洞察对现代社会带来的巨大影响。
296 3
|
6月前
|
存储 数据采集 大数据
大数据处理与分析技术:驱动智能决策的引擎
本文介绍了大数据处理与分析技术在现代社会中的重要性和应用。从数据采集、存储、处理到分析决策,大数据技术为我们提供了深入洞察和智能决策的能力,推动着各行各业的创新和发展。
283 0
|
1月前
|
存储 数据采集 监控
大数据技术:开启智能决策与创新服务的新纪元
【10月更文挑战第5天】大数据技术:开启智能决策与创新服务的新纪元
|
3月前
|
运维 算法 数据可视化
【2021 高校大数据挑战赛-智能运维中的异常检测与趋势预测】2 方案设计与实现-Python
文章详细介绍了参加2021高校大数据挑战赛中智能运维异常检测与趋势预测任务的方案设计与Python实现,包括问题一的异常点和异常周期检测、问题二的异常预测多变量分类问题,以及问题三的多变量KPI指标预测问题的算法过程描述和代码实现。
75 0
|
26天前
|
机器学习/深度学习 人工智能 运维
智能运维:大数据与AI的融合之道###
【10月更文挑战第20天】 运维领域正经历一场静悄悄的变革,大数据与人工智能的深度融合正重塑着传统的运维模式。本文探讨了智能运维如何借助大数据分析和机器学习算法,实现从被动响应到主动预防的转变,提升系统稳定性和效率的同时,降低了运维成本。通过实例解析,揭示智能运维在现代IT架构中的核心价值,为读者提供一份关于未来运维趋势的深刻洞察。 ###
77 10
|
1月前
|
存储 数据采集 分布式计算
大数据技术:开启智能时代的新引擎
【10月更文挑战第5天】大数据技术:开启智能时代的新引擎
|
3月前
|
存储 人工智能 分布式计算
阿里云智能大数据演进
本文根据7月24日飞天发布时刻产品发布会、7月5日DataFunCon2024·北京站:大数据·大模型.双核时代实录整理而成
|
4月前
|
存储 算法 数据可视化
云上大数据分析平台:解锁数据价值,驱动智能决策新篇章
实时性与流式处理:随着实时数据分析需求的增加,云上大数据分析平台将更加注重实时性和流式处理能力的建设。通过优化计算引擎和存储架构等技术手段,平台将能够实现对数据流的高效处理和分析,为企业提供实时决策支持。通过优化计算引擎和存储架构等技术手段,平台将能够实现对数据流的高效处理和分析,为企业提供实时决策支持。
687 8
|
3月前
|
机器学习/深度学习 运维 算法
【2021 高校大数据挑战赛-智能运维中的异常检测与趋势预测】1 赛后总结与分析
对2021高校大数据挑战赛中智能运维异常检测与趋势预测赛题的赛后总结与分析,涉及赛题解析、不足与改进,并提供了异常检测、异常预测和趋势预测的方法和模型选择的讨论。
114 0
【2021 高校大数据挑战赛-智能运维中的异常检测与趋势预测】1 赛后总结与分析
|
4月前
|
人工智能 数据安全/隐私保护
数据平台演进问题之智能化数据平台会面临什么样的挑战
数据平台演进问题之智能化数据平台会面临什么样的挑战
下一篇
无影云桌面