听大咖聊 AI 时代-贾扬清对话知乎 CTO 李大海|学习笔记

本文涉及的产品
交互式建模 PAI-DSW,每月250计算时 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
模型训练 PAI-DLC,5000CU*H 3个月
简介: 快速学习听大咖聊 AI 时代-贾扬清对话知乎 CTO 李大海。

开发者学堂课程【PAL 平台学习路线:机器学习入门到应用:听大咖聊 AI 时代-贾扬清对话知乎 CTO 李大海】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/855/detail/14129


听大咖聊 AI 时代-贾扬清对话知乎 CTO 李大海

 

内容介绍

一、活动介绍

二、交流环节

三、节目尾声

 

一、活动介绍

1.介绍嘉宾

今天非常荣幸的邀请到两位 AI 界的巨佬参加这次的 AI 茶话会的活动。用一个网上的网友的留言引出两位巨佬。网友说:“学物理离不开牛顿,学 AI 离不开两位。

(1)李大海

因为学 AI 首先要在网上查看很多的资料,离不开知乎。所以今天很荣幸的邀请到知乎的技术负责人李大海老师。

(2)贾扬清

第二个就是说学 AI 离不开生虚框架,无论是 Caffe 还是其他,扬青作为核心开发者,今天很荣幸的邀请到阿里巴巴副总裁贾扬清老师到直播现场。知友们对到大佬们的兴趣爱好,个人的平时做什么,在哪能偶遇很感兴趣。接下来就让两位大佬介绍一下自己。

2.自我介绍

(1)贾扬清

贾扬清老师:我基本上属于一直以来在领域做算法,后来发现,工程这边的需求非常多,有点像前面几年人工智能大家都在做算法的时候,逆流涌进或者逆流涌退的,做了工程这块儿的事情。现在的话,更多的看工程的,怎么样来支持人工智能应用落地,所以现在在带阿里这边的人工智能和大数据平台的这块。

平时是知乎老用户,星期五的时候看以前知乎,在看以前知乎怼其他人怼得比较多,挺开心的在平台上交流交互等等。

(2)李大海

李大海老师:知乎的 CTO 李大海,本质上是一个工程师,06年开始在 Google 做软件工程师。但是在这个过程中很早就跟 AI 结缘。99年上大学,从本科到研究生学习的都是数学,然后在大一,大二的时候会去。翻阅很多各种数学分支出来看,当时看到一本书叫神经网络,神经网络在那时候还没火起来。把它当做一个数学分支来看,用这种方式去组织非线性的方程。觉得很优雅。后来这个进了 Google 以后,当时最早是接触 LDA 这样的一些算法,同时还看到我们 Google 内部的同事把 LDA 做成分布式。这是第一次看到这些机器学习算法跟架构跟分布式结合的威力。在 Google 内部把 LDA 做成分布式以后叫做网易。网易现在蚂蚁做开源的 AI 的框架。就产生了很大的威力。这也契合接下来要讨论的话题。

平时比较喜欢玩德州扑克和数独这样的游戏。

 

三、交流环节

1.国内外 AI 领域的区别

其实今天的预告早就发出去了。网友提了很多有意思的问题,我们就不按顺序说到哪问到哪。刚才大海说到在 Google 工作过,在海外有过一些工作经历。两位可以讲一下在海外从事 AI 领域的研究或工作和国内有什么区别?

1贾扬清

贾扬清:从 AI 的角度来讲,我觉得说是,国外的工程师和国内的工程师相比,比较像的一点就是大家都很用功,而且对于新的技术都是挺有追求的。

国内的工程师更加关注怎样把方法跟业务结合起来,国外有的时候有一些很纯粹很好玩的一些事情。

前段时间就是在想一些国外工程师做过什么事情,有两个特别逗的例子,一个是谷歌在 TensorFlow 经常会提到的一点,就是农民今天很多的产品,比如说花菜,黄瓜。在去超市的过程中,需要有不同的大小,质量,以前品控都是手摘的,很麻烦。后来他说在他 TensorFlow 深度学习来了之后,有一些应该说是农民家的工程做的比较牛的年轻人,他们用 PAI 的很小的一个嵌入式机器放在上面,然后下面把黄瓜拿过来。后来看到大一点儿的送超市,小一点的零售等等。这就说是有一些很有意思的,比如平时想不到的事情在搞。

另外有一个研究生的同学拿类似的 PAI 照着后院,后面有一个喂鸟的地方。松鼠经常过来,他就拿 PAI 照着看松鼠,松鼠来了就把它赶走,看着似乎没有什么用处,但后来的话,这些类似的技术开始产生出非常多有意思的应用。

硅谷有一个公司叫 Blue river technology 他是做有点类似于筛黄瓜和找松鼠这样的。在田间地头去找杂草,除杂草。那个公司后来被美国最大的农技公司收购。很多时候纯粹的技术好奇心创造了一个产业,这个还是国外非常有意思的一件事。

所以说扬清的观点是说,在国外可能创新突破多一些,在国内更偏业务落地,规模更大。大海怎么看这个问题?

2李大海

刚才扬青说的这个公司大概在知乎上也看到过,它上面有一个数字印象还挺深的。它是通过去识别杂草跟正经的农作物的区别。然后去定点地除草剂。做这个工作的除草剂的用量可以降低到原来的10%,这个非常厉害。将近了十倍的节约

从刚才扬青讲的这个点也确实都存在。硅谷的公司一直有这个文化。就是在前深度学习时代。当时在 Google 的时候讲过一个故事,当时在 Google 有一个柜子,柜子里放的是 T 恤,T 恤是一个很好的文化。什么事件他们都会用印一个 T 恤,大家去抢,当时的柜子里面放的是这种 T 恤,而且是不定期往里面塞的。因为有什么 event 这些事情是不确定的,所以 Eric 就自己在摄像头上写了一些代码,去监控摄像头里的柜子,一旦识别出柜子附近有人他就会通知他,就会看到柜子里塞 T 恤,就会去抢。在美国可能,工程师们他们自己自发的会去做这样的微创新,但在国内这件事情会有一些差别

国内首先在现在来说我们的 AI 应用场景已经很广了,比如说知乎。知乎的工程团队里有大概1/6的人都是算法工程师。算法在工业界已经渗透到整个应用场景的方方面面。所以应用是很广阔的,这是第一个,第二个是应用,其实从互联网开始推向我们的越来越多的传统企业,传统的行业这个趋势是存在的,但是在个人层面上,每个人自己看到一些小的创新机会。去把它实现这件事情上,国内可能和国外比是有一定的差距。

2. 在校生如何进入较好的互联网公司

(1)主持人引导

刚才大海也说,现在知乎差不多算法工程师占到1/6,其实有很多的同学。包括知乎上有很多的学生用户,大家也都非常感兴趣的一个问题就是说,在学校里学习跟工业建设怎么样更好地 match 上,就是怎么样学习能进入知乎,阿里这样的公司成为一个算法工程师。怎么样培养自己,知友们也可以留言刷弹幕。下面问一个大家很感兴趣的问题,假设我是一个在校生,我怎么学习,怎么样培养自己的 AI 能力,怎么能进入到我们这样一个比较好的互联网公司。怎么看这样的问题?

2需要具备的能力

大海老师:我觉得我们叫 AI ,我们 AI 的同学一般叫算法工程师,叫算法工程师,本质上先是一个工程师,工程师需要具备的能力。算法工程师都应该具备。

一是代码能力,能够写出,能把自己的想法用代码实现出来。

再一个就是数据能力,数据能力的话就是要对数据要有分析能力,发现里面重要的点,同时对数据进行处理的能力。

然后与人沟通的能力,大家现在都在团队里工作,肯定不是单打独斗,需要能够去做同组的其他的工程师之间的沟通,以及跟产品经理、跟测试的同学等等,不同的同学的沟通,等等这样的一些能力就是该具备的都得具备。

再一个第二点就是业务能力,就是对业务的理解,就像刚刚讲的,我们在国内其实我们的工程师,首先他得在业务应用上是很多的,然后业务场景非常多,所以虽然都是叫 AI 工程师,他们要解决的问题是非常不一样的,所以一定要理解业务需要解决什么问题。所以先要有定位问题、发现问题和拆解问题,解决问题的能力,这些都是非常重要的。

3总结

总结一下,就是说如果在校同学想来知乎,假设面试的时候遇到大海。可能会重点考察一下沟通能力,第二个是说算法能力能否跟我们的业务相结合,在校的时候可以做一些相关的项目

4针对在校生

当然如果是针对在校生的话,很重要的点。也是对于算法的理解能力。因为虽然大家都自黑,说自己是调参侠,但其实除了调参之外,当然得知道算法背后的原理,而且说实话我们现在处于深度学习时代,但是前深度学习时代有很多浅层模型。因为没有深度学习这种碾压式的表达能力,在浅层的模型上做了很多思考,那些技巧基于学习的能力的培养是非常重要的,而且里面的技巧在遇到很多真实问题,去解决问题是很有帮助的,所以对这些理解,一定是在面试的时候会考察的。

5扬清分享给在校同学

我非常同意大海刚才的一点,其实分析问题,定义问题,再解决问题,这个逻辑挺重要的,就是咱们一般在学校教育的时候,更多的在训练我们怎么解决问题的能力,后来有的时候很多事情如果问题定义清楚了,后面解决问题怎样都能解决。可能质量好一点,差一点。但是怎么发现问题,定义问题,这是一个挺有意思的事情。

从工程的角度来补充两点,第一点就是怎么样来获取最新的技术、算法等等。这块儿整个开源的领域做得很好,不光是开源,比如像知乎这样的开拓知识的平台在。这时候保持好奇心,各种各样的玩儿一玩儿,试一试。三年前有一个非常特别有意思的事情,发现说拍一个照片可以把它做成一个梵高的图片等等,现在回想起来是一个比较 silly 的一个事情。但是很好玩儿,这个应用本身是昙花一现的,但是在背后的整个一个工程的流程怎样把算法,快速的迭代出来,怎么样把它优化,放在手机上,怎样做上线。这一系列走一遍,跟看看 paper,看看 demo 是不一样的。今天的话,像 get up 等等这样的社区都在。其实很多的上手比以前更加的容易了。就是挺重要的一点。

6李大海老师的补充

关于扬青说这个想补充一点,就是像自己有段时间比较上进的时候。我曾经定过一个 topic。但是发现这是个坑,在机器学习领域,最近因为它非常的火热,所以每天都有大量的论文出来,有很多突破性的、不同领域的突破,或多或少或大或小的突破出来。会让人眼花缭乱,所以这种情况下,给学生们的建议是,能够自己先抓住重点,然后其他的领域尽可能的了解情况,了解一下大概是什么,理解就好了,如果想去全都抓住的话是很困难的,这个得有重点,有一点偏 T 型的感觉,有一点深,其他的都了解。

3.个人培养历程

看到网友留言,给大海提一个建议,就是很多的学生在知乎上去学习,机器学习。未来可以针对人群做一个定向的话题,帮助大家更好的去了解这个行业,快速入门度过从学校到工业界这个过渡期。接下来延伸一下这个话题,假设刚才问的是在校生,说一个同学已经入职了。成为一个社招的工程师。他可能会经历初级,中级,高级这三个阶段,两位都是带技术团队的大 leader。怎么看一个初级工程师,算法工程师怎么晋升到中级,还有中级算法工程师怎么晋升到高级,这个个人的培养历程是怎么看的?

1学习与保持好奇心

其实最开始的时候,从学校到业界的第一份工作其实挺重要的一点是学习。因为很多时候写研究代码的时候,一定程度上有一点是写一次要扔一次的程度。跟研究本质是一样的,研究是快速的迭代,不需要做工程的工程实现,如果真的要上线一个功能,而且这个功能最好不要是死了,死了就算了,一定程度上要保证这种情况下是怎么样做代码的管理、协同,怎么样做代码的 review,怎么做测试,怎么做 CD,怎么做上线,这一系列的工程流程是非常重要的。比如当时的时候在 Google 学到很多,当时大家发现代码有测试,是一个很惊讶的事情,但真的是在公司里头,测试是必须要有的,所以从刚刚到学校的时候,这个是一个非常重要的点

另外一个第二个是保持好奇心,任何一个公司的平台是挺大的。拿阿里大数据跟 AI 平台来举例子。像 ODPS,在十年前开始造的,今天非常非常复杂,上层的 SQL,中间的内容和底层的执行、调度,这时候肯定不能完全的把握到。这时候保持一个和人多交流,多提问,多讨论,就像刚刚提到的 T 型,有一点非常深,同时对整个系统非常理解,就会有更多的触类旁通这样的机会出来,这样逐渐变得更加 senior 之后,作为一个架构师,这样的能力使得我们在看得更宽、看得更大的时候,有一个更加全局的小架构的视野。

扬清有没有具体的建议,比如说你在学生时代是怎么学习的,用什么途径获取到新的 AI 的资讯,遇到问题怎么解决。

2学习成熟代码应用

我在学生时代,当时的时候,比如说深度学习,就是当时对于算法相关的 paper 看完了,觉得大概知道。但怎么做架构设计,这时候其实是有非常非常多的输入。举个例子,我们说深度学习最开始写框架的时候,他们的架构设计怎么做,这个是对于后来设计其他框架像 Caffe 等等是一个很好的输入。那么比如说怎么做模型的格式化等等,谷歌等等的框架都有很好的设计。这些现有的工程的 practice 以及现在的设计等等,有代码在,有文档在,有现成的应用样子在。看这些其实是非常现实的能提高自己的能力的方法。

3总结

对于已经工作的同学,扬清的建议就是看一些比较成熟的,比较稳定的框架的源代码,从里面去学习他成功的经验应用到自己的业务。

4大海看这个问题

首先我对于刚入职的工程师非常赞同扬清的观点,就是在学校的时候会关注 Demo 算法上足够的精妙。

但对于架构,对于工程其实关注度是不够的,对于自己早年犯过这样的错误。数学系毕业,工程上的培训偏少。到公司以后,其实这个点会变得很重要,还看过扬清在有一个线下分享里面说到一句话,很赞同,就是说 AI 是一个系统工程,90%的时间做的事情都跟算法无关。现实确实也是这个样子,那么所以作为一个刚入职的同学,首先入职已经晚了。

在入职之前,就应该挑选一个在工程实际上相对规范的公司去入职,如果是一个小公司,自己没有工程上的 Science,进入一个工程规范很乱的公司,这个对于个人的职业发展和自己的工程能力的培养是很有问题的。这个问题打个广告,觉得知乎这方面做的还是很可以的。因为最近做过一次分享,是关于知乎内部的 AI 架构相关的工作,其实也是走过弯路的,因为这 AI 这个技术在16年开始广泛使用的时候,那个时候肯定是为了能够快速上线,快速解决问题,所以当时都大家各管各的,但是经过那段时间以后会发现很多重复的,并且做的很浅的非核心技术层面的工作会特别多,导致维护性很差。所以后来逐步地在不同团队沉练出很多 AI 的统一的框架。会导致在接下来做很多工作的时候很有章法。

另外还想补充的一个点,是关于最终的架势。比如说在知乎现在的工程文化四个字,全面交付。全面交付代表的是要交付价值。其实这个东西看的是你最终给用户的是什么,所以对一个工程师来讲,他尤其是从 Junior 向 senior 发展的过程中,他特别关注自己的算法,自己手里面工具箱里的工具,最终把它组合在一起,传递给用户的是什么东西。

第三点。就是从 senior 往上走的时候,会发现在业界有一个现象叫 AI 人才业务化。这个现象不管是知乎还是快手、头条都会在发生。就是很好的 AI 工程师可以去立的一个或大或小的业务,能够完整的从头到尾地把业务讲清楚,这里面还蕴含这个道理,后面可以聊的就是。其实 AI 的方法论,对于个人的学习是很有帮助的。后续可以简单聊聊。

4.人才规划

关于人才规划这个问题,接下来就是到了最后一个小的问题,一个比较尖锐的问题,可能提到有 senior 的 AI 算法工程师,二位属于 senior Plus 级别,二位觉得你们跟其他的算法工程师比,你们最大一个优势是什么,有没有考虑过。为什么二位走到了金字塔尖,因为算法工程师也很多。

1结合业务

做 PhD 的时候做过算法,后来更像是做系统吧。

或者是 AI 从业者,你们跟其他 AI 从业者比最大的优势是什么,专注度或是其他的方面。

我觉得可能是在 AI 这个领域里面,就是说是在业界做的非常成功的人和团队,都有一个就像大海刚刚谈到的一点就是业务化,不光是懂算法,而且是他能怎么用。因为今天的话算法非常非常迅速地变得普惠化以及白菜化。找一个研究生两分钟就能搞出来,因为工具普及了,算法普及了。而且 AI 的算法的创新在逐渐变缓。现在已经比较成熟了,可以在上面稍微调一点,但是算法已经不是一个核心的,这种情况下怎么样找到实际应用场景,定义说这时候应该怎么样把它和应用结合起来。这一块儿是最能够体现出价值的地方,如果真的要做实现 AI 的突破的话,可能现在不是在算法上面,而是在算法加系统加应用,而且应用可能会变得越来越重要。

2总结

所以扬清这边其实现在重点在关注的一个点是 AI 跟业务的结合,也是现在需要花时间比较多的地方。那大海怎样看,跟其他的应用工程师比,你的精力放在什么方向或者是你的优势什么。

3查看需求

首先我觉得我们还是算是在 AI 应用层,我们 AI 现在已经是一个非常大的框,里面可以放很多的东西,领域非常的广,我觉得我们更像是 AI 行业的从业者。把 AI 当成工具箱里面的很好用、功能能力很强的工具再去用它。所以刚才介绍自己的时候说我是一个工程师,并没有强调我是一个 AI 工程师,所以我觉得 AI 它很好,我们曾经有内部会很喜欢一本书,叫与运气竞争。是一个国外经济学家写的书,本质上讲的是我们当手上有一把锤子的时,很容易想到我拿着锤子能够干什么。然后当你有钻头的时候可以干什么。但其实很多时候用户需要的是钻一个孔,本质上可能是用来挂衣服。如果把钻头核心程度更高,更好看,这些事并不是用户需要想要的,总得来说工具非常重要。我们对于 AI 的理解,AI 技术的跟踪都很重要,但是更重要的事情就是跟扬清讲的一模一样的用户需求到底在哪里,我们能解决什么问题。

5.业务落地

然后我们顺着话题进入第二个模块,刚才大家都提了很关注现在 AI 的一些业务的落地。现在很多关注 AI 领域的人有两个观点,一个是说 AI 是未来,现在属于一个刚发展阶段,逐渐有一些场景可以实现落地,比如说智能音箱,包括一些千人千面的推荐,但是在人工驾驶这个模式方向看上去暂时还没有落地,有的人说 AI 是破泡沫,二位怎么看现在人工智能属于什么阶段。是属于初期还是中期,包括他未来会给我们带来什么样的改变,他的长期规划是什么样。

1仅看好应用层

大海说如果要判断它是什么阶段,那我们得知知道全景会是什么样子的。这个问题是很难预测,要说全景的话,就会绕不开一个问题,就是我们对于人工智能到底最后能走到什么样的状态,能不能达到强人工智能的状态,有点偏科幻的讨论了。

在这个方面,我个人的观点是偏悲观的,但是我觉得强人工智能可能是不知道什么时候会到的事情,也许永远不会到。但是说回应用的话,现在可以看到在越来越多领域,其实人工智能都已经打败人了。很多领域,比如说像是图片的分类。还有一些其他的领域,一下列不出来,但是所以在应用层面上是很乐观的,我们要去回顾人工智能的历史,过去从20世纪初开始,已经经过起起伏伏,到了06年,论文发出来以后,到今天我觉得我们可能有些泡沫,但这些泡沫其实是我们的 AI 公司在商业模式上遇到的一些问题。

但从技术层面上讲,这些技术工具越来越强大,数据量越来越大,这些是毋庸置疑的事情。所以我在应用层面上比较看好。

2认知与决策

扬清说我个人觉得在从历史的角度上讲,其实就是我们计算机的整个领域出现的目的就是实现更加智能化地处理和世界的交互和人的互这样的问题。

图灵当年提出来的时候,其实就是图灵测试等等都是人工智能,人工智能以前最早的时候,大家都在处理一个决策的问题,我们如果想一下,决策这样的系统,专家系统做了一堆后发现这个我们还不知道这个世界怎么从语音变到计算机这个逻辑的系统里来,所以深度学习前面几年其实在非常强烈地从一个决策的一边来解决感知的问题,今天从感知的角度来说,基本上可能达到一个相对较成熟的阶段。

2014年的时候,我们在谷歌的时候说图像识别的正确率已经超过人了,至少在一个限定的范围内。已经超过人了,本质上到一个非常成熟的阶段,回过头看决策的时候,其实今天决策还不行。刚刚提到自动驾驶的问题,自动驾驶是我知道这儿有个车,我知道那儿有个人,但是这个完了之后我怎么做决策,我的逻辑是什么。甚至有一些更加复杂的事情。前面的车都超速往前开,限速是25,它们都30了,我怎么办。这些都是要从决策上要解决的,今天人工智能可能,在感知已经解了的这样一个方面,回来继续做

一个是认知,怎么把知识结构化

第二个在这个基础上怎么做决策,这方面我们还处于非常早期的这个阶段。

6.强人工智能

所以说分领域去看,在认知领域,我们可能已经到了比较成熟的阶段,在感知领域,决策领域可能还处于在初期的探索。分领域去看人工智能到底处于什么阶段,大海说对于强人工智能比较悲观的,可能需要再一次的技术突破。可能才能够达到强人工智能的阶段。你觉得强人工智能的概念是什么。

1解释强人工智能

强人工智能,强人工智能的概念比较清楚的,完全地通过图灵测试,他有意识,甚至能够能甚至能够做人的情感方面的表达。

2补充强人工智能

这点我想补充一点,通过图灵测试是一个非常难的事情。举一个最近的例子,GPT-3 ,大家都觉得 GPT-3 是一个非常猛系统。说的都是人话,在书上有非常多的文章,关于 GPT-3,有一天文章写的非常好,讲到 GPT-3 像是一个演员,他能够在任何情况下都演的差不多,但是去看的时候,有一些你问他一个问题的时候,他的回答是说反正我回答的像人话,像人话并不一定真的像人这样的思考,怎么样背后,GPT-3 做的事情是可以用一个非常大规模的网络,解决一个聚合大规模知识的能力。怎么样在聚合知识的结果下做一个推理,其实更多的像是一个表演,不是一个逻辑。这是图灵测试可能会深挖的一件事情现在。

3哲学讨论

有一个比较偏哲学的讨论,确实这一个问题是在现在的人工智能技术上的一个问题,他们是一个表达能力很强,有各种各样的深度学习的深度模型,有很强的表达能力,1700亿个参数。但是他拟合的其实是世界的数据的表象,他没有通过数据表象,真正的学到世界的本质规律,就像我们有一个带有噪音的简单的系统,它代表的是一个加法。这个事情他能学到,大概这个规律是什么,但是他没有做到能够学习后到后面,知道本身规律是一个加法的事情能够很清晰的表达出来,就是现在人工智能的一个问题,就是刚刚说到的推理的问题。

7.怎么看 AI 和云的关系和 AI 在云里面做扮演的一个角色

专门留给扬清老师的,因为扬清其实在阿里云主要做 To B 的业务。有一句话叫 AI 是云的内核,云是 AI 的必然形态。扬清怎么看 AI 和云的关系和 AI 在云里面做扮演的一个角色。

1强结合

这个稍微有一点作作,我以前一个师兄当时在微软实习,可能是十年之前的事情,有一次微软实习生大家去做见一个微软的创始人,他问了创始人一句话,我应该怎么样投身到或者是怎么样来解决更多的 IT 领域的问题,然后那个合伙人哈哈一笑说,你应该加入微软

为什么说云和 AI 是强结合的状态呢,可能是从两点上面开始说

一点是算力,一点是数据。从算力的角度上来说,我们在学校的时候,或是自己在做一个事的时候都当过机器。当机器很痛苦,而且运维一定程度上不产生价值。然后 AI 这边非常强烈用到 GPU,GPU 有的时候会过热,有的时候怎么做资源的调度等等。

2典型问题

一个很现实的问题,任何一个实验室都会遇到两个典型的问题,一个是科研人员在找 GPU 的时候找不到,全被分出去,然后系统工作师跑过去。发现利用率很低,典型的资源调度的问题,云是一个非常适合解决算力的问题。

30年前单位,都有一个东西叫发电机,今天没有人用发电机了,因为我们底层设计到了如此完成的或者是如此成熟的程度,可以给社会提供一个非常低成本,大规模的能力,云的计算力变成一个水电一样的基础设施,我们不需要担心机器这坏了那儿坏了,突然要拿起一个大量的应用,这时候云可以有弹性,可以放掉。这是一个算力这块,

第二个是数据这块,一定程度上,大家前一段时间 AI 这一块儿,非常大量的关注在深度学习这个场景下,图像、语音等等。有大量的 AI 应用,一定程度上是跟结构化数据在一块的。举个例子,像知乎有大量的用户用内容,一方面是自然语言的处理,另一方面是用户和内容的匹配。这时候在一个大数据底座上,无论是像 Hadoop 还是像 MaxCompute 这样的数仓上面,这个上面的时候,怎么样做结构化数据上面的人工智能,这个是和大规模分布式系统是分不开的,不可能今天把这些数据放在一个 GPU 机器上面,拿三个 SSD 把它给接起来,这个时候需要有一个比较完整的一套从去存储处理,分析到计算到上层的,比如说任务的编排,模型的开发,模型的上线以及数据的回流。

这一整套系统,无论是用户自己搭一个系统,还是说在其他方面,都是一个不可或缺的环境,所以今天的话在做 AI 时候,越来越多会关注到系统,云这样的状态,这也是接下去发展的时候一个必然的形态。算法今天可以开发,怎么样把算法用起来需要有算力,需要有数据。这块非常强烈地需要用到云和云相关的技术。

8. 现在负责的团队在云上的 AI 平台做过哪些工作

1结合 AI 和大数据

做的最有意思的工作是把 AI 跟大数据结合起来。今天我们说我是做 AI 的,其实里面的形态是很不一样的,比如说前面一段时间发现一个很有意思的事情是,做深度学习的工程师会觉得现有的大数据平台不好使,为什么,因为他以前都是数据库管理的结构化数据,需要一个盘存着图片,存着语音,做深度学习,今天现有的大数据系统会需要逐渐地向这种深度学习的应用领域。去改变,做更加灵活的云原生的这样的一些训练推理等等这样的一些底座。

另一方面在结构化的应用工程师,比如说我有一个推荐系统的需求,但我并不想把所有的东西的都自己用代码写出来,需要有更加活的拖拉拽的方式,把数据和算法,打包好的算法接起来。这时候怎么样更加容易地让大家能够把这条链路走通。这是从大数据现有的角度上看,怎么样把 AI 落地落下去,这是很有意思的一件事,所以说前面一两年的话,做的很有意思的事情是把AI的这两个场景,非结构化深度学习的场景和结构化的传统机器学习的场景都往上推,从系统的程度上面。

9.未来发展趋势

其实大海刚才介绍在知乎上面的工程师有1/6跟算法相关的,其实有很多同学跟工程相关的。现在有一个很有意思的话题,就是比如说一个同学快毕业,或是一路学选自己的研究方向,是说选做工程方面的 AI 更有前景还是从事算法方面的 AI 更有前景。这个问题其实在包括网友的留言,很多同学非常感兴趣的。大家怎么看说工程、 AI 工程工程师,和 AI 算法工程师他们之间的不同,还有各自的发展趋势,包括说未来会不会说 AI 工程师也要懂算法,算法工程师也要懂工程,有没有这样的可能性。

1基础能力和学习能力都非常重要

首先就是介绍一个情况,扬清也知道在谷歌内部,很多 AI 的工作其实是普通的工程师在做,所以只要清楚要解决的问题是什么,能够把这个事情描述清楚,放到系统上,系统就会给出一个解决方案,所以在未来技术越来越发展以后,AI 这件事情能力和门槛会越来越低,要做到一个基本能用的应用场景。需要的 AI 工程师对于算法的积累。要求会越来越低他是一个下降的过程,但现在有很多很东西也需要 AI 工程师去搞。这个是一定数目往下降,所以从这个角度上讲,作为工程师是需要像刚才扬清说的那样一个 T 字形。一定要在 T 的一个横上,大家应该差不多。又要懂架构,又要懂算法,然后这个竖着的这一条更重要的点,不是你现在是什么,而是现在在学校的时候还有在开始工作的时候能够塑造好自己的学习的方法论,能够快速补充自己,让自己的那一条竖线根据自己业务需求,能够伸缩自如地变长就是非常重要的。早期的时候,包括在知乎也好,或者谷歌也好,招工程师的标准,就是希望工程师足够聪明。能够快速学习,快速根据业务需求去补充自己。听起来没有回答你的问题,但是我的答案就是工程师自己的基础能力和学习能力都是非常重要的,这些远重要于是选 a 还是选 b。

2举例

所以说这一个同学如果想入 AI 这个行业,假设他定位是一个偏工程的同学。其实他对算法也要有一些了解,假设他给自己的定位是一个做的算法,可能看 paper 比较多,但是对工程也要有一些了解,并不是说我学的工程就不要做算法。

这里的一些了解的就是相对比较模糊。相对要更清晰一些,所谓一些了解,就是像扬清讲的一种。我自己动手,知道他怎么回事,在一些基本的情况下能够做出来。这种程度上,但不要求你能够很精深地去解决一些很 top 的问题,很前沿的问题,这个没有必要,但是一定是能动手的。

3对于在校生

对于在校生的话,是不是说做一些项目把工程和 AI 结合到一起,把两个模块的知识都能学习到。再具体的能说,扬清有一个很显著的身份,是三个世界级框架的作者,这三个框架有自己的特色,不同的特点,对于在校的学生来说一定去读一读 TensorFlow 的整个框架。有一些源代码可以简单读一读,知道在这个框架里面一些基础的机器学习算法都是怎么实现的,这个层面是需要的。

4了解细节

大海老师说的已经很具体了,其实算法同学不光要用 TensorFlow 去实现一些方法。甚至要了解底下一些框架源码的细节。

5两个角色的引出

扬清怎么看,抛一个可能相对比较有争议性的说法,我觉得没有算法工程师这个角色。

有两个角色,一个是算法的研究人员,一个是应用的工程师,调参侠是没有市场的。因为调参这个事情,算法的科研的人员在想怎么样做更好的算法,在计算机视觉领域,可能要把模型做的更大,做的更准,可能做得更小。在做炼化的时候,要在两边做一个平衡,这些是算法在一个场景下,怎么样做创新。这些是科研人员的事情。

调参下背后的需求其实是我有一个新用应用过来,我现在了解这个应用,完了之后把我的算法落地落下去,这时候光调参是不够的,比如说我今天说一个无人驾驶的车的场景和一个在机场的人脸识别场景,这个数据不一样,它所需要做的事情不一样,它的需求不一样,应用工程师更多的是要了解这些各种各样的内容。传统 AI 里面有一个很经典的问题。说是限制问题下面的一个说文,这种情况下需要了解在需求下面的各种需求,找到一个最优的方案,调参是里面的一个方法。然后其实更多的是要把端到端的整个都了解,所以调参侠是没有市场的,没有算法工程师这个角色,有算法的科研人员和应用工程师这两边都有很好的发展前景。

10.后续发展的预期

刚才聊了一些很有意思的东西,比如说工程、算法、同学,大家未来发展趋势是怎么样的。接下来进入第三个主题。

二位负责的技术线都有很多的 AI 落地场景,我们刚才最早就说了,非常关注的业务是业务的落地。现在想请二位分别介绍一下比如知乎,我们有很多推荐风控场景,我们现在的 AI 的发展情况是什么样的。有哪些技术的沉淀。还有一些应用情况,包括未来重点想投入的方向是什么样的。

包括想问一下扬清,很多同学关注。来到阿里之后,已经在阿里的大数据平台上,对 AI 做了哪些工作。

包括未来后续的一些发展。会有什么样的预期。希望二位可以分享一下。

1做创作者的匹配

大海说这个是一个典型的广告环节。这个广告,我觉得后面还有更硬的。就简单的说,我觉得现在在 AI 领域,我们做了非常多的工作。都是跟我们场景结合非常紧的,还有更多的工作需要做,所以我们需要招很多的优秀的应用工程师。一起来把 AI 领域的问题解决更好,抽象来说,现在其实是可以认为是三个大方向,一个是内容生产,怎么样用 AI 去让内容生产做的更好,我们的问题路由也好,去做一个创作者的匹配,包括怎么样激活创作者,这方面可以有很多的个工作。

在一个就是内容理解。内容理解帮助我们去建立一个内容的 profile。让我们知道内容是什么领域的,他有没有在某些方面是底限内容,比如他是不是带有辱骂性质的,是不是带有极端的仇恨情绪等等。对于内容理解的越准确,内容后续的下一个领域就是内容的分发。这个领域上做的工作就会做的越好,所以下个就是内容分发。内容分发不仅是对内容要有理解,他也需要对用户有理解,同时我们对产品的目标要有非常清晰的了解,所以这种情况下去做一个整体的算法跟产品结合的解决方案,同时像内容分发这种事情其实也是有主动跟被动之两种情况,主动的就是用户来搜索。怎么样能够在搜索引擎里面能够把 AI 算法应用的很好,让用户搜索的东西是最高效的。

我们在搜索系统里面,其实在去年,BERT 出来以后,很快把 BERT 用起来了,让我们整个点攒比。有个绝对值2%这么一个提升。在点攒比比较高的情况下,是一个非常显著的提升。这些是比较具体的例子。

2顶层应用上

在上面的一个顶层应用之上,它具体的技术会有推荐技术,会有自然语言处理的技术,还有就是像 CV 的技术,计算机视觉相关的各种各样的技术。再说未来,未来会除了在这些领域里面做更多深耕的之外,我们还会在其他领域做更多投资,因为知乎的优势是有非常多的高质量内容,我们需要高质量的内容能够得到更好的组织,让用户更好地挖掘知识这些有价值的高质量内容里面的金矿。

刚才一个同学其实他觉得知乎有很多文本方面的问答内容,他想让大海老师拓展讲一下在 NLP 上面的工作,比如说应用特点的工作。在 NLP 方面,首先第一个工作必须是分词,在分词这块我们做了很多事情,现在一直在迭代,现在我们分词最近刚做过一次。升级从他的 f1 的值从91%涨到93.5%。还是一个挺不错的增长。再一个就是词性的判断。NLP 这边还有其他的工作,比如说像命名识体识别这样的工作,这些包括在正文里面会看到命名识体会被编放搜索的框,直接可以搜索,这些都是 NER 工作的一个体现。其他的好像还有一些,但是一下子想不出来。

11.关于一些情感识别或是键盘侠说的一些反动言语

那先把它归类到不是单纯的自然语言处理,但自然语言处理的应用对于文本的理解,文本理解是我们在成都的一个算法团队主要在做的事情。我们的知乎作为一个社区,其实我们的社区治理,小管家团队大家可能又喜欢又讨厌,有深度管理团队。这个团队其实是算法跟人是结合的,所以有很多算法的工作在里面,包括我们的瓦力系统,这个系统有非常多的不同的文本分类的分类器在里面。包括政治敏感、色情识别等等,还有像极端言论相关分类器,有很多不同的分类器去看一个内容是不是处于底限的状态。

12.贾扬清加入阿里巴巴的看法

大海介绍很多知乎在 AI 方面的一些应用,扬清这边其实刚来阿里的时候,发现在知乎上有一个很热的话题,怎么看贾扬清加入阿里巴巴。

1关注内容

扬清来到阿里云已经来到一段时间,阿里是做 to B 的平台,有很多产品,比如 PAI 这样的平台。扬清过去一段时间,在 AI 平台上面做了哪些工作,包括未来重点是什么。这个也是大家比较关注的。

2思路

基本上首先的话,阿里在 AI 上面有非常多的团队在协作做一些事情,PAI 团队是在做 AI 的开发和治理的平台。很多基本上阿里的 AI 工程师都在上面做开发,一些同学就会在上面构建非常多的应用和落地算法,无论是像图片,语音等等这一系列,可能讲一下在 PAI 这一层,从开发平台和功能平台这上面的一个思路。

(3)第一个方向

基本上就是说三个应用的方向,以及底下大家看不见的技术实力的积累。三个方向是什么。

第一个是 AI 和大数据的结合,就是在传统的机器学习领域里面,怎么样能够让一个应用的工程师数据可以加更容易地把他以前的据分析,无论是离线的 ETL 还是在线的方法。和 AI 的算法结合起来,这一块传统有效的 PAI Studio 和 MaxCompute 以及其他的大数据底座打通的,这块在做第一个的事情是更加顺畅的用户体验

4第二个方向

第二个是更加丰富、更加成熟、更加高效的算法。比如我今天穿了一个 Flink 的衣服,Flink 是一个流计算的框架,在去年的时候,在 Flink 的基础上面开源的一个叫 Alink 的库,在 PAI Studio 里可以通过比较丰富的算法。来做 AI 和大数据的结合,这块很有意思的一点是,很多的公司需要有场景化的解决方案。最典型的是两个,一个是搜索推荐,另外一个是金融风控。这两个是一个强度需求。我们会沉淀一些场景化的解决方案,让大家能够更加容易应用起来,是平台的第一个 AI 跟大数据结合第二个是更加云原生和顺畅的 AI 的深度学习的体验,那么以前的时候很多的 AI 的,或是说从大数据讲出来的 AI 平台。他的结构比较重。

(5)举例

比如说大家用过 PAI 上面的,去年或者前年用过 PAI 上面 notebook 服务的时候,会发现我们是一个相对比较固定的环境,Python 的版本是什么,装的什么包是什么。今天把所有深度学习场景的底层平台知识变得更加云原生。在 notebook 服务上可以做开发,可以以完全一个 root 的方式来安装以及部署自己的 Runtime 的环境,同时他跟其他的一些比如像阿里云的 OSS 对象存储都可以无缝连接,使得可以利用云原生的容器化的能力,来构建一个和自己开发环境非常像的非常熟悉的一个环境出来。像无人驾驶等场景中可以实现非常灵活的深度学习的开发。灵活的深入学习的应用

6第三个方向

第三个的话是更加成熟的工程化的 AI 的算法的部署,无论刚才说到的 studio 里头的算法,还是 DSW 里面开发完的深度学习的算法,我们需要对他做上线,上线的时候第一看速度第二个是模型的稳定程度跟弹性。第三个是模型性能,第四个是如果有新的模型上线怎么样做,第五个是这些模型的应用反馈怎么做回流。在 PAI 上面有一个服务来做一个标准化的模型的输出。所以两块是训练相关的,AI 跟大数据的结合以及灵活的深度学习环境的构建,这个是 PAI Studio 等等。第三个是怎么样把模型做灵活的弹性上线,以及相应的工程这样的环境。

这是产品上的三个,其实在下面做的非常非常多的是看不见,但是很有用的一些工程能力,举个例子,刚才说系统利用率超低,这个在阿里里面,在任何一个公司里面,这都是一个控成本的问题。内部的一个要求是 AI 的平台每年的利用率要提升30%,做了很多比如说像资源的调度。在GPU 和 CPU 上怎么样做最优的编排和管理,在今年的 OSDI ,OSDI 是一个非常著名的系统,像大数据的老三篇都是在上面发表的。在 OSDI 上面有一篇文章讲怎样做这样易购的落地,另外一篇 OSDI 文章讲在推理的框架中怎么样通过自动的升入代码,这些在平台产品的下面,平时在产品的时候可能看不见,但能够很好的帮助平台能做降本增效。上面是产品,下面是一些系统工作。

7展望

扬清刚才对于他过去一段时间在阿里这边 AI 平台的工作做一些总结,包括上面的建模平台比如 PAI Studio、PAI DSW、PAI DLC等,包括下面一些框架层的降本增效的计算性能优化的工作。其实把过去自己的一些工作做一个总结,接下来有没有一些展望。就比如说阿里云这边会不会有一些框架的推出,或是有一些新的产品形态。

8产品

我觉得产品形态上会把现有的产品做的更加成熟,更加模块化,就是大家可以根据自己的需求,能够灵活地选择我们这些分子产品,能够组合起来的,比如说如果数据存在 oss 可以很容易的在上面拉起一个训练的框架。不需要非常重的,整个都拉过来,可以灵活的模块化组合。

9用户体验

另外把稳定性用户体验这块儿做的更好,说到升级框架的事情,这已经在非常非常多的场合都被问到这个事情,我个人的逻辑是这样的,就说是要从需求出发。今天为什么有 TensorFlow 和 PyTorch 这两个框架,其实非常非常清晰,TensorFlow 是在一个大规模的弹性的系统上面来灵活的构建高性能的 AI 应用的。

10TensorFlow PyTorch

那么一个需求。TensorFlow 整个系统做的非常非常精妙,分布式系统的那么多年的积累。所以刚才大海说到非常非常建议去看看 TensorFlow 的代码,这套做的非常好,TensorFlow 的弱点什么的,说起来其实是有点难。很多时候大家会说,我用 Python 做的很舒服,Python 作为数据科学家第一语言,原因是它容易,可以快速迭代,所以这时候出现了 PyTorch 后来发现 PyTorch 和 TensorFlow 在互相借鉴,PyTorch 增强自己的系统。TensorFlow 增强用户体验,所以从需求的角度上,这两个一定程度上解决了很好的用户体验的问题,所以做框架切忌说我做了一个新的框架,它和 TensorFlow 和 PyTorch 它们不一样,但是它做的事情反正都是 TensorFlow 和 PyTorch 做的事。

11软硬件协同

就说价值在其他地方,我觉得最重要的一个价值是怎么样对接更好的软硬件的协同设计,刚说到的大规模系统是一个,接下去看到非常非常多的芯片出来,有 CPU ,有 GPU ,苹果会出新的芯片,amd 会出新的芯片。阿里有平头哥的芯片。在这上面怎么做框架的对接。这变成一个非常现实的工程问题。不能每出一个新的硬件,就对接一次。这时候比如像 TBM ,像我们做的框架或像软硬件设计,这个是今天在框架或是系统级这上面的一个核心问题,就是我们要解的,那么在这个方向要重点的投入,在用户的角度可能看不出来,用的是前端的标准的模型,但是我们可以通过这些框架上的开发,能够给用户提供一个统一的体验。和下面更好的软硬件形容的设计。

12主持人总结

扬清其实对于他在未来包括是否要做一个深度学习框架给出了一个很好的解释,包括 AI 技术的发展有一些看法。今天准备的问题到这里。接下来进入到网友提问的环节。

13.大佬的生活

首先问的是一个非常好玩儿的问题,就是网友都很关心说像二位这样大佬,这样的大佬管理上百人的工程团队。你工作一天是怎么样的。你的感觉是怎么样的。可能是一些网友非常好奇的一点。大海作为知乎的 CTO 先介绍一下你工作的一天是怎么样的,有什么样的感受。

1李大海

从我的角度上讲,我在技术体系的工作会分为两种,第一种是建体制,怎么样从机制层面上,怎么样让大家的工作环境,让大家觉得工作更愉悦,工作起来目标很明确,知道并且要求很清楚,知道公司对于个人的要求是什么,知道每个人目标是什么,知道自己完成目标后有什么样的结果,这些都而且其实是非常重要的,这是我花很多精力会去思考的问题,这个问题解决的好不好直接会影响工程团队的组织能力,会影响工程团队的工作文化氛围,这个是我认为最重要的事情。

第二个就是重点的领域。因为在我们现在大概在几百人团队里工作,已经工作覆盖面已经非常广,可能需要去关注到面里面哪些领域是,首先他自己的重要程度怎么样,其次现状跟重要程度联系大不大,如果有比较大或者是非常重要,需要我亲自去关注的这些重点的领域会沉到非常下面去去跟我们一线同学,一线的 leader 们去讨论,去看这篇的问题。再一个就是作为全局的领导者,因为有大局,我有所有的信息,所以很多时候大家在局部上做的决策。因为他只有局部信息,他可能做的决策会有一些问题,这其实就是你信息的输入输出的限制所以我会去关注到这些点,然后去做一个全局的信息的拉通。去给他们一些这样的反馈,就是另外一个层面,大概就是这么几个层面。

14.一般几点下班

1李大海

我最近下班大概都是在10点,11点吧,我是我们公司下班下的比较晚的人。

(2)扬清

我觉得可能是如果把它总结起来,是四个方面的

第一个是做事儿,比如说怎么样建平台,怎么样做业务,这块儿涉及到怎么样跟阿里云的其他的团队,特别是前端销售团队以及客户来做对接与讨论他们的需求,把它翻译成我们平台上的设计与需求,这是一块儿,但一线写代码比较少,更多的是大家一起来做决策

第二个是人,因为有一个团队之后代码是冷冰冰的,而且是很干净的,我今天跑一个代码和明天跑一个代码是一样的。大家有不同的自己的喜怒哀乐的事情,这个在拉起一个组织的时候,有一个组织温度在的。怎么样来通过就是团队之间的沟通,团队之间的交流,来保证组织战斗力。

第三个涉及到人也在那,事也在那。怎么样建机制,需要用战役来拉动一个重点方向,PAI 的用户体验怎么样,拉一个战役,通过标准的战役的机制来安装用户需要的东西。

第四点就是自我学习,其实有时候做管理的时候挺心虚的,我相信我在任何一点上面都不比我的团队的人的知识更深。这时候一方面是感觉到ok,就是的确是这样的管理工作的事,就是让大家更有效的地做事情,另一方面不断的自己学习,用一下自己家的产品。前段时间用自己家的产品。所以这些就是组合的事情,人、机制和自我学习。

15.工作的状态感不感觉疲劳,或者是每天工作强度怎么样

(1)回答:

还行,我觉得还行。这块我倒是比较担心的一点,就是反而是我不知道大海有没有这样的感情,就是你在11:30之前下班之前,哎呦,老板还在这儿,我是不是不走。

并没有这种感觉。

2主持人调侃

这个应该不能问你们俩。因为我一直有这样的感觉。

3贾扬清看法

比如说我自己在约一个讨论会,我会尽量不约工作时间以后。比如说6:00以后,我觉得这个事情是工作时间以后大家上班,大家有自己的 passion 愿意做,我不能把这个事情做一个机制化,6:00以后我还得上班,我觉得就是说我还是会被约的,毕竟有的时候事情多。我会明确地说自己非常不好意思,今天因为大家的事情多。需要在8:00约一个会,大家讨论一个事情,但这不是一个常态,我希望大家一定程度上来看怎么样来提高自己的工作效率。

16.未来 AI 最有前途的方向

我看有人评论说大佬的工作的特点就是不会累,其实我跟两个聊完之后,是因为大佬做的事情都是自己感兴趣的。所以他并不会觉得是一个不愿意做的很累的事件事情。其实还是兴趣驱动。第二个问题是说有个同学可能大一是或者研一的问了一个问题,未来3~5年你觉得什么 AI 方向是最有前途的。你会怎么看。

1从纯研究角度讲

这个问题有点儿大,我还真不知道,因为就是几年前,可能就是每一个研究方向上可能还有很多研究方向可以突破,今天要是从纯研究的角度上讲怎么样来做智能化的决策这个领域做的挺好的了。

2感知层面

在感知这个层面的工作,可能未来3~5年。他的增量可能是有限的,你应该去其他领域去挖掘。可能给网友解决一下,感知就是 CV 这样的领域,我们目前觉得哪个具体的领域。

3新突破

未来3~5年应该会有比较大的发展,就结合像 GPT-3这样的工作,这种暴力美学,在未来少样本的学习这些领域。我希望他能得到一些突破,这对我们来说也很重要。

4最重要的是兴趣

这个我可能用另外一个稍微有点 sneaky 的方式来回答。今天咱们要接受这样的现实,就是科研会有一定时间的放平,没有那么多的发展,比如说像06年前后,基本上人工智能领域算法创新相对比较少的,我觉得这个对于一个人工智能感兴趣,同学就是说在这个阶段上做自己感兴趣的事情,这个是最重要的,当年的事我们做人工智能的时候也不知道出来能不能找到工作。

其实大家也不用太关心上五年后就业到底哪个方向比较火,都是自己感兴趣的,有需要的。

17.一统江湖的框架

然后还有一个同学问,其实也挺好的一个问题,就是说未来两位觉得 AI 的框架现在有很多,有 PyTorch,有 TensorFlow 好像现在占比差不多是55开。各位觉得未来会有一个框架,一统江湖吗。我们知友都会问一些比较尖锐的问题。

1举例说明

我觉得不太会,可口可乐和百事,苹果和安卓。Windows 和 mac 就说是我以前读过这样的经济学理论说永远会有两个。那么另外的一个是我觉得为什么不会呢,是因为我们的需求很宽,我们今天说经常有人会说什么样是最好的语言。我们可能说 python,数据科学家会说 python ,系统科学家会说 C++,因为这个需求很宽,我们是按需求来看。我觉得呢不会有一个一统江湖的框架,同时也不会有一成不变的框架。TensorFlow 跟 PyTorch 这两个最常用的。这种我觉得就是根据第一用户的需求,第二个是系统的设计上的迭代,肯定有新的一些框架出来,但最重要的是从需求出发。其实在解决一个问题时,在更加短小精悍的环境里,可以做更清晰、相关的事情。

2不会的理由

大海怎么看,平时在对团队会不会要求一定要有某个框架。

没有这个要求,我们是让自己内部的机器学平台,这个平台现在支持 TensorFlow1.x 也支持 PyTorch 。我们也准备把 TensorFlow2.0也跻身进去,我回答这个问题,跟扬清的答案是一样的,是不会。但我是这样考虑这个问题,就是我们去看,比如说微信它就只有一个。会只有一个东西的,但很多其他的产品它会有很多的并存,这里面的不同点在哪里呢。我理解主要是在网络效应,网络效应是不是足够强。像机器学习平台,它的网络效应是没有那么强的,它的需求的点有很多,不同的侧重点可以用不同的平台,或者不同平台的不同模块去实现它,从这个角度上讲。

所以我觉得至少这两个主流平台是会长期共存,未来也许还会在新的不同领域诞生一些新的需求,甚至还可能会产生一些新的小而美的平台出来。

其实这个跟很多知乎网友的观点一样。大家说可能在一些垂直领域会有一些新的平台产生,在目前来看,长期来看,起码 PyTorch、TensorFlow 这样框架会长期存在。

3广告

我特别同意大海这个观点。然后说到微信,强硬地插入广告,我们还有钉钉,让工作更轻松,让学习更简单。

4钉钉有机会的原因

我解释下微信它应该是在个人社交场景,他这个场景上网络效应非常非常强,但是工作跟学习,工作跟个人生活有时候是应该分开的。因为这个场景的不同,所以钉钉在里面有机会。用户需求很像。

18.方法推荐

然后再问最后一个问题,很多网友很感兴趣的是说两位平时有什么好的学习方法可以分享,包括说最近在看什么书,有什么好的书可以分享。这个比较开放的一个问题。

1渠道

学习方法,我觉得可能就是找到一些比较高质量的信息输入的渠道吧,比如说我可能会看比较新的技术的方向,包括讨论。所以我觉得就是找到比较好的渠道,其实知乎上面有很多比较好的渠道。

2公司的进化

然后最近在看什么书的话,说实话,最近看的书可能稍微比较少一些,因为这个领域的话,更多像 paper 、像讨论这方面的事情比较多,可能会看一些比较是从管理方面管理,锻炼管理能力的一些书,最近在看公司的进化。这是我们的阿里里面有各种各样的学习班,CTO 班在推荐这样的一本书,我们就在读,读完再讨论这本书,这样是怎么样的管理机制。

3大海的回答

我先回应一下这个问题,刚才不是网友说,知友说机器学习的这些用户,他们希望能够有个更好的产品形态,能让机器学习内容能够更好的消费。这个是接下来我们会在知乎产品里,未来会着重考虑怎么去能够满足大家的。请大家期待一下。

19.会有什么新的 feature 吗

这个具体的我还会在想,但是目标就是希望能让具体小的圈层用户,能够有产品存在满足这样的需求。比如我是机器学习的用户,我怎么样能够更高性价比的去消费机器学习相关的内容,能够在这边有一个社区的感觉,愉快的感觉。刚才我们在讨论的时候,我最近其实有很多关于学习的思考。我觉得人的大脑他本身就是一个天生设计来为学习去设计的一个机器。然后我们再结合对机器学习的理解,尤其是像有监督的学习

1BP

我们知道 BP,本身是机器学习里面特别重要的算法,机器学习的这套算法就要算法对人是很有启发的。BP 首先要定好整个机器学习的有监督学习的大的逻辑,首先要定好目标,比如说我们要学习,当然要想清楚学的是什么,我是要学习我把数学知识学好,还是我要学习好,怎么样让我更高效的学习,这就是一个二阶的学习,方法论的学习。你的目标不一样的时候,其实你的收获是不一样的,这是第一点。第二点就是为什么要讲 BP,BP 就是一定要知道我自己在哪里,我得知道我跟这个目标的差距是什么,差距在哪里,就是要知道现实,知道现实这个事情必须得非常地开放,能够听别人的反馈,别人说你哪里不好,哪里不足,哪些地方是优势,这是需要开放了去听,同时结合自己的思考。

2传导

然后第二个就是他得能够传导。后向传播,这件事情一定保证他可导,必须得传导。就是说知道不足之后,知道怎么样到达我的目标,怎么去改善自己,这是第二点。

3迭代学习率

第三点就是你自己学习里面要去迭代,迭代要设学习率。学习率在机器学习里面随便就可以设了,你是上帝。但在实际过程中自己能领悟多少,学习率能到多少,这是每个人都不一样的,我们能不能在学习过程中尽可能的举一反三,多动一动脑子,让学习率更高。再一个就是迭代是不是够快,其实这些从机器学习的理论里面,就能映射到现实的学习的机制里面。如果每一个环节我们都能够去优化,自己去学习的效果也会更好。当然讲的相对抽象一点,但是实际上每个人,都应该能够根据这个去找适合自己的学习方法。还有一点很重要的东西就是,学习这些事情,最终本质上是一个信息处理的过程,我们不断的处理,不断迭代,不断的去修正自己的方法论。所以信息处理的量,这个是一个基础,如果信息处理的量不够。

说的直白点,整天躺在床上想我怎么怎么学习、放空。这样肯定是不好的,所以学习本身是一个违返人性的事情,因为他需要消耗很大的能量,所以要想学习好,一定得吃苦。但是吃苦呢是讲我们要消耗很多能量,如果我们在这件事情上能够跟自己的兴趣绑定好,不管什么方法,能够跟自己的兴趣绑定好,能让大脑产生多巴胺的奖励回路。学习好了能够把它变成一个吃苦伴随着我的大脑的多巴胺奖励。这样结合到一起的话,事情会变得好些。

 

四、节目尾声

1.送给网友的话

其实跟两位聊的话,能学到非常多,哪怕是生物学的知识。比如还有多巴胺,今天诞生了很多名句,包括刚才网上大家也在讨论,我已经成为调参侠了怎么办。到了节目的尾声,请两位各自再送一段话或是送一句话。给网友可以是广告。两位可以讲一下。

2.欢迎投简历

我们知乎在下个星期开始就会正式开始校招环节。校招环节也是在整个网上去进行的。请大家关注相关的消息,在今年会招收相当多的应用工程师包括算法层面的,包括计算机体系架构等等层面的,还有客户端。所以,欢迎大家疯狂地投递简历给我们。

3.贾扬清的三件事

我很短地说三个事

1第一件事

第一个是我觉得 AI 是一个很有意思的事情,值得大家一起来投入

2第二件事

第二个是广告一下,AI 根源是一个强结合,所以欢迎大家上阿里云。

3第三件事

第三个的话说一个很有意思的事,我昨天在微信上发现我前团队的同学和现团队同学在一个知乎的话题上在讨论,所以我觉得像知乎这样的平台自己也很高兴,希望在这样的平台上还有更多的沟通交流,讨论迭代的碰撞出更多的火花。

3. 礼物和送别

(1)礼物

最后还有一句话就是,到节目的结尾,其实为大家准备了一些小礼品,我看到我们的网友非常的勇跃在留言和送花,包括提问。

2留言

大家如果有其他感兴趣的话题话,欢迎来到贾扬清的知乎号去留言。也会选取一些同学去送出我们的精美礼品,礼品包括我前方的公仔玩偶。包括扬清衣服广告身上的同款 T 恤,logo 是人工智能平台。

3再会

这些礼物会送给大家,今天就谢谢二位老师,然后谢谢各位知友的关注。下次再见。

相关实践学习
部署Stable Diffusion玩转AI绘画(GPU云服务器)
本实验通过在ECS上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。
相关文章
|
7月前
|
人工智能 JSON 前端开发
【Spring boot实战】Springboot+对话ai模型整体框架+高并发线程机制处理优化+提示词工程效果展示(按照框架自己修改可对接市面上百分之99的模型)
【Spring boot实战】Springboot+对话ai模型整体框架+高并发线程机制处理优化+提示词工程效果展示(按照框架自己修改可对接市面上百分之99的模型)
|
2月前
|
SQL 存储 人工智能
OceanBase CTO杨传辉谈AI时代下数据库技术的创新演进路径!
在「DATA+AI」见解论坛上,OceanBase CTO杨传辉先生分享了AI与数据库技术融合的最新进展。他探讨了AI如何助力数据库技术演进,并介绍了OceanBase一体化数据库的创新。OceanBase通过单机分布式一体化架构,实现了从小规模到大规模的无缝扩展,具备高可用性和高效的数据处理能力。此外,OceanBase还实现了交易处理、分析和AI的一体化,大幅提升了系统的灵活性和性能。杨传辉强调,OceanBase的目标是成为一套能满足80%工作负载需求的系统,推动AI技术在各行各业的广泛应用。关注我们,深入了解AI与大数据的未来!
|
3月前
|
存储 人工智能 数据处理
阿里云CTO周靖人:全面投入升级AI大基建
9月19日,在2024杭州云栖大会上,阿里云CTO周靖人表示,阿里云正在围绕AI时代,树立一个AI基础设施的新标准,全面升级从服务器到计算、存储、网络、数据处理、模型训练和推理平台的技术架构体系,让数据中心成为一台超级计算机,为每个AI和应用提供高性能、高效的算力服务。
3934 15
|
7月前
|
人工智能 搜索推荐 机器人
Rasa: 帮助企业更快搭建“AI对话助手”的低代码平台
【2月更文挑战第24天】Rasa: 帮助企业更快搭建“AI对话助手”的低代码平台
214 2
Rasa: 帮助企业更快搭建“AI对话助手”的低代码平台
|
7月前
|
人工智能 自然语言处理 算法
GPT-4o:重塑AI语音对话的边界与机遇
最近技术圈又出了新的“爆炸”新闻,因为OpenAI再次掀起技术浪潮,发布了最新旗舰模型GPT-4o,通过官方的消息显示这款全新的模型凭借超高速的语音响应能力和多模态交互革新,不仅让AI语音对话的交互体验更加流畅自然,还以免费使用的形式,给用户和行业带来了前所未有的震撼。那么GPT-4o相比前代有哪些显著的技术提升?它的发布又为国内大模型行业带来了哪些机会呢?本文就来简单聊一聊,欢迎大家在评论区留言交流。
128 2
GPT-4o:重塑AI语音对话的边界与机遇
|
6月前
|
人工智能 自然语言处理 搜索推荐
优化AI对话体验并全面兼容GPT功能平台
优化AI对话体验并全面兼容GPT功能平台
70 1
|
7月前
|
机器学习/深度学习 人工智能 自然语言处理
【AI】生成式AI,对话式AI,LLM,SLM 差异分析
【5月更文挑战第6天】生成式AI,对话式AI,LLM,SLM 学习
207 1
|
7月前
|
人工智能 安全 Linux
《龙蜥理事说》第二期对话统信软件 AI 让操作系统更智能
统信软件携手龙蜥生态提供更好操作系统服务。
|
7月前
|
人工智能 运维 自然语言处理
对话蚂蚁李建国:当前AI写代码相当于L2.5,实现L3后替代50%人类编程
超70%代码问题,单纯靠基座大模型是解决不了的;未来3-5年,人类50%编程工作可以被替代,有些环节甚至完全自动化。蚂蚁集团代码大模型CodeFuse负责人李建国说道。当下,AI代码生成领域正在野蛮式生长,巨头涌入,AI员工频频上线企业;首个AI程序员Devin被曝造假…… 面对风起云涌的代码生成变革,李建国给出了这样一个明确论断。
121 1
|
人工智能 自动驾驶 云栖大会
2023云栖大会 阿里云CTO周靖人,打造一朵AI时代最开放的云
2023云栖大会上,阿里云宣布了一项重磅计划:阿里云高校计划,助力高校科研与教育加速,让每位中国在校大学生真实受益于普惠算力。目前,清华大学、北京大学、浙江大学、上海交通大学、中国科学技术大学、华南理工大学等高校已首批达成合作。
89329 307