深度学习前瞻:吴恩达 + 百度 > 谷歌吗?

简介:

导读:百度是中国网民上网时的常用工具,它致力于成为影响全球的力量。作为世界上人工智能领域的顶尖研究员,吴恩达先生能否助其成功挑战硅谷最大的互联网公司?


百老汇音乐厅位于旧金山北海岸,是新古典主义建筑,已拥有95年历史,历经岁月磨蚀,四周环绕数不清的脱衣舞俱乐部。从Blondie(金发女郎)到Ramones(莱蒙斯),曾有许多朋克乐队在此演出。但今年六月某个明亮的早晨,一位完全不同类型的“摇滚明星”在此登场。一小撮参加科技创业会议的人群簇拥着一位身穿蓝色礼服衬衫和深蓝套装、个子高高、说话温和的人进入大厅,这位绅士还不时礼貌地停下来供人拍照。


他就是吴恩达,中国主流搜索引擎公司百度最新任命的首席科学家。他今天在此,是要谈论关于促进深度学习的计划,深度学习是松散模拟大脑工作方式的人工智能的一种强大的新方法。该技术已大大改善了计算机在识别语音、翻译语言及识别图像等方面的能力——吴恩达供职于谷歌和斯坦福大学时(曾担任学校的计算机科学教授),曾幕后主持了几项最重要的突破。谈话结束后,包括企业家、风险资本家和技术工作者在内的约200名听众两次对其报以热烈的掌声。


吴恩达所受到的热情接待很好地解释了为何百度会聘请38岁的他作为将公司转变成为全球力量的核心人物。百度五月份聘请吴恩达领导其研究团队,包括位于硅谷的一个人工智能实验室和北京的两个实验室,其中一个专注于深度学习,另一个则主要研究大规模数据分析。


百度经常被称作中国的谷歌,目前计划投入3亿美元,在接下来的5年内建设新实验室并在同层建立发展办公室。吴恩达打算到2015年年底在新实验室雇用70名人工智能研究员和计算机系统工程师。百度北京深度学习实验室主任余凯和吴是朋友,就是他力劝吴恩达加入百度的,余凯说“实验室确实以基础技术为目标”。


百度希望到2020年其一半收入来自海外,而它并不是唯一的寻找海外人才与客户的中国互联网公司;当前,中国互联网公司努力放眼国外,试图帮助世界上人口最多的国家摆脱世界工厂的形象。


中国目前拥有6.32亿网民,在一年前评选的全球前10位最常被访问的互联网公司中,中国占了4个。而在中国大陆地区以外交易所挂牌上市的前20位中国互联网公司的联合市场价值约达3400亿美元。中国网络社交平台老大腾讯公司所开发的微信移动信息服务,其中国以外的注册用户约1亿,几乎占总注册用户的一半。


今年9月,中国电商类公司阿里巴巴完成了世界上规模最大的首次公开募股,其在纽交所的首次登台使其价值达到1500亿美元。


放眼中国以外,百度及其他中国互联网公司发现自己正处在与老牌的美国互联网领先者之间发生冲突的道路上。谷歌、脸谱及亚马逊不可能立即或随时就面临西方市场的危机,但世界市场剩余空间仍旧很大,还有数以亿计的人无法上网。


就该方面,符绩勋(早年曾投资百度,目前是风险投资公司纪源资本的任事股东)说,百度等公司认为自身在这一剩余市场上颇具优势,因为它们有关于因特网新客户方面的经验,“中国企业已开始梦想的征程”,他说。


优秀之处


通常,人们首先注意到的是吴恩达的嗓音。他的声音格外柔和,几乎像是耳语,从其语音中可看出其生长轨迹:出生在伦敦,童年在香港和新加坡渡过。当他耐心地解释深度学习的细微差别时,听起来就像在给孩子讲睡前故事。


有时,在百度位于硅谷的仍旧很大、很空、占地15000平方英尺的实验室(森尼维尔市,位于谷歌总部西南,相距几分钟路程)内,他的声音在工程师们休息时打台球的球撞击声下几乎不可闻。但,一旦回到关于百度的工作时,吴恩达的声音可压过一切背景声音。


可能是因为这项任务十分巨大:即通过人工智能改变世界。吴恩达说,他会注重那些能给至少1亿人类的生活带来“重大影响”的项目。


他还特别指出,这不代表单单创造出符合青少年潮流、时尚的“亮丽型”应用服务。 “谁知道下一个时尚是什么,我甚至都无迹可寻——是像Snapchat(一款由斯坦福大学两位学生开发的“阅后即焚”照片分享应用)一样吗?”他鲜少地开玩笑道。“如果你构建出的某些硬技术正是百度之类的公司很想尝试构建的,你会有更为持久的坚实基础。”


吴恩达在人工智能领域的贡献曾改组一家主要的搜索公司。他最为外界称道的是被称为“谷歌大脑”的项目——他于2011年帮助设立秘密性Google X研究实验室。项目设计目的是测试深度学习潜能,即通过模拟性脑细胞网络来模拟新皮层内真正神经元的电活动及思想和观念坐标。这一软件可学习识别图片、声音及其他感官数据。在一项著名的实验中,研究者在虚拟神经元中构建10亿个连接,进而构造出一个“大脑”,分别通过16个处理器在1000台电脑上运行。


软件可通过处理1000万张来自YouTube视频的图片,来学习在无任何人类帮助下识别出猫、人类面孔及其他物体。实验结果证实,深度学习是开发机器学习软件的切实可行的办法。因此,谷歌投入大量资源用于该技术——将“谷歌大脑”迅速转变为产品,雇用技术领域专家并要求启动项目。


百度与许多中国网络公司一样,在寻求海外新客户时,与世界互联网领先企业(如谷歌、脸谱、亚马逊)之间冲突不断。


吴恩达将深度学习称为一种“超级力量”,他将在百度创建出新一代此类系统。最终服务项目仍处于意见讨论阶段,但吴会暗示具体服务内容。比如,他想创造出一种真正的、超越苹果Siri技术(iPhone 4S上的语音控制功能)智能个人数字助理。


展望未来,他希望这项技术能给机器人学带来改变(机器人学是吴恩达很爱谈论的话题,他的订婚照即在机器人实验室拍摄),并赋予自动驾驶汽车和无人驾驶飞行器更多功能。“我们要做的是很酷的事情”,他笑着说。


中国公司如果要竞争,就必须掌握这门技术:谷歌、脸谱、微软及其他网络巨头的实验室均雇用有大量深度学习专家,有时这些专家人才甚至在这些公司间互相流通。这方面,百度还有很多需要去做。


无论公平与否,众所周知的是,许多中国公司都在复制美国互联网领先企业的产品和商业模式,这一过程被愤世嫉俗者戏称为 C2C (Copy to China, “复制到中国”)。


多年来,百度在许多方面都模仿谷歌,从搜索主页到头戴式计算机,而“百度眼镜(Baidu Eye)”看起来与“谷歌眼镜(Google Glass)”相差无几。现在百度甚至开始自动驾驶汽车项目。就其最新聘任的这位“明星专家”来看,百度似乎再次开始紧跟谷歌的脚步。


但吴恩达坚持认为,以前对于中国网络公司C2C模型的定义不再准确,特别在他的新雇主上来看。

他开玩笑说,“我曾经为美国的百度工作(指百度某些方面已赶上谷歌,与美国的本土巨头不相上下)”。然后,他拿起手机,用英语说“Please call a taxi for me(请为我叫辆出租车)”。片刻后,百度的翻译应用软件用汉语普通话说出了完全一样的句子,且屏幕上显示等效的表意文字。这看起来很老套,但却优于谷歌的翻译应用软件,那么,究竟谁在模仿谁?不清楚。


吴恩达的工作是,开发尖端技术,而谁在这一领域领先则无法定论。


走出国门,迈向世界


百度硅谷实验室目前由亚当·考特斯(Adam Coates)领导,考特斯现年32岁,他进入人工智能领域可以说是误打误撞。2002年,考特斯在斯坦福大学计算机科学系就读,曾与吴恩达交谈;吴恩达当时提到他正在做一项关于遥控直升飞机的项目,而考特斯在加利福尼亚读高中时曾做过并玩过遥控直升机。从那以后,考特斯和吴恩达开始一起做研究,撰写用在无人驾驶直升机、家用机器人和图片识别等方面的机器学习的文章。吴恩达离开斯坦福大学任职百度时,考特斯还是他实验室的博士后研究院,他跟随吴恩达一起到了百度。那时起,他开始认识到机器学习在几乎所有方面都很关键。“无论你是否对语言或直升机等感兴趣,”他说,“你都可以通过机器学习来解决任何问题。”


吴恩达和考特斯想要通过新实验室实现一个关键目标:创造一种可以真正意义上自主学习的软件。


直到最近,他们才在语音和图片识别方面取得了多项进展,即通过训练软件识别先前已标好分类的数据来实现软件的识别能力。例如,教会软件成功找出猫,则需要首先有一个包含数千张带有人类所识别的猫的图片数据库。这一方法称作监督式学习,不需要是人工智能专家也能看到出该方法的主要缺点。人类儿童无需先看5万张图片,就能认出猫咪。


“我们在各个领域转悠,观察事物如何运作”,考特斯说,“让人感到希望的是,我们能找到以同样方式学习的算法。”可能深度学习系统仍需要先看许多猫咪图片才能自主识别出猫咪,但与其他同类软件相比它确实更有用,因为其所需人类帮助最少。


能够识别人类生活中各种图片、文本和声音的智能软件,可通过这些信息代表人类做出决策——并改变人类与技术的关系,考特斯说。例如,软件可分析你的度假照片并识别每张照片上的人物,进而得出他们在干什么并识别各类标志。你可以找出一张旧照片并让软件找出“妈妈在海滩上的照片”,或者也可以用手机抓拍一张衬衫照片并让软件找出其他类似的照片。你可以信任软件,无需查看色彩像素配置,软件会自动了解衣服类型、织物及你的个人喜好。


吴恩达设想手机能像人类一样识别语音,所以,最终人类可实现口授文本信息的愿望,即使在嘈杂的汽车上也可以。他希望能创造出一款电子邮件应用,即学习人类与朋友、同事等之间的交流,进而代表人类回复某些简单信息。余凯说,吴恩达和考特斯还有机会继续他们在机器人学领域的研究。“除网络空间外,我们同样对物理空间很感兴趣。”他说。


但百度硅谷实验室首先要做的是,简化深度学习软件的测试(需要花费大量计算能力)。训练一项新的语音识别模型需要一周或更多时间,吴恩达计划将其削减到一半。去年,考特斯带领一个斯坦福团队完成一项突破,使这一目标成为现实。


他们使用Nvidia的图形处理系统构建了一个与“谷歌大脑”系统大致匹配的神经网络,成本却是“谷歌大脑”的1/50,仅2万美元。该网络可帮助百度以相对低的成本获得强大的深度学习基础结构运行,这与百度目前在北京的工作十分相符——使用一些简单的图形处理系统来训练深度学习系统图片和语音识别的能力。


神秘气息


在百度位于北京海淀区科技走廊上的总部内四处游走时,你会感觉自己被瞬时移动到了传说中谷歌位于加利福尼亚山景城的总部。免费自助餐厅?有。现场健身房?有。睡眠舱?有。牛仔裤和短裤、T恤衫、平底人字拖?都有。


百度北京总部,一位员工经过“太空舱”,员工可在这里休息


唯一打破幻象的是刻在大厅天花板上的巨大的百度熊爪型标识。这一切看起来都加深了吴恩达和其他人试图打破的人们对于中国互联网企业的C2C的形象认识。而余凯则十分高兴地宣称,百度与美国互联网巨头之间的相似不仅仅表现在外在,百度同样支持扁平化管理、小团队及快速产品周期,他还兴奋地补充到,还有酷炫的技术。


“百度和硅谷互联网公司间区别不大”,余凯说,而余凯曾在库比蒂诺的NEC美国实验室工作六年,距离苹果总部仅两公里。


但深入百度的历史,你会发现它自身根源颇具硅谷特征。


其CEO李彦宏曾在位于森尼维尔市的搜索引擎公司Infoseek担任工程师,之后与生物科技销售员徐勇于2000年一起创办了百度。李彦宏于1997年申请了一项专利,即根据导入链接数目来进行网站搜索排名。随后一年,谷歌共同创始人谢尔盖·布林和拉里·佩奇才以类似的PageRank算法申请了专利。


随着中国互联网用户的不断增加,使用百度的人数也不断增长,这使得百度有足够的能力吸引到来自谷歌的一笔5百万美元投资(2004年),而谷歌后来试图以16亿美元的价格购买百度,以此来阻止中国公司首次公开募股(IPO)——据《彭博商业周刊》报道。但百度于2005年正式公开发售股票,首日股票价格即飙升至354%。


正如谷歌在美国所做一样,百度同样采取系列动作,迅速奠定了其在中国搜索市场的主导地位,同时利用所得利润扩展到其他在线服务范围。


中国互联网大亨



中国前三位互联网企业的名字首字母缩写为BAT(指百度、阿里巴巴、腾讯),目前三家企业都已开始向海外扩展。


百度甚至打败了谷歌,尽管有观察人士认为中国政府对其提供了援助—阻止在境内使用多项谷歌服务。百度早起投资者符绩勋说,中国公司在不断投资新创意。“与腾讯和阿里巴巴相比,百度十分重视基础技术,”他说。


但这并不表示百度产品都具备独特性:其许多产品与谷歌类似,包括地图、浏览器和云储存。因此,聘任吴恩达看起来也可能是又一“复制”性举措。但无论如何,百度已在深度学习研究方面进行了大量投资,而其目前所得结果已足以匹敌甚至超过谷歌。


例如,“百度翻译”应用可以在数秒内识别图片内的物体,并给出其书面及口语英语名称。其移动搜索应用可了解手机抓拍图片上的内容,并找出相似的图片。该应用软件并非简单地能进行色彩和模式匹配,它还知道更多,例如照片上显示的是教堂还是一支足球队。


余凯曾在多次会议上宣称,这一特征足可与谷歌的同类产品相媲美。会议上放映的幻灯片显示,百度能找出数张头戴蝴蝶结的狗的类似照片,而谷歌返回的结果大多是衣不蔽体的女人的照片。


撇开二者在择优挑选方面的相比较来看,这项技术已为百度带来大量红利。2012年11月,距余凯在北京开设实验室仅四个月后,百度开始将深度学习技术用于语音搜索,语音识别错误量下降了四分之一。类似地,其光学字符识别错误降低了几乎三分之一。该技术使得百度翻译应用软件在解码方面(如餐馆菜单)效率更高,负责百度机器翻译得副总裁王海峰说。


余凯所带领的神经网络甚至刺激提高了百度的底线。该网络是一个系统,能了解一个广告的哪些特质更能吸引人点击,进而选择满足这些特质要求的广告并在最恰当的时刻予以运行。这样,百度要价更高。李彦宏在四月份告诉投资者,该技术已帮助提高了公司第一季度的利润和收入。


同样和谷歌相似的是,百度也不断面临来自小型新秀企业和老牌竞争对手的挑战。公司最担心的问题是,其在搜索领域的主导地位去年开始下滑。据彭博资讯公司数据,百度在中国台式计算机方面的搜索份额已从80%降到75%。移动软件公司奇虎360于2012年启动的最新搜索引擎So.com一年前的台式计算机搜索份额仅为10%,目前则已上升到16%。


近年来,互联网向移动设备的迅速转换是许多老牌美国互联网公司颇为头痛的问题,但这一变化在中国则显得极为戏剧化。在中国,许多人首次涉足网络生活是通过智能手机,而非计算机。目前中国使用移动设备上网的人数约83%,这让百度陷入了窘境。


去年,百度迅速展开行动来扭转困境——与运营商合作派发移动应用产品;以19亿美元的价格收购中国应用程序分销商“91无线”,并重新设计其各项服务和广告形式,以更好地适合手机应用。这些举措将百度移动搜索应用的平均日使用人数从当时六个月前的1.3亿提高到第一季度的1.6亿元。但百度仍必须不断地与本土移动公司和应用作战,才能保持其稳固地位。


而吴恩达和他的研究团队在技术领域的突破可能帮助百度解决上述问题。传统计算机向智能手机和其他移动设备的彻底转型带来感知数据的爆炸,如图片、视频和声音;这类数据,传统软件无法轻易处理, 吴恩达所研发的深度学习技术却可以理解。其团队成员认为,通过这项理解世界的技术应用服务,他们可以超越其他移动领域的竞争者。


“正如工业革命将许多人从身体劳苦中解放出来一样,我认为人工智能(AI)有可能使人类免受许多精神劳役。”


深度学习技术还会帮助百度争取到全球50亿尚未接触过网络、对发达国家20年前即拥有的计算机技术还不熟悉的部分客户人群。这些人会优先使用移动设备(很可能根本排除其他事物),而深度学习技术能提供各种对计算机入门者来说极具吸引力的直观界面。吴恩达说,互联网使用初学者——正如我们当初一样——通常不想学习新的交流模式,他们更喜欢通过自然地与移动设备对话来获得想要的信息或翻译。


同时,深度学习技术还可帮助百度裁剪、调整搜索结果和应用,使其与不同语言和地区的相符性更佳。这一点一直是百度不断努力想要实现的,而这限制了其先前向海外扩展的步伐。百度2008年曾进军日本市场,最终无疾而终,原因是其搜索引擎无法满足当地需求。目前为止,百度主要关注少数欠发达地区,如:东南亚、中东、北非和拉丁美洲。今年六月中旬,公司正式推出了面向巴西的搜索引擎。


对百度来说,要想成为技术领先者,增强全球化十分关键。中国以外的许多人,特别是西方人,对百度知之甚少,或者根本没听说过。去年六月,国际机器学习大会(著名的人工智能专家年度集会)首次在北京召开,百度为此举办了一场鸡尾酒会,会上明显看出百度在外国人眼中仍戴有一层神秘面纱。


当时,来自谷歌、微软、脸谱及著名大学的多位研究人员、专家(有些饱受时差反应的困扰)聚集在21层高的北京盘古七星酒店的顶层“幸福大厅”,共同观赏鸟巢体育场和奥林匹克公园。有些人说,他们几年前才听说百度,直到吴恩达加入后才开始予以密切关注。


对百度来说,缺乏外国人的关注是一个较大的问题。其内视性文化和中国技术领域众所周知的非独创性限制了公司与谷歌及其他美国科技领导者的竞争能力。


对美国科技领先的企业来说,其职工多来自世界各地。而百度先前尝试改变上述文化的努力遭遇失败。刘勇(Liu Yong),曾在百度硅谷分部担任开放创新与伙伴关系部主管,于今年1月份离职;他说,他很惊讶公司以中国为中心的文化。他曾加入百度于2013年开设的硅谷实验室,发现所有高级工程师和研究科学家(共30人左右)都是中国人。


“硅谷研发实验室的目的是吸引最优人才,但不是只要来自一个少数民族的最优人才,”他说。百度领导者们也承认这一点。“我们正努力将公司变得更具世界性,”百度国际交流主管郭怡广说。


为重启实验室,刘曾加入百度,现在又聘任吴恩达和考特斯,并扩大实验室规模和范围。他们希望能将百度的研究群体变得更为多样化,并最终使之成为百度的最优部分。对不断被与谷歌相比较感到十分愤怒的高管来说,他们正积极尝试在全球范围内不断与硅谷的实质象征相靠近。


文化转变


回到硅谷实验室来说,吴恩达正努力适应其作为文化催化剂和技术领导者的双层角色。他曾经十分厌烦总是谈论他认为“空洞无内容”的组织文化的人。现在,他却无法不正视这个话题。


他最近最喜欢的书是埃里克·莱斯的《精益创业》,这让他多少有点尴尬;这本书是一本面向企业家的管理手册。他还拜访了连续创业家和创业大师杰瑞·卡普兰,卡普兰说,吴恩达曾“拷问”他关于雇用工程师并召集其共同完成一项任务的意见,他还召开员工会议讨论雇用问题和实验室文化。


“随着年龄的增长,我现在十分看重文化及针对文化进行思考的重要性,”吴恩达说。


吴恩达所受教育的全球性使得他能很好地成立多样化较强的研究组, Sebastian Thrun说(Sebastian Thrun是斯坦福的研究教授且在谷歌任职,是他设立并开始了谷歌的无人驾驶汽车项目)。吴恩达并未隐藏他是百度的关键人才吸引力这一事实。


现在他已经吸引了一位十分独特的人物——Bryan Catanzaro。Catanzaro是一位图形芯片架构师,Nvidia前研究科学家;他曾就读于加州大学伯克利分校,是硅谷技术专家,本可以到硅谷、脸谱或热门新兴企业内就职。


吴恩达说他的目标还包括将百度研究团队变得“更能多孔渗透一点”,能和其他研究者及软件开发群体交流意见,像其美国对手公司一样,能融入硅谷群体。“现在有机会创造一种对研究和改变世界十分有益的文化,”吴恩达说。


如果吴恩达的计划得以实现,世界将确实在某些方面发生变化。百度会证明,中国互联网公司除了仿效美国外也能做得更多。某些人类目前必须自己解决的问题可能会由具备领悟能力的计算机接手,从而解放人类思想,使其进行更具创造性的活动。


“正如工业革命将许多人从体力劳苦中解放出来一样,我认为人工智能也能使人类免除大量精神劳役,”吴恩达说。这一目标似乎只有谷歌才能实现,但为了圆满完成,百度必须自己规划路途,这一点毋庸置疑。


原文发布时间为:2014-10-09

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关文章
|
机器学习/深度学习 并行计算 PyTorch
利用谷歌colab跑github代码AttnGAN详细步骤 深度学习实验(colab+pytorch+jupyter+github+AttnGAN)
Google Colab,全名Colaboratory,是由谷歌提供的免费的云平台,可以使用pytorch、keras、tensorflow等框架进行深度学习。其GPU为Tesla T4 GPU,有很强的算力,对于刚入门机器学习或深度学习的用户,这个平台是不二之选。
利用谷歌colab跑github代码AttnGAN详细步骤 深度学习实验(colab+pytorch+jupyter+github+AttnGAN)
|
1月前
|
机器学习/深度学习 数据采集 数据可视化
TensorFlow,一款由谷歌开发的开源深度学习框架,详细讲解了使用 TensorFlow 构建深度学习模型的步骤
本文介绍了 TensorFlow,一款由谷歌开发的开源深度学习框架,详细讲解了使用 TensorFlow 构建深度学习模型的步骤,包括数据准备、模型定义、损失函数与优化器选择、模型训练与评估、模型保存与部署,并展示了构建全连接神经网络的具体示例。此外,还探讨了 TensorFlow 的高级特性,如自动微分、模型可视化和分布式训练,以及其在未来的发展前景。
90 5
|
机器学习/深度学习 自然语言处理 算法
深度学习工程师-吴恩达课程汇总
深度学习工程师-吴恩达课程汇总
227 0
|
机器学习/深度学习 存储 人工智能
如何提升深度学习算法效率,谷歌有这些绝招
如何提升深度学习算法效率,谷歌有这些绝招
127 0
|
机器学习/深度学习 人工智能 TensorFlow
谷歌大脑深度学习调参(炼丹)指南出炉,Hinton点赞,一天收获1500星
谷歌大脑深度学习调参(炼丹)指南出炉,Hinton点赞,一天收获1500星
202 0
|
机器学习/深度学习 存储 算法
如何提升深度学习算法效率,谷歌有这些绝招(下)
如何提升深度学习算法效率,谷歌有这些绝招(下)
|
机器学习/深度学习 存储 人工智能
如何提升深度学习算法效率,谷歌有这些绝招(上)
如何提升深度学习算法效率,谷歌有这些绝招
|
机器学习/深度学习 自然语言处理 网络架构
7 Papers & Radios | 谷歌大牛Jeff Dean撰文深度学习的黄金十年;扩散模型生成视频(2)
7 Papers & Radios | 谷歌大牛Jeff Dean撰文深度学习的黄金十年;扩散模型生成视频
173 0
|
机器学习/深度学习 人工智能 编解码
7 Papers & Radios | 谷歌大牛Jeff Dean撰文深度学习的黄金十年;扩散模型生成视频(1)
7 Papers & Radios | 谷歌大牛Jeff Dean撰文深度学习的黄金十年;扩散模型生成视频
134 0
|
机器学习/深度学习 人工智能 算法
谷歌大牛Jeff Dean单一作者撰文:深度学习研究的黄金十年
谷歌大牛Jeff Dean单一作者撰文:深度学习研究的黄金十年
147 0