AIR 033 | 专访微软亚洲研究院主管研究员郑宇:我更愿意把自己定位为一个创新者

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

郑宇是本次CCF-GAIR大会的程序委员会主席,还是人工智能国际顶级期刊TIST的主编。目前的郑宇专注于城市计算的研究和落地。这项技术通过对城市中海量的交通、空气质量、经济状况的巧妙运用,可以帮人们极大的改善城市生活的质量。

在采访中,郑宇表示自己并不希望简单的被打上一个“创业者”或者“学者”的标签。对于城市计算这个领域,他显然有更大的追求和期望。

在GAIR大会紧张日程的间隙,雷锋网对郑宇进行了一次专访。这让我们对郑宇专注的技术、他的观点和对未来的期望有了一个全面的了解。

【关于城市计算】

雷锋网:您是如何进入您现在的研究领域:城市计算与大数据的呢?

郑宇:最开始的时候,有两个原因:我有段时间被堵车弄的很郁闷,而我是学计算机的,我那时候就在想,能不能利用自己的专业知识帮这个城市做出一些改变?那样不仅对大家都好,自己开起车来也会方便一点的。当时我就在想,能不能通过一些数据的优化来改进一下交通?然后刚好,那段时间我们拿到了一批北京出租车的GPS轨迹,然后我们就开始试着拿它们来改善城市的交通规划。慢慢的随着我们掌握的这类数据越来越多,就开始涉及到环保、人员、交通等等。

雷锋网:您觉得这种技术到最后能给人的日常生活带来哪些实质性的提升?

郑宇:很多的,我们说几个其中的重要领域吧:环境大家很容易想到,用大数据来预测雾霾,预测空气质量,来帮助政府做决策:明天要不要限流?该不该建议人们减少室外活动?要不要提醒大家关好门窗?以及这些污染物到底是从哪边飘过来的?

还有就是交通,你如何让指引车辆的路线,才能让大家开车更快更顺?怎样去提前预测人流会在哪个地方变得拥挤,避免踩踏?合理规划公交的线路,规划每个公交、地铁站台的位置。这些都是很显而易见的方面。

雷锋网:您觉得在您观察和研究了这么多项目之后,您觉得一个项目要满足哪些条件才能说它是一个值得研究的项目?

郑宇:我觉得有两个方面,其实以前MIT对这个问题就有一个标准,最重要的一项是:“你可以把这个项目讲给你的奶奶听。”因为如果你奶奶都对这个项目有兴趣的话,那无疑说明这是一个社会热点问题,就是说几乎所有人都会对它感兴趣。而这么多人关注也就意味着它的影响力会很大。

第二我们需要衡量它有没有研究价值。有些东西虽然很重要,但同时做起来也相当简单,很容易就能解决。就比如说用餐具吃饭,这是一个相当重要的习惯,对应的也是相当重要的事,可是它很简单,做个筷子什么的,谁都能做。可以说不需要你来做,在我的角度来说,就是完全不需要人工智能啊大数据啊也能做到。主要就是这两个考虑。

雷锋网:您主页写的这几个研究兴趣:big data analytics, spatio-temporal data mining, artificial intelligence, and ubiquitous computing,这些是比较独立的研究项目还是都是服务于您的主要研究项目:城市计算?

郑宇:都是同城市计算相关的。

雷锋网:可以解释一下它们是如何关联起来的吗?

郑宇:其实这个很难讲得那么清楚,大数据和人工智能都是很广泛的概念,而其中有很多交集但又不尽相同。可以这么说:机器学习是人工智能的一个分支,机器学习下面也有很多实现的方法。而机器学习它可以是用作数据挖掘的一个方法,虽然数据挖掘不一定要依靠机器学习来实现。而大数据是一个整体的端到端的服务。这些子项目都是为了服务于这个整体的需求而存在的。

雷锋网:城市计算的研究成果需要按照结果重新设计城市,还是只需要对现有的状况进行一定的调节即可?

郑宇:调节就可以了。模型设定好之后,剩下的就是一些参数的调节而已,而且这些模型不仅可以应用于当前的城市,还可以很方便的调节并应用到新的城市上。

雷锋网(公众号:雷锋网):可以举一些例子来说明吗?

郑宇:可以举两个例子:一个是在北京的空气质量分析。这个是我们集合了交通流量数据、气象数据、地理信息数据来预测未来48小时的空气质量变化。这个方法最开始是在北京落地成功,然后我们很快的把它推广到了全国的70多个城市。现在这个技术被环保部采用了。第二是在贵阳的一个大数据项目。我们用了一部分出租车的GPS轨迹作为输入,把整个城市每一条街道的行车速度、流量和尾气排放全都算出来了。

【从学术到产业】

雷锋网:现在这个项目整个的落地您觉得处在一个什么阶段?

郑宇:基本上已经落地了,空气质量预测这边我们一期已经做完了,在准备做二期。一期做了70个城市的空气质量分析和预测,二期我们要做300个城市。在贵阳我们的一期也基本上结束了。建了一个贵阳的城市大数据平台,把这些数据都管理了起来。

雷锋网:除了空气质量和行车数据,未来你们还打算收集一些什么数据呢?

郑宇:其实这些数据并不需要我们主动安装什么设备去收集,现有的设备已经足够收集到它们,它们本来就在那里了,我们只是拿来用。将来我们会应用到规划的、环保的、能耗的、经济的、教育的,这些方面的数据的分析应用。我们现在在做一个动态拼车服务,其实这也是一个可以增大运量,减少拥堵的方法。关于能耗的方面,我们现在在做汽车流量分析。经济的话我们目前在做的是房产的价值估计。

雷锋网:为什么您会选择微软研究院作为您展开研究的地方呢?

郑宇:微软研究院的好处,第一是它可以连接国际和国内,它既有国际视野,也可以和国内的市场结合的很紧密。第二是它可以横跨工业界和学术圈。微软研究院具备将技术部署到市场,进行产业化的能力。所以这是一个很好的机会。另外在微软里还是有很多优秀的人才,在一个环境里我觉得其实人是最重要的。如果你周围的人都很聪明的话,你会得到很多帮助。

雷锋网:相比之下,同样以学术为主的中科院同微软研究院相比,您觉得哪个更适合您呢?

郑宇:我可能觉得还是微软会更合适一点。因为相对来说中科院还是以研究探索为主,而不是以产业布局为主。在需要很多工程力量的时候,中科院不一定是最适合来做的。另外还涉及到市场。比如说你不可能什么事情都自己一个人做的,我们事情做到一定程度的时候就需要和政府打交道,需要我们的研发、销售、市场和政府一起互动。这个时候我们就需要专门的人来做专门的事情,我们这些人来做好研发,而让我们那些负责市场的朋友去和政府进行交流和洽谈价格。

【学术、研究、自己】

雷锋网:您觉得中国目前的学术氛围同国外相比如何?

郑宇:中国目前的学术氛围已经进步很多了。中国的科研经费其实比国外的教授更加充裕,关键是中国的数据很多,拿数据比国外容易得多。而且中国的学生其实本身并不比国外差。其实很多国外的优秀的学生也是中国过去的。所以中国现在环境变好了,人留下来了,数据有了,钱也有了,老师的水平也提高很多。可以说条件已经有了很大的提升,我觉得现在对中国来说是个很好的机遇。

雷锋网:那是否仍然存在一些差距?

郑宇:我觉得差距主要其实还是在学校的师资力量,虽然说高校教师的水平提高了很多,但同国外的顶尖水准相比还是存在差距,以及一些高校的政策环境的问题。

国外的政策,财务制度会比较自由一点。就是它的一些项目允许给参与项目的人一些报酬。但中国的有些制度可能会规定不允许你给参与的人员发放报酬。有时真正参与的人可能拿不到经济方面的回报,包括老师。而经费只允许投入在购买设备上。其实这不算什么特别大的问题,但在某种程度上,可能会降低一些积极性。

雷锋网:您把自己更多的定位成一个学者还是想要向产业界挺进的人?

郑宇:我更愿意把自己定位成一个“创新者”,作为一个创新者需要几个方面的技能:第一你需要有扎实的学术基础知识。技术功底肯定要有。第二,你真的要完成你的创新的话,你必须要真正的把你的产品部署出去。不能说只发一篇论文或者怎么样就完了。如果你写的东西没人看,那也不叫创新。这时候你就需要实践能力。第三你作为一个创新者去推广你的创新的时候,你实际上是一个销售人员,你需要跟别人去沟通和协作。所以这是一个综合能力的体现。我更多的希望我是个有综合能力的人,而不是说我就是一个做机器学习领域的专家这样而已。

雷锋网:那作为一个创新者,您对自己有怎样的要求和期望?

郑宇:我最大的希望和目标就是把城市计算这个领域彻底奠定起来,打好基础。现在这个领域其实已经做得比较不错了,比较欣欣向荣。国外甚至已经有城市计算的专业方向了。现在我在写一本叫“城市计算”的书,是全球关于这个领域的第一本书。这本书将会作为高校的教材,所以我是希望通过这些能把这个领域建立起来,让更多的人能在其中做自己想做的事情。


本文作者:黄鑫


本文转自雷锋网禁止二次转载,原文链接

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
机器学习/深度学习 人工智能 机器人
DeepMind关闭首个海外实验室:设立仅五年,曾由Richard Sutton领导
DeepMind关闭首个海外实验室:设立仅五年,曾由Richard Sutton领导
106 0
|
机器学习/深度学习 人工智能 自然语言处理
前微软亚洲研究院资深研究员梅涛博士加盟京东,担纲计算机视觉与多媒体研发
计算机视觉和多媒体领域的杰出科学家梅涛博士日前正式加入京东,出任京东集团 AI 平台与研究部 AI 研究院副院长,并担任计算机视觉与多媒体实验室主任。
714 0
前微软亚洲研究院资深研究员梅涛博士加盟京东,担纲计算机视觉与多媒体研发
|
机器学习/深度学习 人工智能 机器人
腾讯成立机器人实验室Robotics X,与Nature宣布长期合作
3 月 15 日,腾讯 AI Lab 第二届学术论坛在深圳举行,在上午的论坛开幕活动中,腾讯揭晓了两个重磅消息:成立机器人实验室 Robotic X;腾讯 AI Lab 与自然科研达成战略合作。
856 0
腾讯成立机器人实验室Robotics X,与Nature宣布长期合作
华为全球分析师大会开幕,公布40个5G商用合同成果,推出Tech4All计划,华为称已进入无人区
为了解决无人区的焦虑,华为表示要走心创新2.0,重视光计算、NAD存储、原子制造等基础科学。
507 0
「镁客早报」NASA成立寻找外星人研究小组;CBInsights公布全球32家AI独角兽名单
Intel收购印度创业团队,加强独立显卡开发;IBM将在巴西建立AI研究中心,旨在开展“颠覆性研究项目”。
559 0
华为加拿大高级副总裁离职,曾在华为工作7年
布拉德利将会担任华为的特别顾问,根据公司的要求提供一些帮助。
413 0
著名SaaS研究员许卫国:我看XTools上央视
本文讲的是著名SaaS研究员许卫国:我看XTools上央视,SaaS在中国整体呈现的是“叫好不叫座”的局面。甚至有些人已经开始发出“做SaaS是找死,不做SaaS是等死”的声音。从2007年开始,进入SaaS领域的厂商前仆后继,无论是传统的向SaaS转型,还是新公司的进入,一年时间中国的管理型SaaS公司数量翻了一番。
1368 0
下一篇
无影云桌面