滴滴大脑聪明程度远超 AlphaGo,叶杰平解密滴滴 AI 路径规划

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

“互联网时代的上半场结束了,下半场的角逐一定是在人工智能上。”滴滴出行CEO程维对此坚信不疑。


在有中国“AI 春节”之称的新智元2017开源·生态 AI 技术峰会上,滴滴出行研究院副院长叶杰平出面,给大家做了一场关于使用人工智能技术解决出行难题的演讲。



滴滴大脑:大数据、机器学习和云计算

 

叶杰平将滴滴大脑这个智能系统分为三部分,分别是大数据、机器学习和云计算。


 

云计算提供强大、灵活的计算能力,滴滴的业务场景对计算要求和实时性都非常高,用户输入一个目的地,最佳合理调度都由滴滴大脑以毫秒级的速度来计算,例如通过滴滴云计算搭建了大规模实时分单处理平台,可以实现多维度最佳订单匹配。

 

机器学习是人工智能的核心,一套系统通过机器自我学习的方式来实现人工智能,算法则是机器学习的关键要素。滴滴搭建的核心算法模型,可以帮助实现更准确的预测能力、智能的调配能力,提高效率降低成本,达到最优运力调度。滴滴出行研究院解决的技术难题,包括供需预测、路径规划、智能派单等都离不开算法,此外在提高用户乘车体验上,也引入了人工智能,比如服务分和机器判责等功能背后都是通过复杂的机器学习算法技术来实现。


实际上,早在2015年5月,滴滴就正式成立了机器学习研究院,率先将机器学习大规模应用在出行领域。去年4月,滴滴机器学习研究院又升级为滴滴出行研究院, 试图通过机器学习理论和方法,最大化利用交通运力,缓解城市拥堵,为每一位用户设计贴心智能的出行方案。而本月早些时候,滴滴还在硅谷成立了滴滴美国研究院,以云安全、 深度学习、人机交互、计算机视觉及图像学、智能驾驶等领域的技术开发及应用为主要课题。

 

而这一切的基础,在于滴滴得天独厚的财富——海量的出行大数据。叶杰平介绍说,每一辆在滴滴平台上的车辆,每隔几秒钟就会向滴滴大脑这一智能系统传递信息。滴滴每天新增的数据量超过70TB,每天处理的数据量超过2000TB。平台每日路径规划次数超过90亿次,日均定位数超过130亿次。滴滴大脑的使命,正是利用 AI 技术,从海量的出行数据里面挖掘有用的信息来提高人们的出行体验和效率。


 

在演讲中,叶杰平从目的地预测、智能派单、路径规划、和ETA、供需预测、服务评价几个应用场景入手,具体解析了AI 技术在其中的作用。



目的地预测和智能派单


打开滴滴App后,如果用户已经多次使用了这款App,大数据人工智能会先预测一下可能的目的地。如果早上打开App,滴滴大脑会猜用户很可能是去上班或者去学校;如果是中午,可能会去某个餐馆吃饭,晚上用滴滴可能是回家或者参加派对等等。海量的数据结合算法,做出一个比较精准的预测,给你带来人工智能的初体验。


预测目的地或者用户自己输入目的地之后,就进入到滴滴最核心的一个模块——派单,也就是乘客跟司机的匹配。乘客每次发单,背后都需要借助大规模分布式计算对司机和乘客进行最优匹配,不仅要将乘客与周围大量的司机进行匹配,计算出最优,还要计算出最佳行驶路径,做到总时间最短,从而实现平台效率和用户体验最大化。



这有点类似于去百度、谷歌上搜索信息,本质上是乘客搜索司机,只是两边都是人。但不像一般的搜索引擎,隔半天、隔几分钟去搜索,得到的信息可能变化不大。但是滴滴产品不一样,隔5秒钟这个车可能经过另外一个路口,可能上了高速,路况非常不一样,所以滴滴大脑需要做一个动态、实时的匹配,并能对未来的情况做出预测。


路径规划和ETA两项地图技术是实现智能派单的关键,也将直接影响到司乘双方的使用体验。

 


路径规划和ETA


路径规划和ETA(预估到达时间)两项地图技术是滴滴实现最优匹配的关键。



叶杰平介绍,通过对滴滴出行海量的用户行驶数据进行挖掘和学习,滴滴已经围绕最低的价格、最高司机效率和最佳交通系统运行效率设计出了全新的智能路径规划算法,能够对未来路况做出准确预测,整体考虑司机未来所有可能的走法,毫秒级算出A到B点的最优路径。



ETA指预估任意起终点所需的行驶时间,要求精准性。滴滴是国内第一家把机器学习成功应用到ETA的公司,这是解决“订单高效匹配”和“司机运力调度”的关键技术。当前滴滴ETA可以预测每一单出行的时长以及预估在每一个路口前的等待时长。有了这项技术,可以在更合适的时间对运力进行更好的调度。

 

当你作为乘客找司机的时候,总是希望找到和你距离比较近、到达时间比较短的司机。这里面就牵涉到地图技术。以前乘客发单之后,滴滴大脑会先定位这个乘客在某个地方,然后会搜索周边所有的司机,对于每一个周边的司机,滴滴大脑都会做一个路径规划,显示出这个司机经过这个乘客需要走哪条路,最合理的路径是什么。找到最佳路径后我们就会算出它的距离;第二部分是时间,大概需要多久到达。这两个问题都非常具有挑战性,因为这要求实时的预测,量特别大。每一个乘客都要跟周围可能是成千上百个司机做匹配,如果有拼车的情况,两两组合,就会更加复杂。而且用户忍耐度有限,同时路况的信息也不是特别精准。

 

从2015年下半年开始,滴滴大脑引入了一套机器学习系统,从原始数据入手,包括实时的、历史的数据,然后挖特征建模型。从最早期的适用规则来做预测,到后来利用传统的机器学习模型,直到最近完成了深度学习的模型,时间的误差降了大概百分之七八十。这里就能看出大数据、人工智能巨大的潜力。

 

对于乘客和司机,滴滴大脑计算出路径、距离、时间之后,就知道每一片地区的某一个乘客和某一个司机之间的匹配度,一般情况下距离越短越好,时间越短越好。由此,每2秒钟得到一个非常大的矩阵。每一行代表一个司机,每一列代表一个乘客,中间的矩阵代表乘客和这个司机的匹配度,匹配度越高越好。下面就可以开始派单。现在滴滴每2秒钟做一个订单匹配,目标是希望在2秒钟之内,现有的乘客和司机的最终匹配量、成交量越大越好。这个方法的缺点是它没有考虑未来,比如说订单A到了目的地之后,可能紧接着还有另外一个订单,订单B到了目的地之后可能就没有订单了,因为那里是比较荒凉的地方。如果司机知道未来——比如说半天——会发生的事情,那他可能会选择第一个订单,因为他很可能会接到两个订单,但如果是选了第二个订单,他很可能只有这一个订单。所以订单匹配本质上是应该考虑未来的供需情况,而且出行相关的很多产品是可以预测的。很多未来的需求,供给是能够有比较精准的预测的。这样就可以把未来的预测结合到现在的派单里面,从而提高效率。


最近滴滴大脑引入了增强学习。在派单里面,每一个时刻的派单都会结合一天的预测情况,我们的目标也是司机一天的收益最大化。目前采用的方法还是每2秒钟收益最大化,我们要把它放大到1天内的收益最大化。最近这个模块在几个城市初步上线了,效果还是非常显著的。其原因主要是增强学习的应用。

 


供需预测


滴滴所掌握的巨大的真实数据除了帮助预测路况外,还能对供需进行预测,供需预测越准确,越能更好的解决供需不平衡问题。


 

供需不平衡是滴滴平台效率受到限制的一个非常重要的因素。大家经常打车打不到,其原因不是平台的车辆运力不够,而是运力的分布不合理。这张图有红色、黄色、绿色,红色表示需要更多运力,绿色表示多出了运力,上面的数字表示缺多少运力,比如2,说明该区域缺两个车辆,负6说明该区域多6个车辆。在北京,高预期车辆不一定缺,只是分布不合理。但是等你意识到分布不合理的时候,再去调度司机可能有点晚,因为这个司机开过来之后,供需不平衡可能已经发生了变化,而且供需不平衡的订单经常是交通比较堵塞的地方,所以司机也不愿意过来。这个时候就需要做一个供需预测。现在滴滴大脑对未来15分钟的不同区域的供需预测,精度大概是85%。

 

换言之,就是通过对用户需求的预测,提前安排空闲司机去响应未来的订单,实现城市车辆的实时调度,以便于满足不同区域的打车需求。


 


服务评价

 

滴滴使用大数据技术来预估每个司机的服务分值,包括乘客打分、乘客评价以及取消率等因素,并利用算法模型来计算不同服务水平的司机对用户产生的长期影响。


目前服务分已与滴滴的智能派单系统结合,在距离、车型等条件类似的情况下,系统将优先派单给服务分较高的车主,帮助服务优良的车主获得高的收入。上述服务信用体系就是利用人工智能建立算法模型来实现,该信用体系上线后,用户投诉率和订单取消率都显著下降。


 

在演讲的最后,叶杰平表示:滴滴是一个数据、技术、体验驱动的公司,人工智能已经在很多应用场景有了比较成功的应用。交通是一个世界难题,滴滴希望跟各界一起合作,能够持续提高出行的效率、体验和安全等等,贡献自己的社会责任。

 

程维的心愿,是将滴滴打造成为一个“世界顶级的科技公司”。而在MIT Technology Review 2016年评选出的50家最智能的科技公司中,滴滴出行确实榜上有名。人工智能将带来最新的产业革命,滴滴出行正在成为这一浪潮的绝佳注脚。


文章转自新智元公众号,原文链接

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
3月前
|
机器学习/深度学习 人工智能 TensorFlow
神经网络深度剖析:Python带你潜入AI大脑,揭秘智能背后的秘密神经元
【8月更文挑战第1天】在当今科技飞速发展的时代,AI已成为日常生活中不可或缺的一部分。神经网络作为AI的核心,通过模拟人脑中的神经元连接方式处理复杂数据模式。利用Python及其强大的库TensorFlow,我们可以轻松构建神经网络模型。示例代码展示了如何建立一个含有两层隐藏层的简单神经网络,用于分类任务。神经网络通过反向传播算法不断优化权重和偏置,从而提高预测准确性。随着技术的进步,神经网络正变得越来越深、越来越复杂,能够应对更加艰巨的挑战,推动着AI领域向前发展。
44 2
|
19天前
|
机器学习/深度学习 人工智能 算法
Nature子刊:AI模型测大脑年龄,究竟哪些因素会加速大脑衰老?
【10月更文挑战第7天】《自然医学》杂志近期发布了一项研究,介绍了一种名为BrainAge的人工智能模型,该模型可预测个体的大脑年龄并分析影响大脑衰老的因素。研究团队来自美国加州大学旧金山分校,利用英国生物银行的近50,000名参与者的数据,发现高血压、糖尿病、肥胖、吸烟、饮酒、缺乏运动及遗传因素均与大脑衰老有关。尽管存在数据集限制等局限性,BrainAge模型仍为研究大脑衰老和相关疾病提供了重要工具。
35 1
|
2月前
|
机器学习/深度学习 人工智能 TensorFlow
神经网络深度剖析:Python带你潜入AI大脑,揭秘智能背后的秘密神经元
【9月更文挑战第12天】在当今科技飞速发展的时代,人工智能(AI)已深入我们的生活,从智能助手到自动驾驶,从医疗诊断到金融分析,其力量无处不在。这一切的核心是神经网络。本文将带领您搭乘Python的航船,深入AI的大脑,揭秘智能背后的秘密神经元。通过构建神经网络模型,我们可以模拟并学习复杂的数据模式。以下是一个使用Python和TensorFlow搭建的基本神经网络示例,用于解决简单的分类问题。
46 10
|
6月前
|
存储 人工智能 自然语言处理
掌握AI摘要技术解锁个人第二大脑
掌握AI摘要技术解锁个人第二大脑
179 0
|
机器学习/深度学习 人工智能 编解码
人脑90%都是自监督学习,AI大模型离模拟大脑还有多远?
人脑90%都是自监督学习,AI大模型离模拟大脑还有多远?
210 0
|
数据采集 人工智能 数据可视化
AI读脑炸裂!扫描大脑画面,Stable Diffusion逼真复现图像
AI读脑炸裂!扫描大脑画面,Stable Diffusion逼真复现图像
179 0
|
人工智能 边缘计算 安全
【年终特辑】看见科技创新力量 洞见时代创业精神—航空航天—星测未来:给卫星装上AI大脑瞄准卫星智能化专业市场
【年终特辑】看见科技创新力量 洞见时代创业精神—航空航天—星测未来:给卫星装上AI大脑瞄准卫星智能化专业市场
183 0
|
存储 机器学习/深度学习 人工智能
模拟大脑功能,这个AI模型真正实现像人一样持续学习
模拟大脑功能,这个AI模型真正实现像人一样持续学习
164 0
|
机器学习/深度学习 人工智能 自然语言处理
上海数字大脑研究院首次发布《2022上半年度人工智能行业报告》,多层面深度分析全球AI发展
上海数字大脑研究院首次发布《2022上半年度人工智能行业报告》,多层面深度分析全球AI发展
234 0
|
机器学习/深度学习 Web App开发 人工智能
AI读脑炸裂!扫描大脑画面,Stable Diffusion逼真复现图像(2)
AI读脑炸裂!扫描大脑画面,Stable Diffusion逼真复现图像
181 0

热门文章

最新文章