从服务内部到实现商业化,美团云所经历的这两年

简介: 100 万单、 1000 万单到 1400 万再到 1600 万单的峰值,美团点评的外卖日订单迅速上涨。与此同时,配送体验要求也在不断提升,平台也始终面临运力的挑战,必须不断平衡配送成本和配送体验的要求。


如何通过技术手段而不是单纯扩大骑手规模的方式,让美团外卖平台超过 50 万的骑手高效工作,提升用户满意度的同时,降低配送成本,是美团配送技术团队持续解决的难题。「美团外卖业务场景的技术难度相对较高的主要表现在于——系统压力高峰期区分明显、交易链路长实时性要求高、交易转化率高和用户停留时间短四方面。」美团外卖技术架构负责人孙传亭说。


规模庞大且不断扩展的业务量,使外卖系统中数据驱动的因素大大提升,这对美团外卖的后端系统架构提出更高的要求。过去一年多时间,针对即时配送场景应用了机器学习、运筹优化等技术,推出 O2O 即时配送智能调度系统。


不止是外卖业务,点评 UGC 内容、用户上传信息等业务内容都从以往的人工改变为机器处理为主。美团云成为背后有力的底层技术支撑,美团云总经理李爽说:「对技术本身就有很大需求,我们也做了大量的工作。同时,构建云平台符合我们的发展方向,也符合具体的市场方向,所以我们就做了这个选择。」


微信图片_20211129135151.jpg


美团云成立时间并不长,2015 年 4 月,李爽加入美团点评后才开始着手构建美团云团队。如今,美团云团队有 200 余人,是美团点评不可或缺的重要组成部分。


同样,在产品方面,美团云也已经完成相对完善的布局:2017 年,美团云推出 GPU 云主机进入 AI 领域;5 月布局主机类、平台类、服务类三大类产品开启 AI 战略,并于英特尔、华为、依图、搜狗等 AI 企业建立深度合作,打造人工智能生态圈;9 月大幅降价底层计算产品 GPU,并宣布 SaaS 层产品及深度学习平台全线免费。


尽管从亚马逊到国内 BAT 都早已站在云服务市场的「黄金赛道」,竞争的激烈程度不言而喻。但在李爽看来,现阶段不同的 AI 场景有着不同的计算需求,美团云不会放弃任何机会,只要是新的机会、新的场景,都希望能够去进行尝试,「因为谁也不能判断未来到底会怎样。」


从内到外,向 AI 靠拢


「美团云的成长与美团点评的发展是密不可分的。」李爽回顾称,也就是说,这是一个从美团点评的业务需求出发,逐步完善后再向外输出解决方案的过程:


从 2012 年开始起,在自身业务需求的推动下,美团开始部署私有云。一年后,公司上线公有云项目美团云 MOS,当时盛大、阿里巴巴都在尝试做公有云,但由于资源准备还不充分,加上内部业务增速很快,美团云对外商业化的计划往后推迟。直到 2015 年,美团云生活服务领域的业务已经相对成熟,才正式独立运营并全面对外开放云服务。


李爽介绍,从内部延伸至外部的过程中,产品形态的转化是他们面临的一大考验。比如,计费的形式以及用户的管理,内部产品偏向于更加简化、规模及效率,外部则强调功能、安全性合理性,包括用户的友好程度,内部使用 API 可以搞定,外部必须有操作界面的设计。


「那时我们希望跟市场上大部分公司具备一样的能力,所以 2015 年我们的主要工作就是一边构建团队,一边在产品的数量与平台的性能上完成补齐。」李爽说。在这段时间里,在原有的计算和存储功能外,美团云添加了 IaaS 与 PaaS 等相关模块和功能。


2016 年的时候做了行业云方面的探索,主要集中在传统领域,包括餐饮、酒店、旅游等。在完成行业云的探索之后,美团云的业务重心在 2017 年回归到了平台策略上,并于 5 月正式把 AI 作为重要战略目标,选择以底层高性能云主机为依托,中层深度学习平台为支撑,上层场景服务为应用组合,以这样的方式来布局其人工智能版图。


李爽称:「2017 年,我们看到整个云计算市场的计算力正在发生迁移,这是好事,也是整个 AI 行业的发展趋势。」在 AI 领域,传统 CPU 的计算力已经向 GPU、FPGA、甚至更新的 Intel 处理器等迁移。「这种迁移速度非常快,会带动起整个行业形态的变化。我们会把这四种计算资源融合在一起,对外释放这种能力。」


而这些技术能力也正是美团云的需求。从最初的自动化证照审核,到后来的美团点评 UGC 处理,以及美团外卖的调度等,这背后的工作逐渐由机器取代人工,海量数据经过训练与处理更好地输出给美团点评的业务,实现效率的提升。


这一过程不仅符合美团云发展的方向,还实现了 AI 能力的积累,同时能够以此输出给客户。一般而言,做云服务有两个方向,一是专注垂直领域,提供从底层到顶层的整套解决方案;二是把能力聚焦于自身的强项,美团云属于后者。


李爽表示,美团云在底部的 IaaS 和 PaaS 积累了大量经验,会把精力放在运营资源和搭建平台,推出 IaaS 类和 PaaS 类的相关产品,在此基础上再把业务进行对外输出,把应用层交给更加熟悉这个领域的客户来完成。


「无论从产品还是从规模的角度看,AI 都是比较新的东西。除了小型互联网公司,传统机构和政府方面对于 AI 的理解也可能存在一定的距离,我们希望可以缩短这个距离,让他们的产品更快地应用到实际。」李爽补充道。


打造整套 AI 体系


「未来的 AI 领域可能会形成一个头重尾长的生态。」美团云战略负责人 Rachel 认为,大公司往往会着眼于 AI 领域的大问题,但事实上还有很多细分行业需求有待中小型企业玩家和创业公司来解决。比如,大部分用户不一定具备建立一套数据与平台的能力,另一个角度来看,这些公司自建平台的必要性并不高。


「美团云的定位就是整体向外输出美团点评的数据技术积累与技术能力,我们把 AI 能力开放出去,让用户使用我们的基础设施、计算力或算法数据等能力,进而帮助用户降低产品商业化的门槛。」Rachel 说。


目前,美团云上线了主机类、平台类和服务类三大 AI 产品,以底层高性能云主机为依托,中层深度学习平台为支撑,上层场景服务为应用组合的方式来布局其人工智能版图。


主机类产品覆盖 GPU 云主机、FPGA 云主机、KNL 物理机等 IaaS 层主机服务。9 月 6 日,美团云宣布 GPU 产品永久降价 50%,大幅降低了企业 AI 计算资源的成本。


微信图片_20211129135145.jpg


平台类产品方面,美团云的深度学习平台支持开发者在 TensorFlow、Caffe、Torch 等灵活、高扩展性深度学习框架中进行模型训练及算法研究,进一步输出美团云的 AI 能力。9 月 21 日,美团云宣布 AI 服务全线免费,也免费开放了深度学习平台。


提及全线免费的市场打法对美团云营收方面所产生的影响时,李爽表示,现在考虑这一问题还为时尚早,美团云目前并不太考虑营收问题。


服务类产品则包括人脸识别、图片识别、NLP 、语音识别、OCR 文字识别、智能客服、机器翻译等与人们生活场景密切相关的 AI 服务。李爽称:「IaaS 和 PaaS 层我们具有优势,所以选择自己来打造。相比之下,SaaS 层其实更贴近于用户的使用场景,我们会更依靠生态里的合作伙伴。」


在谈到为什么没有把合作伙伴的能力直接提供给用户,而是重新构建一个新的接口再服务用户时,李爽表示:「其实合作伙伴的声明周期也存在风险,我们希望可以给用户提供一个稳定的接口和平台,避免受到合作伙伴业务调整带来的影响。」目前,美团云已与搜狗、依图、旷视、Rokid 等 AI 企业展开合作,实现内部孵化与外部技术的融合,构建一个完整的生态系统,打造最开放的 AI 共享平台。


对于 AI 战略的规划和实现路径,李爽介绍称:「我们的第一步会面向全体 AI 生产者,把底层资源释放给他们,让他们把维护框架、构建平台的精力节省下来用于自身算法和应用层的研发,帮助他们完成自身 AI 价值的最大化。然后今年年底,我们会开启生态化建设,把外部资源纳入我们的平台上,将 AI 生产者的业务融入我们的体系中,再给用户提供相应的解决方案。」


李爽始终认为,数据是 AI 发展的核心,其外层依次为算力、算法和应用,用户的数据经过计算效率的提升、算法模型的优化以及平台的搭建,由内向外逐渐扩展,最大化发挥价值。


由此,美团云计划从底层向上构建,将这四种资源纳入美团云的体系中,这也是美团云今年的目标。「我们需要对资源进行评估、衡量和调整,根据场景需求再一次做补齐工作,达到用户满意的状态。」李爽说。微信图片_20211129132745.jpg


相关实践学习
部署Stable Diffusion玩转AI绘画(GPU云服务器)
本实验通过在ECS上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。
相关文章
|
3月前
|
云安全 安全 云计算
|
存储 云安全 人工智能
“新十年”再出发,2023可信云大会“新变化”抢先看!
勇立技术潮头,多项新热点议题助力产业发展
233 0
“新十年”再出发,2023可信云大会“新变化”抢先看!
|
Kubernetes Cloud Native Linux
|
运维 Kubernetes Cloud Native
KusionStack 开源有感|历时两年,打破 “隔行如隔山” 困境
本文撰写于 KusionStack 开源前夕,作者有感而发,回顾了团队从 Kusion 项目开发之初到现今成功走上开源之路的艰辛历程。当中既描述了作者及其团队做 Kusion 项目的初心和项目发展至今的成果,也表达了作者自身对团队的由衷感激,字里行间都散发着真情实感。
KusionStack 开源有感|历时两年,打破 “隔行如隔山” 困境
|
新零售 人工智能 供应链
产业互联网两年记:落地的最佳实践是什么?
产业互联网两年记:落地的最佳实践是什么?
192 0
产业互联网两年记:落地的最佳实践是什么?
|
存储 机器学习/深度学习 人工智能
「拥抱产业互联网」一年后,腾讯首次完整披露20年技术演进之路
从 0 开始到海量业务,从 PC 互联网到云计算时代,腾讯日均 30 万亿实时计算次数的背后,离不开腾讯云的支撑。 11 月 6 日,在首届 Techo 开发者大会上,腾讯云首次完整介绍了自身多年来在基础设施和大数据计算方面的实践成果,向外界郑重回答了一个问题:腾讯有 To B 的能力,也有将 To B 贯彻到底的决心。
264 0
「拥抱产业互联网」一年后,腾讯首次完整披露20年技术演进之路
|
运维 监控 Cloud Native
考拉上“云”的431天:经历了怎样的“脱胎换骨”?
今年双11,是考拉海购加入“阿里动物园”的第二年,其成绩单备受外界关注。 加入阿里431天,考拉交出了一张漂亮的成绩单:会员规模增长104%,刷新过往双11纪录。 很多人不知道,增长来之不易——2019年9月,考拉被阿里正式收购后,经历了一场“脱胎换骨”:数据库应用架构重新设计、百万级节点的容器集群大规模迁移、数据中心从杭州机房迁移到上千公里之外的张北、从基础组件到中间件全面拥抱云原生……
考拉上“云”的431天:经历了怎样的“脱胎换骨”?
|
运维 监控 Cloud Native
国货之光业务增长背后的技术支持 - 完美日记的云原生实践
利用 ACK 容器快速弹性扩缩容,节约服务器成本 50% 以上。
国货之光业务增长背后的技术支持 - 完美日记的云原生实践
|
SQL 前端开发 安全
阿里云新品发布会周刊第47期 丨 加入阿里技术团队三年,哪些习惯让我在工作上持续受益?
新产品、新版本、新技术、新功能、价格调整,评论在下方,下期更新!关注更多新品发布会!
2457 0
|
Cloud Native 微服务 容器
数千台服务器,千万用户量:居然之家两年云原生改造历程
导读:传统企业的决策链路通常是自上而下的形式,因此在互联网化改造中,不仅仅是研发层面,整个公司的管理人员都需要做好知识升级和观念更新,这也是躺平设计家在过去几年的上云之路所经历的。本文将聚焦居然之家利用阿里云容器服务(ACK) 进行云原生实践历程,期待能帮助读者了解传统企业从传统单体架构向云原生演变的实践路径。