技术和商业的碰撞,谈阿里云与天猫双11这十年

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 2009年,发生了两件看似不起眼的事。初春刚过,阿里云在北京一栋没有暖气的写字楼写下了飞天第一行代码。同年11月11日,淘宝商城启动了一个叫做双11的促销活动。谁也没想到,多年以后他们会是现在这模样。

2009年,发生了两件看似不起眼的事。

初春刚过,阿里云在北京一栋没有暖气的写字楼写下了飞天第一行代码。

同年11月11日,淘宝商城启动了一个叫做双11的促销活动。

谁也没想到,多年以后他们会是现在这模样。

云上双11更多精彩内容

前传

2007年淘宝的交易额突破了400亿,技术团队却喜忧参半:现有集中式架构已经捉襟见肘,该如何应对?

随即启动的分布式改造获得巨大成功,淘宝所有的业务都做了模块化。

尽管这次技术升级在现在看来存在诸多局限性:更多的是为了应对不断增多的图片缓存,在CDN端对海量的图片缓存做了一些限流操作。但就是这次改造成就了历史上第一个双11,2009年双11当天的流量达到了一个高峰,在旧的架构体系下,这几乎是一项不可能完成的任务。

一年后,飞天的第一个版本上线,仅有几十台机器的集群开始服务第一个内部客户——阿里金融。

image001

这些探索让所有人看到了一个趋势:用分布式的方法将传统、昂贵的小型机硬件和软件,替换成通用的X86的服务器集群,虚拟化等技术可以让计算能够按量、随时被启动。

流量狂奔:脉冲计算

从计算机诞生到90年代,计算资源都是作为“可计划性”的资源来使用。无论是探索月球,还是研究基因的奥秘,计算资源本身是可规划的。然而,互联网时代的到来,一个爆发性事件,就有可能挑战整个计算资源,不确定性如影随形。

毫无疑问,双11就是这样一个典型场景。

2011双11的流量洪峰给技术团队留下了午夜惊魂般难忘的回忆:系统性技术问题,使大量商家可能出现超卖。

事后,这群国内互联网行业最优秀的技术人开始意识到这已经不仅仅是一场商业促销活动,更是一次技术大考。

次年,天猫与阿里云、万网宣布联合推出聚石塔平台,率先以云计算为“塔基”,为天猫、淘宝平台上的电商及电商服务商提供IT基础设施。

image003

基于阿里云的ECS云服务器、RDS云数据库、SLB负载均衡网络,商家订单源源不断的推送到商家平台上,保障了数据的稳定和延续。这是云计算首次参与双11,并且实现了191亿的交易总额。

飞天的高速成长也给了所有人信心:5年的时间,飞天平台集群规模从1500台到3000台,2013年8月,单集群超越5000台,同时支持多集群跨机房计算……

接下来几年,云计算逐渐成为这场狂欢节中的基石,到2014年,聚石塔上96%的交易使用了阿里云。

2015年开始,双11构建了全球最大的混合云,将公共云和专有云无缝连接。

而这些成果最终成为了全社会的能力:无论是春节在12306抢票,还是在世界杯期间的狂欢,抑或是微博上的明星八卦,脉冲计算的能力在今天已经变成了常态。

数据平台,计算创造价值
2013年前后,“船票论”在互联网圈极为流行。“船票”成为了人们对于一家公司有没有未来的判断依据。至于如何拿到这张船票,彼时都非常模糊。

然而,移动端带来的海量数据却是真实存在的,移动端带来的新需求,也推动了阿里云大数据平台的发展。

鲜为人知的是,2004年,为了从大数据中分析当前状况,并预测未来的趋势,阿里就拥有了第一个大数据仓库,到2008年,淘宝的业务量与数据量已达到2004年的数千倍,为了让数据成为生产资料,从底层重构大数据技术就显得尤为重要。

2010年春,大数据引擎MaxCompute的前身SQL Engine第一版上线,运行在当时30台机器的飞天集群上。

2011年,飞天团队开始探索支撑集团内部数仓业务,在1500台机器上并行运行云梯2的生产作业,并取得了不输于Hadoop的性能和稳定性成绩。

飞天5K项目之后,MaxCompute随之进入5000台机器和跨机房调度时代,并且可以在377秒完成100TB的排序。

通过MaxCompute引擎助力,从2014年双11开始,千人千面成为常态。现在,这一产品已经成为阿里巴巴的主力计算平台:
l阿里巴巴集团99%的数据存储以及95%的计算能力使用MaxCompute;
l每天有超过500万个作业在平台上运行;
l2017年双11,MaxCompute单日数据处理超过320PB。

几年过去,“船票论”烟消云散,然而大数据平台带来的价值已显山露水,通过大数据与人工智能算法的结合,MaxCompute已成为ET大脑最重要的组成部分,ET城市大脑自动指挥城市路口信号灯,并且成功应用于马来西亚的交通治理;ET工业大脑推动工厂取得更好的良品率,致力于帮助制造企业提升1%的良品率。

从数字化阿里到数字化城市,MaxCompute可以承载EB级的数据存储能力,成为全球首个100TB规模Bigbench测试通过的大数据计算平台;在公共云上覆盖国内外的十几个国家和地区,专有云上部署超过100+套。

史上最大规模的人机协同

2017年的双11被认为是人类历史上最大规模的人机协同“超级工程”:技术运维、商品推荐、客服、支付、物流等各个环节都引入机器智能。

数据、计算力、算法是人工智能的三大核心要素。飞天在通用计算服务的基础上,开始探索面向人工智能的异构计算。

2017年9月12日,阿里云宣布推出全新一代异构计算加速平台,在行业内第一次覆盖了包括AMD、NVIDIA的GPU和Intel、XILINX的FPGA在内的所有6款主流异构实例,提供最高可达75TFLOPS的算力。

全新的基础设施让全球最大规模的人机协同成为了可能。双11大量AI和视频转码业务部署在ECS的GPU集群之上,包括视频云的视频智能处理、阿里小蜜、拍立淘和新零售的智能供应链管理等AI业务都通过阿里云异构计算GPU昊天平台进行加速。

 阿里巴巴数据中心机器人“天巡”每天在机房巡逻,能接替运维人员以往30%的重复性工作。

  • AI调度官“达灵”将数据中心资源分配率拉升到90%以上。
  •  人工智能助手‘阿里小蜜’在双11当天承担95%的客服咨询。
  •  菜鸟智慧货仓机器人单日可发货超过100万件。
  •  AI设计师“鹿班”,在双11期间设计了4.1亿张商品海报。
  •  阿里机器智能推荐系统双11当天为用户生成超过567亿个专属“货
    架”,像智能导购员一样,给消费者“亿人亿面”的个性化推荐。

半年后的武汉云栖大会上,阿里云首次和合作伙伴一起展出了AI智能点单设备,在没有任唤醒词的情况下,客户以每秒5个字的速度,向一台机器点单,并频繁更换语句,这台机器对每次对话均作出了精准应答。

现在,这些基础设施以及商业化的产物正服务于各行各业。

飞天2.0支撑2018全社会的双11

云上双11更多精彩内容
如果说最初的技术变革是为了解决平台的流量峰值问题,那么现在新的篇章已经开启,新技术正在引领商业变革。

今年双11期间,阿里云上新增调用的弹性计算能力累计超过1000万核,相当于10座大型数据中心,创造了“脉冲计算”的新纪录。不仅如此,飞天2.0的新能力全面支撑双11:

  • 阿里云自研神龙弹性裸金属服务器在核心系统中发挥巨大作用。其基于完全自研的新一代软硬融合的X-Dragon虚拟化架构,兼具物理机和虚拟机优势,解决了高峰值流量下的性能瓶颈。
  •  业界首个百万级IOPS的ESSD云盘提供了数十PB的存储规模,应对了史上最大的高并发IO挑战。
  •  猫晚网络直播创下带宽峰值记录,阿里云视频云高可靠直播方案完美保障了优酷2500万用户的体验。
  •  CDN为中国1/3以上的互联网流量提供加速,视频云在海外为Lazada提供直播服务。
  •  国内首次大规模IPv6商业应用实践,云、网、端以及应用全面支持IPv6。
  •  实时计算Blink处理峰值达到每秒17.18亿条,相当于120万本新华字典的数据量。
  •  MaxCompute单日数据处理超过500PB,平稳支撑电商混布单元在线流量洪峰12万笔/秒交易。
  •  云盾为云上客户提供上千万次风险识别服务,并将DDoS高防技术输出到全球,保障全球业务。
    ……

image005

在这些技术底座之上,整个系统应对流量洪峰更加从容,当天交易额达到创纪录的2135亿。

当然,IoT的登场则为双11创造了更大的想象空间。

在消费侧,IoT技术服务新零售的同时,正在催生新的追踪经济。消费者可以查看进口商品完整的商品溯源实时信息,确保天猫进口商品安全可溯,远洋运输也实时可见。

在制造侧,助力天猫品牌服装厂商数字化接单、下单和备货,个性化生产、柔性化制造,交期准确率近乎100%;对农业生产、运输、销售进行全链路升级。

从线上到线下,从生产制造到物流配送,从国内到海外,阿里云的技术能力延伸到各行各业。而这只是这些新技术应用的冰山一角,云与AI、IoT的有机融合未来还会产生什么化学反应?我们拭目以待。

结语

从27个品牌参加成交额不过数千万元开始,到现在的千亿级体量,双11已经成为一个未来商业实践的范本,也是新技术的最大试验场,这些新技术逐渐变成全社会的基础能力,撬动一场全球的社会大协作。

云上双11更多精彩内容
https://promotion.aliyun.com/ntms/act/cloud20181111.html
点击了解“阿里云新品发布会频道”:
https://promotion.aliyun.com/ntms/act/cloud/product.html

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
人工智能 运维 自然语言处理
阿里亮出2020双11十大前沿技术,打造史上最科技的双11
2020双11将成为史上最具科技含量的一届双11。
阿里亮出2020双11十大前沿技术,打造史上最科技的双11
|
人工智能 运维 自然语言处理
阿里亮出2020双11十大前沿技术,打造史上最科技的双11
2020双11将成为史上最具科技含量的一届双11。
阿里亮出2020双11十大前沿技术,打造史上最科技的双11
|
双11 搜索推荐 算法
淘系技术,实力为2019年双11而战!稳!
2019 天猫双 11 全球狂欢节96秒成交额破百亿,24小时总成交额2684亿,创造了交易创建峰值 54.4万笔/秒的历史记录。天猫双11,已经不仅是购物节,也是品牌成长节、消费者互动节。天猫双11更是是商业的奥林匹克。每一年的双11,零点交易的数字都在不断提升,而淘系技术的突破和创新远不止与此,我们将持续以技术驱动产品和商业创新。2020,我们精彩继续!
5715 0
淘系技术,实力为2019年双11而战!稳!
|
新零售 人工智能 大数据
阿里云与天猫双11这十年
2009年,发生了两件看似不起眼的事。 初春刚过,阿里云在北京一栋没有暖气的写字楼写下了飞天第一行代码。 同年11月11日,淘宝商城启动了一个叫做双11的促销活动。 谁也没想到,多年以后他们会是现在这模样。
3681 0
|
机器学习/深度学习 运维 供应链
承担双11万亿流量,阿里核心技术揭秘:12位大咖告诉你!
12月13日-14日,云栖社区联合阿里巴巴技术协会,共同举办《2017阿里双11技术十二讲》在线直播峰会,独家分享双11背后技术最佳实践!
10510 0
|
新零售 移动开发 weex
【阿里云资讯】新零售时代的双11移动技术亮剑 ——2016年阿里移动平台新技术解读
截至24:00:00,2016天猫双11全球狂欢节总交易额1207亿,无线交易额占比81.87%,覆盖235个国家和地区。中国力量造就未来世界新经济体!正如阿里巴巴集团CEO张勇早前剧透的2016年双11全新趋势一样,“以互动为代表、直播为载体, 消费娱乐化将进行到底”在双11移动端体现的尤为彻底。
3982 0
|
双11 测试技术 数据库
双11黑科技大揭秘,护航企业创造商业奇迹
随着“ 双十一“全民购物狂欢节的到来,很多企业和电商公司也将迎来流量和营业额的高峰。但是,纵观往期双十一的交易数据,我们不难发现,双十一为商家带来流量曝光和推广的同时,高频度流量也对企业数据库处理等能力提出了更高的要求。企业本身如果不能保障流畅运行和企业内沟通效率,将会对企业造成巨大的经济损失。
1304 0
|
供应链 云栖大会
云栖大会:企业如何走向双中台的黄金时代?
2019年云栖大会在前些天落下帷幕,历时三天的云栖大会为我们带来了数据、智能、云计算、物联网等领域的精彩分享。 这一次的云栖大会迎来了作为阿里巴巴集团董事局主席、首席执行官的张勇,同时也带来了双中台解决方案。这是继7月阿里云上海峰会之后,阿里云双中台解决方案的又一次隆重亮相。
14169 0