
暂无个人介绍
(消费互联网技术下的中台战略。图片来源:云徙科技) 自“中台战略”出现以来,市场上关于“中台”的理解可谓五花八门,很多人顾名思义的认为“中台”是处于企业运营和组织架构“中间”位置的系统,想当然认为“中台”就是去ERP化或是代替传统企业管理软件包括工业软件。但这其中有一个重大误区,就是诞生于阿里的中台技术,本质是消费互联网的产物和技术沉淀,其核心作用是支撑电商等面向消费者强交易型业务场景,促进消费者业务的快速创新。 作为数字双中台的典型产品化代表,云徙科技首席架构师陈新宇认为:工业数据湖正在成为工业互联网或产业互联网的数据中台,向下统一了传统ERP、CRM、MES等企业经营管理与生产制造软件,是传统企业与工业软件的新形态;而面向前端消费者的业务中台和数据中台双中台,沉淀的是消费者业务的共享业务和共享服务,向上统一了各类电商、在线营销、客户服务等消费互联网应用,是以实现前端业务快速创新为目的的新型企业软件。 汽车、地产、零售、家电、快消等具备消费者强交易性质的行业,是数字中台技术最积极的采用者,这些行业也最适用产品化的业务中台+数据中台双中台;而化工、机械工程、建筑等纯B2B行业,往往采用项目制的数据中台,通过各类企业级软件的数据打通,对企业内部和关联产业链公司之间的业务流程进行优化重组。至此,中台软件产业格局,初步形成。 疫情促成中台市场格局明朗化 2020年的一场全球性疫情,促进了消费互联网与产业互联网的同步快速发展,消费互联网下的数字中台与产业互联网下的数据中台,各自迎来发展黄金契机。 在消费互联网方面,消费者行为向线上的迁移,促成消费互联网及其技术的深化。例如,根据麦肯锡2020年4月的一份报告,超过55%的中国消费者可能会永久在线上购买更多食品。由于上亿人隔离在家,很多直接面向消费者的企业和行业,纷纷开始建设线上销售与营销渠道,这直接加强了电商等消费互联网模式的再度渗透。根据QuestMobile,受疫情影响,用户线上购物需求大涨,全网已有8成以上用户活跃在平台上。此外,用户消费路径已经发生改变,影响因素从过去的商品吸引,向社交、内容等多维度转变。 (消费互联网技术下的典型中台架构。图片来源:2018阿里云栖大会·上海峰会) 消费互联网下的数字中台,以云徙科技为典型代表:加强多种线上渠道的消费者触达、交易、沉睡唤醒、会员转化、复购等,通过业务中台与数据中台双驱动创新营收。消费互联网技术体系中的数字中台,分为业务中台与数据中台,二者联动加速前端业务创新。其中,业务中台指的面向消费者业务APP的共享服务,例如共享的会员服务、商品服务、支付服务、评价服务、库存服务、营销服务等;数据中台则指的是与业务中台相匹配、具备业务模型的数据,例如会员数据、商品数据、交易数据、库存数据等。这样,业务中台与数据中台就可以联动,向上支撑前端消费业务应用的快速开发、快速创新、快速运营。 消费互联网下的数字中台,具有很强的可产品化性质,也就是说业务中台与数据中台都是可以形成套件的新型软件产品。特别是数据中台,并非大数据或数据仓库,因而可以产品化。但在产业互联网下的数据中台,则就以产业或工业数据湖的形态出现,无法产品化而必须走项目制。疫情期间,企业和产业的大量流程也大批向线上迁移,促进产业互联网及其中台技术的深化。例如,越来越多的企业依靠工业互联网平台展开业务——工厂转向无人值守、农业转向无人机播撒、产业链转向工业互联网平台。根据SAP提出的最新工业4.0战略:在云与边缘计算时代,数据湖将打通和融合传统的ISA-95工业软件体系(ERP、PLC、MES等),成为事实上的工业“中台”。也就是说,企业、产业或工厂等共享内部流程,已经通过ERP、PLC、MES等企业与工业软件进行了产品化,在云计算下则通过数据湖打通数据,因此产业或工业“中台”更多指的是以数据湖形式出现的数据中台,产业互联网之所有没有业务中台主要是已经有各类ERP、CRM、MES等软件承载了共享企业服务的功能。 在这次疫情中,消费互联网由上向下,由前端消费业务快速变化,倒逼企业组织变革;产业互联网则由下向上,由后端企业流程上云优化,倒逼企业组织变革。未来,二者的“中台”有望打通,成为真正的企业“中台”。 消费互联网技术大渗透 消费互联网、消费互联网技术以及消费互联网技术下的数字中台是中国特色,这也是为什么国外很难以理解中国的“中台”原因所在。中国是全球第一大消费互联网市场,从2013年开始已经连接6年成为全球第一大网络零售市场,如果说电商等代表的是第一代消费互联网技术,那么数字中台作为电商基础设施就代表了第二代消费互联网技术。 众所周知,“中台”这一概念肇始于阿里。阿里自2008年开始了“大中台、小前台”数字化转型,从2009年开始建设共享服务中心,打通淘宝、天猫、1688等三套前期建设的“烟囱”式电商系统,从共享业务、共享数据和共享技术平台等层面,对整个阿里IT体系进行了变革。直接的结果就是当阿里希望开发一套团购电商系统时,基于已经搭建好的可复用的中台,阿里仅投入产品经理、运营和开发等十几名员工就在1个半月的时间成功上线了阿里自己的团购平台“聚划算”。 (消费互联网技术下中台的本质。图片来源:2018阿里云栖大会·上海峰会) 以阿里电商的IT体系为代表、面向前端消费者和中小商户提出的业务中台与数据中台,即是中国自研的消费互联网技术,而国外诸如亚马逊的电商体系直到2019年才下线了消费者业务的最后一个Oracle数据库,阿里则早在2013年的时候就把淘宝最后一个Oracle数据库下线。这也就是说以阿里为代表的中国消费互联网技术早在2013年开始就已经形成中国特有的、足以取代西方企业级软件的技术形态。2018年,阿里云发布了基于双中台的数字化转型方法论,而自2016年开始阿里云的合作伙伴云徙科技就在尝试对外输出“双中台”。 疫情期间,消费互联网技术大规模向企业渗透,越来越多的企业开始把面向线上营销和销售的数字中台建设提上日程。云徙科技副总裁李楠介绍,在本次疫情期间云徙科技基于中台技术,在两周内为某客户上线了社区团购电商APP,也就是在社区里发展“团长”,以地域为单位建立“店铺”,商品由品牌商统一维护、上架到社区商场里,再销售给社区里的消费者。社区团长负责发展更多的社区消费者并进行会员转化,可以通过自有社区渠道包括社区论坛、社区群等发展,还可以把商品形成推广海报发布到社区线上渠道中。 社区团购是本次疫情期间集中涌现出的新型电商模式:红牛、农夫山泉、今麦郎、劲酒、青岛啤酒等纷纷招募社区团长。以青岛啤酒为例,不仅开启了社区团购和无接触配送服务,而且还启动了分销员计划——消费者通过简单的注册,不仅可以享受多种产品优惠,还能通过将定制海报分享到微信群和朋友圈赚取佣金。当然,疫情期间最著名的就是恒大地产的社交团购,直接带来了恒大地产在一季度的靓丽业绩。 陈新宇强调,云徙科技推出的面向消费互联网的数字中台,已经开始进入软件定义时代:以可视化编排、柔性化运行、动态化扩展、场景化自治、系统化协同、生态化开放为理念,规划数字中台的产品路线图。也就是说,云徙科技的数字中台并不是部署实施后就一成不变,而是可以跟随客户业务的发展而发展。这也是中国消费互联网技术在借鉴了ERP等西方企业级技术实践后,提出的创新理念与实践。 产品化数字中台日趋成熟 2020年4月初,云徙科技在疫情期间仍宣布了数字中台产品的重大更新,新推出:业务中台V3.1、数据中台V3.1.0、数字化研发服务平台V3.3、全渠道会员V3.2.0、全触点营销发布V3.2.0、数字商城系统V3.1.0、智能客户服务V3.1等七大产品更新,进一步加强了云徙双中台及应用的实用性,帮助企业打造基于中台技术的营销、交易、服务的一站式营销闭环,扩大营收、降本增效。 李楠介绍,在去年发布的双中台V3.0版本基本上,今年云徙科技将加大数字中台的产品化力度,每隔两到三个月就会推出一批产品更新。所谓“产品化”,简单理解就是在提供产品与服务的比例中,提高产品的占比、降低服务的占比,中台软件的产品化程度越高就越能让客户自行基于软件进行配置、管理、编排等工作,减少原厂工程师的人工介入。可以类比微软Office套件,虽然80%的功能都在日常用不到,但微软还会提供这些功能以让用户在需要时可自行组合调用以满足个性化需求。 (走向中台软件产品化的云徙科技。图片来源:云徙科技) 以本次发布的业务中台V3.1版本为例,其中重点更新了中台控制台(MPC)和商业运营中心(BOC)两大模块。其中,MPC是去年推出的新模块,是中台的“控制台”,也就是让用户可以对业务中台和数据中台进行改变,这就是软件定义中台。本次MPC更新了能力地图、业务空间管理、能力管理、API管理、应用管理以及功能包开发等模块,简单理解就是为中台架构师和开发者提供了更多的操控工具,可以很容易地通过可视化方式管理和配置中台。 而数据中台V3.1.0版本则重点更新了数据中台下的“数据研发平台”与“标签平台”模块。其中,数据研发平台新增项目管理模块、离线研发模块和数据资产管理模块,简单理解就是让企业的中台开发者可以自行设计和管理数据模型。数据中台的建设具有一定的技术壁垒,并非所有企业的技术人员都可以进行数据资产管理和数据模型开发等工作,而且数据中台的建设周期通常也比较长,数据研发平台的增强就是让企业普通技术人也可以进行数据质量管理、数据模型设计与开发等数据工作。 云徙数字商城系统(i-Commerce)V3.1.0版本中,新增了社区团购模块,包括城市站运营、社区团长招募、团长推荐关系、团购分享、发货单管理、佣金结算、提现微信等功能。云徙社区团购产品通过社区团购业务与商城标准B2C/BBC模式的相互结合,支持以城市区域划分进行独立的电商运营,可为企业搭建满足社区生活的电商平台。 还值得一提的是云徙数字化研发服务平台(i-DP)自去年发布1.0版本后就不断充实功能,已经形成了采用开源技术体系和微服务架构打造的一站式研发系统。利用云原生技术、集成开源系统构建工具链,i-DP为企业提供从项目管理到应用上线的全流程研发管理能力,推动团队规范和串联软件开发生命周期,提升软件生产效率。 总结:本次疫情倒逼企业组织形态与运营管理方式变革,正在为企业和商业带来永久性的影响。由于客户应用场景的永久性改变,这就给以云徙科技为代表的中国企业级软件供应商,创造自己新企业软件产品品牌的机会——通过把消费互联网的快速创新能力导入给更多的企业,推动中国新一代企业级软件的强势崛起!(文/宁川)
摘要:在公共云视角下,把企业本地存储视为一整套存储与计算方案中的一个部分与环节,通过公共云对云上云下存储和计算统一管理,以满足脉冲计算、基因计算、AI与机器学习等新型计算与数据存储的需求,这就是阿里云的混合云思路。 阿里云在2019年最后一个月发布了针对混合云的两款产品:入门级混合云存储阵列SA2100以及混合云CPFS一体机,加上2019年发布的混合云存储阵列中高端产品SA2600、3600、5600以及基于容器的ACK混合云2.0等,阿里云已经为2020年混合云市场的全面激活做好了准备。 混合云存储阵列SA系列融合IP SAN、FC SAN、NAS和OSS对象存储协议于一体,而CPFS主要面向海量小文件存储场景,二者可满足企业存储的大部分需求,而SA系列与CPFS一体机都可部署在企业数据中心,与阿里云公共云无缝对接,企业无需改变现有的IT架构,就能从企业本地数据中心充分利用公共云存储易于扩展、快速灵活部署的优势。 阿里云智能存储资深总监Alex Chen表示,阿里云存储集合十年的技术积累下沉服务企业级客户,从混合云存储角度推动传统企业加速上云,让传统企业客户可以放心使用本地和云端混合部署的存储解决方案,真正打通上云的数据“高速路”。 (阿里云智能存储资深总监Alex Chen) 相对于传统企业存储厂商来说,阿里云的混合云方案原生带有大规模公共云服务和实践经验;而相对于公共云服务厂商来说,阿里云更有向混合云进行投入的决心。 Alex Chen强调,阿里云对于混合云的决心并不仅仅是丰富的硬件产品和加密、安全、迁移等软件解决方案,更是诸如购买混合云存储阵列即可赠送阿里公共云服务这样的商务方案,以及刚推出的针对企业级预算型采购的SCU按量付费、灵活置换存储类型的公共云售卖方案。阿里云要用混合云,打通公共云的最后一公里。 从大数据到新数据 早在2014年的时候,业界就提出了大数据的4个V:多样化、海量、高速度和高价值。到了2019年,随着5G大规模商用的起步,大数据的时代才真正到来。然而,今天的企业不仅面临着大数据的挑战,还面临着移动互联网和人工智能所带来的新数据挑战,以及越来越严格的政府和行业数据监管要求。 在大数据方面,随着数字经济和数字社会的快速发展,企业依然面临着每年数据量剧增的大趋势。这直接导致对数据中心投资的大幅增加,根据赛迪顾问的数据,2018年中国数据中心IT投资规模达到3257亿元,比2017年同期增长17.8%,其中硬件投资占46%;而预计未来3年中国数据中心市场规模将保持13.6%的增长速度。 但是企业自建数据中心的速度远远跟不上移动互联网场景下的新型数据场景,特别是脉冲式数据现象。近年来电商带来了脉冲式数据流,特别是以每年阿里的双十一为典型代表。2009年的时候,双11零点峰值交易笔数为400笔/每秒,而到了2019年则达到了54.4万笔/每秒,脉冲式数据峰值十年实现了1360倍的增长,直接导致对各种存储和日志服务需求的十倍和数十倍增长。在阿里双11的带动下,全社会也出现了双11、双12、各种秒杀等脉冲式数据现象。 在人工智能方面,智能图像视频识别和智能语音识别的需求正在爆发,不仅带来了各类图像、照片、视频和语音数据的大规模增长,例如直播应用一天产生的视频数据量就以TB甚至PB计,而连接千万用户的智能音箱、智能语音助手等产生的语音数据更是爆发性增长。更为重要的是一个深层神经元网络的参数就可能达亿计、芯片计算量可达百亿次/秒,AI并行并发计算的特性要求大量数据交换和移动,提出了计算存储一体化或统一化的挑战。 而基因计算、容器计算等海量小文件、低时延、高IOPS、无缝快速切换数据副本等新兴数据和计算场景,以及对企业关键关系型数据的统一管理等,都对企业级存储提出了新的需求。此外,越来越严格的政策和行业法规遵从,例如2017年10月实施的新版《民用运输机场安全保卫设施》标准(MH/T 7003-2017)要求机场安保数据的存储从原来的30天升级为90天,而2018年5月的欧洲GDPR也对数据存储有要求,不同的国内外合规遵从不断对全球化运营的企业提出存储新需求。 在新兴数据及数据存储需求下,企业级存储面临着更可靠、更高性能、更灵活、弹性扩缩容和简化运维的新挑战。 公共云视角下的混合云 企业新兴的数据需求以及对于企业级存储带来的挑战,已经不能从自有数据中心存储角度加以解决,公共云视角下的混合云正在成为企业级存储创新的方向。 市场咨询与研究公司Wikibon指出,当前正在进入云的第三个发展阶段:云的企业阶段。Wikibon的调研显示,2019年将是企业开始建立具体的长期云战略的一年。而在云的第二个阶段,大数据向云迁移且建立了AI和机器学习分析等创新模式,但企业的ERP等高价值核心应用并没有向云迁移。随着新的边缘数据和本地核心数据源的出现,企业数据趋于保留在本地和边缘,相反的是云服务将移向本地核心和边缘移动。 从公共云数据中心、本地数据中心和边缘数据中心等视角下来看,混合云更多指的是包括了所有IT形态的混合IT&多云环境下的IT资源管理,而非本地存储资源的虚拟化(也就是之前流行的企业级存储虚拟化)。而所谓的分布式存储软件,也将扩展到公共云、本地和边缘计算存储资源的统一管理,也就是云上、云下的一体化。这是公共云视角下的混合云存储,与企业数据中心的存储虚拟化以及基于开源软件的数据中心分布式存储的最大区别。 传统数据中心视角下的混合云存储,将公共云存储视为补充的扩展资源,作为备份及灾备的方案;而公共云视角下的混合云存储,是把企业本地存储视为一整套存储与计算方案中的一个部分与环节,通过公共云软件对云上云下存储和计算统一管理,以满足脉冲计算、基因计算、AI与机器学习等新型计算与数据存储的需求,而这就是阿里云的混合云思路。 Alex Chen强调,在存储硬件越来越标准化的今天,本地环境下的企业级存储以及分布式文件存储等场景的创新空间已经越来越小,更大的创新空间实际上来自公共云下沉到企业本地以及云上云下的计算与资源联动。例如阿里云在国内所有Region提供了同城冗余能力,也就是上传到阿里云的数据有3个备份,分别存放于3个不同的数据中心,如果一个数据中心出现问题,另外2个数据中心还可以继续提供服务。而同城冗余存储提供了数据12个9可靠性,也就是存储100万文件到阿里云,在100万年内不会有任何的数据丢失。 同城冗余存储是阿里云对象存储OSS最近发布的产品,阿里云对象存储OSS多年支撑双11业务高峰,历经高可用与高可靠的严苛考验,其多重冗余架构设计为数据持久存储提供可靠保障,基于高可用架构设计可消除单节故障、确保数据业务的持续性。 阿里云的文件存储CPFS (Cloud Parallel File Storage),是阿里云完全托管、可扩展的并行文件存储系统,提供对数据毫秒级的访问和高聚合IO、高IOPS的数据读写请求,可用于AI深度训练、自动驾驶、基因计算、EDA仿真、石油勘探、气象分析、机器学习、大数据分析以及影视渲染等业务场景中。 阿里云的NAS文件存储则可以挂载到弹性计算ECS、神龙裸金属、容器服务ACK、弹性容器ECI、批量计算BCS、高性能计算EHPC、AI训练PAI等计算业务上,提供高性能的共享存储。值得一提的是极速型NAS是针对海量小文件场景提供百微秒级低时延和高IOPS访问,解决了传统存储云化架构下海量小文件访问出现的过大时延导致web网站访问缓慢、容器集群批量启动时并发读取配置文件卡顿、DevOps持续集成效率低下、实时日志分析文件系统负载过高等问题。 而阿里云块存储服务推出的ESSD云盘,是阿里云推出全球首个跨入IOPS百万时代的云盘,单盘IOPS高达100万,比SSD云盘快40倍,这是阿里云迄今为止性能最强的企业级块存储服务。除ESSD外,阿里云块存储类型丰富,包括SSD云盘、高效云盘、普通云盘、NVMe SSD本地盘、SATA HDD本地盘、SSD共享块存储、高效共享块存储等多种磁盘类型,满足不同业务场景需求。2019年的技术更新包括单云盘最多可保存1000个自动快照,ESSD在线最大扩容32TB(即无需停机)等。 Alex Chen介绍,阿里云存储的软件特色还包括:安全方面支持服务端加密、客户端加密、防盗链、IP黑白名单、细粒度权限管控、日志审计、WORM特性,获得多项合规认证,包括SEC、FINRA等,满足企业数据安全与合规要求;提供标准、低频、归档多种类型,通过生命周期自动化实现数据类型转换与过期管理,覆盖从热到冷多种存储场景;提供RESTFul API、控制台、多种开发语言的SDK、命令行工具、图形化工具等多种使用方式,可以随时随地通过网络管理数据等。 实际上,在过去十年里阿里云在存储方面有着大量的创新场景和创新技术,更多是与计算类型相结合的存储技术和系统创新。从2008年开始,阿里云存储在规模化,可靠性、性能和稳定性,便捷性以及软硬一体化等四个方向发展,在这个过程中积累了大量的创新甚至是自研芯片、自研协议和自研硬件以实现更加极致的存储体验。 把云存储推向企业 2019年11月,总部位于澳大利亚的动画和视觉效果工作室Animal Logic宣布正与阿里云开展合作,将本地制作内容备份到阿里云中,以满足不断增长的媒体制作需求。Animal Logic的作品包括《X战警:逆转未来》、《乐高大电影》以及《复仇者联盟2》,而Animal Logic对澳大利亚本地的公共云服务商进行了严格的评选,最终阿里云胜出。 Alex Chen认为,阿里云能在澳大利亚市场中胜出,证明了阿里云的能力以及建立了企业市场的信心。在国内市场,国内知名智能汽车制造商小鹏汽车即将采用阿里云文件存储CPFS来对训练过程中的模拟数据进行计算。CPFS不仅能解决小鹏汽车日均几十TB数据挑战,还能帮助AI系统迅速处理数据,加速汽车在复杂路况和驾驶技巧的训练速度。小鹏汽车物联网与商业技术高级总监谭蔚华表示,阿里云在数据采集、数据传输和计算处理全链条上提供了全方面的改善,帮助小鹏汽车提升了车联网技术的协同研发效率40% 以上。 在看到了企业市场的需求后,阿里云也加快了把云存储服务向企业本地数据中心推进的进程。本次发布的企业入门级混合云存储阵列SA2100,是专门为中小企业及大型企业分支机构设计的本地部署混合云存储阵列产品,企业无需更改原有的IT架构就可以像使用传统企业存储设备一样使用阿里云混合云存储阵列。而SA2100的本地存储空间和云端存储空间可以实现多副本跨区域保护,提供12个9的数据高可靠性。 混合云存储阵列SA2100提供了丰富的企业特性:在硬件设计方面,采用全冗余架构,支持数据加密、ACL及快照、卷克隆、卷镜像、远程复制等企业存储特性,与阿里云公共云存储无缝结合;在产品配置方面可扩展FC、万兆、千兆主机接口,支持最多300块SSD、SAS、NL-SAS等类型硬盘组合,精细匹配业务不同需求。 而本次发布的CPFS混合云一体机也与阿里云公共云的存储资源无缝打通,帮助企业无缝上云,实现“云下资源可控,云上弹性伸缩”的多级存储池架构。 此外,阿里云创新地引入了存储容量单位包(Storage Capacity Unit,以下简称SCU),可以用来抵扣多种不同类型云盘的按量付费账单。作为一种创新型的售卖形态,SCU让预付费企业可在不同类型存储产品之间转换,而无需繁琐、冗长的财务流程。Alex Chen强调,公共云是由互联网公司发起的,其售卖方式并不适合企业级预算型用户,而SCU正是阿里云存储对企业级客户的创新。目前SCU并不包括本地部署的阿里混合云产品,未来时机成熟时将扩展到企业本地。 从目前阿里云的混合云存储产品和服务的布局来看,下一代企业级计算架构将向着分布式和云化架构相融合的方向发展,这种所谓分布式云架构即把公共云服务拓展向各个物理位置而主要由公共云厂商进行管理、运维和治理等工作,各类集群分布在客户数据中心、边缘和云数据中心并通过统一管理而实现场景创新,当然企业对于本地部署的IT资源可以选择更大自主权以满足合规等要求。 总体来说,阿里云所推动的混合云创新还在演进中,还在根据企业级客户需求、市场发展趋势以及阿里云技术进展而不断寻找公共云服务与本地管控IT资源之间的平衡点。不过可以肯定的是,公共云服务下沉到企业本地数据中心的混合云,将是下一代企业计算架构的大方向。(文/宁川)
阿里巴巴集团副总裁周明负责阿里巴巴集团、蚂蚁金服集团,包括阿里云在内的基础设施、基础技术的研发、规划、建设、运营等。周明在2019杭州云栖大会上,深入介绍了阿里巴巴基础设施的挑战以及芯片策略,以下是周明的分享内容文字整理,经编辑。 我从基础架构的规划建设和运营者的角度,谈一下基础设施所面临的挑战,以及从基础设施角度看如何发挥整体的芯片算力及其策略。 首先,阿里巴巴基础设施的现况。阿里巴巴今天已经不仅仅是服务于电商以及蚂蚁金服的金融业务,因为有了阿里云智能也就是把技术作为业务的商业模式,所以我们服务了各行各业,服务企业有上百万家,囊括了互联网、电子政务以及金融等行业和企业。 我们有遍布全球的数据中心,也有百万级规模的在线的生产服务器,是全球前五大的服务器规模。这么大的规模一定就会给带来非常多的挑战,挑战有技术的、也有非技术的,接下来简单讲一下面临的挑战以及做了哪些方面的工作。 首先,我们服务器从10万到100万(百万级),当然今天还没有哪家公司有1000万规模的服务器,千万级规模遇到的挑战肯定是不一样的。当在线生产服务器到达10万的时候,一定要考虑在百万级的时候应该遇到什么样的挑战;同样,当到达百万级的时候,就要考虑千万级将遇到什么样的挑战,技术挑战和运营挑战都是什么,这些都是需要值得我们思考的。 从技术上简单讲一下,我们一定要考虑技术竞争力。首先技术要有先进性,另外还有考虑TCO的成本,如果不考虑成本问题的话,肯定不可能大规模应用。没有大规模应用的话,就认为是技术的自嗨,所以在这里考虑的事情就比较多了,比如考虑大规模的在线管控,肯定不可能人工管理而要高度的自动化,这就可能带来很大的风险,一个bug或故障很可能就会被放大,到底要怎么做,大家可能很多时候就会忽略供应链。 今天阿里巴巴在全中国的一年新增服务器,占到全中国增加服务器10%以上的时候,可以想一下一年增加几十万台服务器是什么概念,可能几天之内就要有多少万台的部署(高峰期时候),供应链就会带来挑战。 我们曾经有过经历,服务器可能要两三个月才能到货,因为用量大,不是几百台、几千台。现在基本上从开始下单到最后可以用,10个工作日就可以全部搞定了,这是我们认为比较经济的时间。 这里其实有非常多的技术考虑,包括如何通过算法做好预测等,包括运维管控中出现的故障、怎么解决用户的期望等。 大家都知道,今天云的客户最希望不管基础设施,只管做好业务就可以了。不管是什么概念呢?就是说这个设备永远不要换,潜台词就是永远不要出现一个故障,最好让客户不知道,但很明显是不太可能的。 另外,资源永远是需要的时候就要有,最好不要告诉客户说服务器没有了、资源没有了、数据中心没有了等等,这个其实也很难做到。 站在我们的角度就要考虑这么多的挑战。 同样,回到今天的话题“算力”,大家都在讲摩尔定律遇到的挑战,计算力是未来。我作为一个基础设施的技术研发、规划工作者,认为计算力绝对不仅仅是计算力,它涉及到计算、存储、互联,涉及到数据中心如何进行有效地结合。 今天阿里巴巴作为互联网企业,更多体现在整个集群上要考虑的事情,就特别多了。比如大家今天都在做异构计算GPU、NPU,这些算力如何与CPU进行搭配是最合理的? 同样,今天大量的数据在计算时需要搬运,搬运数据的时候一定会遇到带宽等问题,也要考虑到搬运数据的过程是否在意延时。 像今天做存储,如果是分布式存储,很明显需要集群网络的性能,这时候网络延时就很重要了,大家都知道TCP/IP协议不太适合低延时,那就要考虑到底是要利用现有的低延时网络协议如InfiniBand、RDMA,或是今天自研一个低延时的网络协议,包括拥塞控制的算法,这些都是非常有技术含量的。 应用中还遇到一些问题,比如今天的互联网公司希望做一个10万台规模的服务器集群,因为它可扩展、利用率高,相当于可以提供很多资源。 网络人员会说,数据中心只要能够承载这么大规模的服务器,网络都可以搞定;而数据中心人员会说,只要网络能搞定,其它都没有问题。 但真正要做的时候,遇到的问题就非常多了。比如从数据中心来讲,最容易想到的是供电,还要考虑每一个机柜多少千瓦最合理(结合应用)。同样,对网络来说,网络设备成本已经占到50%以上,这时候就要考虑到底是全部用相对比较昂贵的长距模块(最简单的),还是通过部署让网络设备更加合理,用的模块距离更短一些、成本更低,整个TCO更有竞争力、每个端口的成本最合理,这些都是需要考虑的。 接下来,简单讲一下阿里巴巴在这些领域里做了哪些工作。 首先,算力方面,平头哥提供了NPU芯片。同样,作为一个互联网公司,大多数时候在基础设施里还是会使用合作伙伴的技术,因为重点在于整体架构、整个系统设计,如何获取最高的能力。所以,我们也会定制化,包括FPGA。今天阿里巴巴在搜索业务上,以前的搜索用的是GPU,而GPU相对比较昂贵,我们在搜索业务用FPGA进行卸载,其实非常不错,但唯一一点就是可能经常会有算法的改变。大家都知道,算法一旦变,做个FPGA、RTL,尽管比ASIC要快,也得花两三个月的时间。这时候我们做了一个编译器层,包括专有的指令集,把一些基本算子先写好,当算法有变化时通过编译器就可以快速地应用新算法。 这样的话,就可以从以前的两三个月,很快缩短到几天的时间,其实现实中甚至不到一天或半天就搞定。 讲一下连接,连接其实贯穿了整个数据中心。从芯片来讲,服务器总线协议、机柜级连接、集群连接等,都需要做非常多的工作。 今天讲一下从节点到集群的工作,中间是今天发布的自研400G DR4硅光模块,硅光模块到今天为止还没有发布400G的。硅光模块有非常大的优点,比如把比较大的光器件做成硅光芯片,这样就能让硅光芯片象集成电路一样,可以快速地设计并且制造,体积更加小而且成本在大规模生产之后会降低,但挑战非常大,包括技术和生态链条上的挑战。如果做光芯片的,肯定会非常知道这里面的艰辛,但阿里巴巴做了并且做成了。我们今天发布以后,大规模使用可能会在明年的下半年。 再往上是DCI通讯,再往上讲一下网络集群,其实是用自研的交换机和OS来组成新的HAIL 2.0集群架构,这个集群架构抛弃了以往的商用交换机架构。 商用交换机核心是机架式核心交换机,我们全部是自研的交换机,自研NOS的好处是规模可以做到很大,可以做到10万台规模以上的集群,同样扩展能力也非常高,就是扩展非常方便。再者比较智能,可以像服务器一样来管理交换机,所以可以自动化的上线。 基本上我们的网络就是自动上线、自动变更,遇到故障时基本上实现的是3分钟恢复,就是1分钟发现故障、1分钟定位、1分钟恢复,这在传统网络设备里还是非常大的挑战,但正是因为我们今天做了这些工作,才有了这样的一个结果。 再讲一下存储,去年我们发布了AliFlash V3版本,自研的SSD也支持了Open Channel的SSD,今年已经大规模用上了。支持Open Channel SSD的好处是通过本地的存储软件,可以直接对SSD进行更加底层的操作,性能更好。同样,AliFlash V5.0也在研发中,会做一些净数据的存储和计算。 同样,我们在服务器领域里也做了从部件到整机服务器架构优化的设计,这是新一代的云服务器玄武,它其实也是一个模块化设计,就是在服务器硬件层面是模块化的,可以自由地组合、组装,通过不同的组装之后可以满足不同需求,比如不同规格的计算或存储服务器,从硬件层面都比较方便。 同样,我们也做了边缘云服务器,主要目的是为了快速交付并且快速上云。 刚才讲到了存储、计算、连接,还有一个很重要是数据中心,阿里巴巴在数据中心一直做了很多探索,前两年在千岛湖里做了一个从湖底抽水制冷的数据中心,它的好处是比较环保和节约成本。我们在张北也做了新风自然冷,也是非常环保和节约成本的,但张北还做不到365天,因为有时候与空气质量有关系,因此差不多有300天以上是自然风冷性能。 由于今天数据量越来越大,数据处理也越来越复杂,芯片功耗也越来越多,大家都面临着功耗挑战,这时候就要求单机柜的功率密度,甚至有时候要求高功率密度的机柜,所以我们研发了浸没式液冷的数据中心,今天已经在张北部署了世界上最大规模的浸没式液冷数据中心,我们即将部署在杭州的差不多有两三万台规模的浸没式液冷数据中心。不仅仅是功耗问题,我们也在考虑如何能够把浸没式液冷作为普世性的数据中心。 回到算力问题,架构会带来非常大的改变,会带来E级计算能力,事实上我们也通过各个团队的努力做了512片的训练集群。我们在数据中心领域,在低延时网络、计算、存储、编译器、AI算法等努力下,这个集群取得了很大的效果。 举个例子,比如以前做的拍立淘,之前做一项训练可能需要花两周,而用这个集群可能几十分钟就能搞定了。同样,以前我们做不到100万的分类,今天用这个集群就做到了这么大规模的分类。 总结下来看,计算能力线性的增加是有技术含量的,这个技术含量是需要各个专业深度配合,并且这是有业务价值的,体现在两个方面:一方面,以前需要花很长时间,今天可以很短的时间搞定,让业务快速迭代,尤其互联网快速迭代业务、快速试错非常重要;另一方面,以前做不到的事情现在可以做到了,比如Google发布了一个模型,很多原来根本就没法算,但对我们来说就不是问题。核心就是一点,计算能力线性增长是有技术含量的,也是有业务用途的。 今天我们团队提供的不仅仅是技术,还提供的是生产7×24小时服务,意思是说不仅仅是提供设备,也不仅仅是提供技术本身,而是要提供用于生产的服务。这时候就要管控了,我们做了一个数据中心大脑,干了什么事情呢?首先,是对服务器、网络、机电设备等进行很好的管控,从交付到业务处理,一旦有了故障可以快速恢复,从最开始人工到数据化,从数据化到自动化,从自动化到智能化。其次,是数据中心日常运维现场人员的管理,IT人员、电力设备人员、空调制冷人员等,怎么进行日常工作、做哪些工作,这时候让数据中心大脑提供决策辅助,提供最优决策。举个供应链例子,通过智能算法做好精确的预测,让整个交付准确率很高。 最后,回到今天的主题,阿里巴巴基础设施和芯片策略,芯片非常重要的,没有芯片的硬核计算能力,实际上很难有这么一个未来。 但是要把芯片能力完美地发挥出来,需要各个专业能力包括架构能力等。同时,阿里巴巴也不是所有事情都自己做,我们也坚信不管从应用到系统还是部件到芯片,也要有合作伙伴一起来发挥各个专业能力,从而获得整个系统最优的架构。 最后讲一下,所有这一切都是在客户需求的价值驱动下做的。必须回到我们做的事情到底对客户的价值是什么,解决客户的痛点到底是什么,否则一切都是技术自嗨。(文/宁川)
魏少军是清华微纳电子系教授,在2019杭州云栖大会上,他分享了“人工智能时代中国芯片设计的应用之道”,以下是他的分享内容文字整理,经编辑。 现在每个人都在谈人工智能,我一直研究芯片的架构,所以对芯片架构情有独钟,当看到人工智能的时候,第一个想到的就是人工智能芯片的架构是什么? 回过头看,对深度神经网络的研究可以追溯到早期(上世纪80年代),诺贝尔生理学和医学奖获得者David Hunter Hubel发现了视觉神经、神经元、突触,他想象了突触和神经元之间是怎样连接的。 因此,找到了一种似乎看起来可行的,通过一个节点表示神经元,通过节点互联表示突触,并用其上的权重来表示突触的通与不通或半通,因此形成了所谓的人工神经网络,进一步形成了深度神经网络。 今天我们说“无产业不AI,无应用不AI,无芯片不AI”。ARM公司院士Rob Aitken曾谈到,从Cloud的Big ML到Edge的Medium ML再到物联设备的Little ML,大概各有两个数量级的差距,从10的8次方到10的12次方。另一个角度看,从实际现实的信号输入到云中的结构化数据,中间也需要大量的过程。因此可以看到,从云上的AI到应用上的AI可以说是无所不在,只是目前更多还是在考虑云上的AI。 乐观预测,到2025年的时候,深度学习芯片市场将达到663亿美元。2018年,主要是GPU占主导地位;到2025年的时候,以专用目标作为主要目的芯片数量会远远超过GPU等通用芯片。这至少说明了一件事,就是AI芯片到2025年将具备巨大的市场规模(600亿美元以上),全球现在芯片市场也就是4000多亿的规模,所以到2025年将有1/6由AI芯片主导,所以影响是非常大的。 人工神经元等神经网络的机理其实是加权和,也就是各种层次的加权和,这样的结构要去真正完成计算任务,就需要很好的训练(通过数据的训练),找到权重的数值,最终形成训练的结果,以指导最后的推理计算。这看起来好像很简单,但它孕育着巨大的问题,即它需要巨量的计算能力,也就是算力。不同的人工神经网络适配不同的应用,例如CNN卷积神经网络可用于视觉识别,FCN全连接神经网络可用于手写体识别,RNN循环神经网络可用于语音识别和翻译等。人工神经网络到目前为止有两个问题还没有解决:一是算法仍在不断演进,新算法层出不穷;二是一种算法对应一种应用,没有一个统一的算法。 如果要去设计AI芯片而且在一个芯片上能够实现多种不同的应用,显然是不可能的,因为每一个都要做大量的运算,所以一颗芯片能完成一种神经网络的运算已经不得了。例如:1997年到2007年的ANN神经网络只有三层、网络参数为1万、芯片运算量为20万次/秒;2012年的AlexNET神经网络为7层、网络参数为6000万、芯片运算量为10亿次/秒;2014年的GoogleLeNet神经网络为22层、网络参数为5000万、芯片运算量为15亿次/秒;2014年的VGG19神经网络为19层、网络参数为1.38亿、芯片运算量为196亿次/秒;2015年的ResNet神经网络为152层、网络参数为1.5亿、芯片运算量为113亿次/秒。 所以,一颗芯片对应一种应用,两种应用就是两颗芯片,N个应用就要N颗芯片,这是应该现代AI芯片设计的重大瓶颈。前段时间清华大学的施路平教授在《Nature》上发表了一篇封面文章,把类脑计算与深度神经网络合到一个芯片中,引起了《Nature》的高度重视。原因在于现在做芯片之难,除了本身的高计算量之外,把AI从云推向边缘时的能量效率也成为巨大的问题。 可以看到VGG19,大概需要196亿次的运算加上同时处理1.38亿的参数,如果不考虑能量效率的问题,手机大概算一次电就没了,所以肯定是不行的。 所以说AI芯片需要高能效的通用Deep Learning引擎,它确实需要一个全新的算法,传统的算法都不行。其实计算能力的提升并不复杂,人脑的计算能力其实非常有限,超算早已超过人脑,所以简单的追求人脑的计算能力不是目标。相反要看到,人脑和机器逻辑去比较,最重要的一点是人脑有140亿神经元,工作频率只有200Hz,传导速率以每秒钟120米的速度,由于人脑皮层有半米也就是1/4平方米,所以还是可以完成10的16次方运算。而人脑的重量为1.2-1.6公斤,而能量效率非常高(只耗20瓦),但机器以天河2号超级计算机为例堆积了很多芯片,可以实现10的34次方运算,代价是720平方米占地面积、5吨重量以及24兆瓦功耗。因此,在现实中,不可能每个人一天到晚背一个超算去工作。所以,一定要找到一种能够实现与人脑差不多能量效率的设计,当然现在不知道应该是什么样的设计。 总结一下AI芯片应该具备的基本要素:第一,可编程性,可适应算法的演进和应用的多样性;第二,架构的动态可变性,要适应不同的算法,实现高效计算;第三,要有高效的架构变换能力,变换时钟周期要很低,低开销、低延迟;第四,高计算效率,避免使用像指令这样的低效率架构;第五,高能量效率,达到10TOPS/W,某些应用的功耗要低于1mW,某些应用的速度要达到25F/s的识别速度;第六,低成本,要能进入家电和消费类电子产品;第七,体积小,要能够装载在移动设备上;第八,应用开发简便,不需要芯片设计方面的知识等。 因此,目前流行的CPU+软件、CPU+GPU、CPU+FPGA、CPU+ASIC的做法,均不是理想架构,可能需要一种全新的架构。 也正是因为如此,我们今天还没有真正实现人工智能,UC伯克利大学的Michael Jordan教授曾说过:今天所说的Artificial Intelligence其实不是AI,更多是Intelligence Augmentation或叫IA增强智能,也就是利用这些技术来帮助人类真正实现和加强智能能力,而离真正的AI还差很远。 去年3月9号,我在2018 GTIC会上提出了一个问题,当时问题的前半部分是:是否会出现类似通用CPU那样独立存在的“通用AI处理器”,如果存在的话,它的架构是怎样的?实际上我那时候心里是有一点点答案的,但我想听听世界上的大牛们是怎么说的,而当时问题的后半句没列出来,想问的是如果不存在的话,今天做AI芯片的公司将何去何从? 后半句问题今天已经有答案了,我认为是存在这样的一个通用AI芯片的,因为在过去一年当中看到太多的相关技术,给了我们很大的启示。问题是怎么去看待这样的AI芯片。 John L. Hennessy和David A. Patterson在图灵奖讲座《计算架构的新黄金时代:专用领域硬件/软件的联合设计、增强安全、开放指令集以及敏捷芯片开发》中有一个名言,叫AI等于Architecture+Intelligence,我觉得这句话还不能够很清晰地表达AI的意义,我更多认为AI等于Architecture+Innovation,也就是说要做AI的话,首先想到的是架构的创新,如果架构上不创新,按照现在的这种方式走下去,恐怕很难获得真正所需要的架构。 AI处理器现在有很多种架构,比如ASIP的Cambricon、RS Dataflow的Eyeriss、Systolic Array的TPU、Sparsity的SCNN、Flexible Bit的UNPU等,问题是这些是不是最理想的呢,现在需要认真思考一下。 为了做这个事情,我们花了一年时间做了一个路线图:横轴是Deep Learning的Algorithm算法,纵轴是Hardware Architecture硬件架构。沿着横轴有各种各样不同的DL Algorithm,可能还在不断地演进,称为“More Algorithm”;纵轴上看到有各种各样的Hardware Architecture,称为“More Architecture”,或者更时髦的词叫“More than Algorithm”。最重要的不在于这两点,实际上要看的是中间结果,中间结果是算法与硬件的Co-design。做芯片的人都知道,曾经非常崇敬Hardware和Software的Co-design,现在看来不行,而要从Algorithm入手,也就是说硬件和算法这两者要结合到一起。派生出不同的应用场景也是自然的,现在面临的是各种各样的Co-design、Co-optimization、Co-verification、Co-implementation,因此做芯片不再容易,而变得越来越复杂。 现在的实现是怎样的呢?可以分成三个阶段,当然还有第四个阶段叫AI Chip2.0。 第一个阶段,可称为AI Chip 0.5的早期阶段,那时候要实现AI应用没有任何的现成算法,所以把CPU、GPU、FPGA、DSP都拿来用了,当时关心的是能不能实现AI计算,只要能实现就好,而不关注Performance性能够不够,当然GPU的Performance最高,所以用GPU的最多。到了AI Chip 1.0阶段,开始出现像Google TPU、MIT Eyeriss等。这时候不仅仅关注了Performance,还关注了像Power Consumption、Energy等问题,都是与应用密切相关的问题。所以,要考虑一个新产品、新技术的落地,最简单的办法就是做一个专用的芯片。到了AI Chip 1.5阶段,开始发生变化了,有两个标志性的成果:一个是清华的Thinker,还有一个是Wave Computing的DPU,分别考虑的不仅仅是专用的领域,是半通用的Reconfigurable可配置的,同时能够把Training训练和Inference推理两个任务放在一起,就意味着在性能、能量、效率、功耗等之外又加了一个Flexibility,即灵活性。在这个过程中看到Reconfigurable和System是关注的重点。到这儿还是一个Semi-General,还不是一个真正意义上的通用芯片。通用AI芯片是什么呢?目前为止还没有看到,它应该是一个通用的、自适应的、智能化和智慧化的设计,其中Intelligent和Intelligence成为两个关键词。 早期的AI芯片更多在考虑训练,像云端更多是训练计算任务,因为云端的计算能力足够强,找到那些权重参数要花费很多的算力。后来要通向终端应用的话,要有Inference能力,未来的芯片应该不分Training与Inference,应该两个都包含在其中,因为有可能在终端也要做Training和Inference,最终能不能实现也要拭目以待。 我们看到从AI Chip 1.5阶段开始出现了一种新的架构,是可配置Reconfigurable的,其实这个技术早就出现了,它在1990年就出现了,中间经过了90年代的发展期,后来又高速发展,到现在为止人们突然发现它可以用来做AI芯片。Wave-Computing就是采用了这一结果,只是它用的是静态任务。 第二种称之为软件定义,可以把软件的可编程性和硬件的可编程性定义为两个轴,尝试着把现在已有的芯片往入四个象限,例如CPU、DSP等以软件编程为主的在第二象限中,第三象限有ASIC和SoC,第四象限是FPGA和EPLD,问题是第一象限是什么呢?并不知道第一象限是什么,这就找到了一个全新的路径,第一象限应该空间可以发掘。我们称第一象限为可重构计算的芯片或叫软件定义芯片,通过软件来定义硬件的架构和功能,而且是实时和动态的定义,这样就可以解决算法在不断演进、硬件功能不断变化,如何适应算法的变化和算法的选择。通过这种方式,清华也做了重要的尝试,比如Thinker,这是一系列可重构神经网络的计算架构,这个计算架构用的是一种与其它理论不太一样的思路,它具有跟ASIC差不多的性能,但具有CPU一样的灵活性。 去年年初,MIT Technology Review专门写了一篇评论文章,对清华的这颗芯片进行评论,认为中国取得了一个宏观级的成果,这颗芯片我们今年把它推向市场以后,也成立了一个公司,今年大概已经可以到千万美元的量级、几百万颗的订单了,一下获得了很好的机会。为什么很好呢?因为它的能量效率极高,绝对功耗又极低,用它进行语音处理的时候只有200多个微瓦、0.2个毫瓦,一节电池可以用一年,用于人脸识别时大概6个毫秒可以识别一个人脸,而且同时可以识别很多的人脸,识别率高于人的识别,而每一个识别的功耗只有12毫瓦。 最后,一个更为理想化的想法是怎么能够让芯片变得更智慧一些,刚才信息化最终都想能够实现智慧化,什么叫做智慧化?需要具有自己学习的能力。人类通过接受教育、通过学习,变得与众不同。所以,学习和教育或者训练和推理,很可能起到重要的作用。设想一下,如果芯片也可以通过学习和接受教育,那是不是这颗芯片能变成越来越聪明呢,变得与其它的芯片不一样呢?如果能做到这一点,芯片的智慧化就至少有了一点点眉目。 我们给出一种可能的智慧芯片架构,大家可以看到它包含了可重构的内核加一个训练内核,同时有很多On Chip或On Device的Compiler软件,其它新设计包括Algorithm和Software的进化,当然最难的是怎样甄别软件和应用,这是可以实现的。经过时间的推移和技术的不断推进,相信这个问题可能可以实现的。 如果看架构的主要功能,可以看到三个红色的部分,现在看起来最难突破,也是最后才能突破的,也就是如何根据应用来定义一个或找到一个最适合的神经网络。通过应用定义的神经网络去找到对应的软件,这又是个难点。当然,怎样把数据抽取出来进行训练以及进行推理,这也很难。这个问题可能不是今天能解决掉的,但未来可能可以解决。 蓝色的硬件方面,至少知道该怎么做,从Reconfigurable Processor的角度是可以说清楚的,Training Engine只要性能足够高、能量效率足够高,也是可行的。 剩下绿色要解决的是比较难的。第一个叫On-Chip Compiler能不能做到,而且这个Compiler应该是具备一定智能化的Compiler,这个事情本身就是个难点。更难的是Software Evolution也就是软件的自演进,怎么能够让算法和软件自己演进,而不是简单的改参数,而甚至是自己编程,可以对架构进行变形,架构变形后再自动产生相应的算法,算法再产生软件,这样一个过程能否智能化?如果这个过程能够实现智能化,就认为向前迈了一大步。再把刚才红色的问题攻破以后,AI芯片就具备了初步的智慧功能,可以通过不断地训练和使用过程,不断地自我学习,变得越来越聪明,越来越适合应用。 设想一下,当有这样一颗芯片用在阿里云中,想换掉这颗芯片的难度都会变得非常大了,因为换掉它要付出巨大的代价,所有的训练和学习都浪费了,因此一定会想办法把“知识”传递下去。 这样的智慧芯片,除了刚才讲到的人工智能芯片所具有的特性之外,更重要的是以下三点:学习能力,接受教育,成长能力;算法、软件的自主演进能力;自主认知,自主判断,自主决策的能力。这三点都是难上加难,需要真正意义上花费大精力去实现。当时,讲技术、讲芯片、讲算法,再多也没用,应用是真正要解决的问题,AI芯片最大的障碍不是技术问题,是如何落地的问题。今天要甄别一个AI能不能有实际应用,真的很难。 列出一些应用来,它们可以用AI去实现,但十有八九不用AI也能完成,甚至完成的更好,这时候AI的压力就变得非常大。那么,到底哪些应用需要AI?需要AI帮忙解决什么样的问题?什么是AI的“杀手级”应用?以及什么样的AI应用是我们每天离不开的?如果把这些问题搞清楚,也许就知道如何去发展真正意义上可用的AI芯片了,那时候AI就真正的来临了。(文/宁川)
阿里巴巴达摩院高级研究员金榕以及含光800设计者、平头哥研究员焦阳在2019杭州云栖大会上,深入介绍了含光NPU的算法与架构。以下是金榕及焦阳的分享内容文字整理,经编辑。 金榕:首先,深度学习在所有领域都发生了质的变化,一个很明显的例子是语音识别从最初的需要依赖用户语音到今天基本上随便做一个语音输入都可以很成功,视觉是另外一个非常好的例子,今天深度学习可以从过去只能几百类或者上千类的识别到轻松几百万类甚至几千万类的识别,并且有很高的精度。 同时,今天看见在市面上有很多视觉识别公司,利用了深度学习技术,把视觉技术真正地应用在各种产品上,比如人脸识别就是非常成功的例子,非常值得一提的就是阿里城市大脑,利用视觉技术自动监控交通和安全的行为,使得视觉分析不再依靠原先的特殊设备,从而能够广泛地应用在城市的各个角落上。 自然语言和翻译严格意义上是深度学习较晚进入的领域,但是今天深度学习对这两个领域产生了质的变化。如果大家有幸用过以前的谷歌翻译和今天的谷歌翻译,可以看到非常本质的区别,其中最主要的原因就是由深度学习带来的。 简单的科普,要想把深度学习技术实用化,至少需要考虑三件重要的事情:首先要定义要学习的函数,这就是今天神经网络做的事情;第二是需要很多数据,也就是大数据;第三就是优化的问题,需要在定义的函数空间,利用数据找到一个最合适的解,从而最佳适配数据。 今天,深度学习真正实用要至少克服两大挑战(从计算的角度):第一是如何让复杂的模型更高效率和高效能运行;第二是模型需要吞吐大量数据,如何在大量数据量呑吐的情况下还能保持很好的实时性。例如,就深度语言模型而言,今天非常流行的BERT language model,几乎成为所有自然语言处理核心的模型,而今天实际上用的Bert模型还是平均的Bert模型,但它至少有几亿的参数,如果采用大型Bert的话,至少参数要翻一个数量级。 另外一个跟自然语言处理有关的就是机器翻译。今天机器翻译一般都是用Deep Transformer的结构,这是一个非常深的至少60多层的结构,它为了更好捕捉上下文信息,需要所谓的Multi-head Attention机制,这些都让模型极其复杂,使得运行模型的计算成本非常高。 而在语音识别中,最近几年一个大趋势叫做End2End语音识别模型,与过去的区别是什么呢?早期的语音识别模型都是先识别发音,形成声音模型(Acoustic Model),然后再把发音转变成句子(Language Model),但今天由于计算能力的大幅度增强而只需要一个流程即可,从语音输入直接到整个句子输出形成End2End模型。一般来讲,一个End2End的模型至少是几十个G大小。 说完了模型的大小,再提一下数据的问题。今天阿里有很多场景都需要用AI技术来支撑整个业务,而今天的数据量也是过去无法比拟的。以翻译为例,翻译在今天阿里很多跨界业务中都起着核心作用,包括阿里很多海外业务都需要翻译,就是把中国的商品翻译成相应国家的语言。每天大概需要翻译一亿+的商品,通常需要21种语言的翻译,每天翻译的调用量在10亿的级别,是非常大的使用量。 诸位也许有机会用到拍立淘,这是一个非常简单的产品,对任何有兴趣的物体拍一张照片,系统会自动识别这个商品并链接到商品页面,拍立淘大概每天有2000多万的用户、每天上传图片至少是4亿到5亿,需要一个极大的计算引擎去处理这么大量的图片,而且这还是在线的用量,离线处理量更大、约在百亿级别的水平。 另外一个值得一提的数据就是遥感影像数据,例如进行某地遥感数据分析,包括路网信息、建筑信息、地貌信息等等,浙江一个省可能就需要2个GPU、8天的时间才能把所有需要处理和识别的任务处理好,即使是一个小园区也需要好几分钟才能把其中的建筑、地貌以及地图识别出来。所以,可以想象如果扩展到整个地图,将是一个海量工程。 今天作为阿里的AI核心团队,面对这样的计算挑战,面对大数据的问题,我们做了不少工作,包括大量的推理加速工作,一个主要努力是模型压缩,例如对Fully Connected Network(FCN)可以试着去掉一些连接等,从而减少计算量,提高计算的吞吐能力。 我们还在做所谓的低功耗图像识别,这时候需要设计design神经网络架构的搜索方式,找到更合适的神经网络架构,从而更好的完成低功耗识别。所有这些都有一个问题,那就是所有的改变都发生在软件层和算法层,而如果没有底层硬件层的支持,这些改变也不会发挥最大效果,一个最突出的例子就是Sparse Connectivity,大家可以看到如果把神经网络算法从全连接Full Connected变成稀疏连接Sparse Connectivity的话,从理论上应该可以得到很大的加速,但是如果没有底层硬件的支持,这样一个加速将会受限。 由于这些原因,我们跟焦阳的团队合作,希望能够把上面最好的神经网络算法结构与底层最好的硬件支持结合起来,从而交付一个最强大的计算引擎。所以下面请焦阳介绍含光800芯片。 焦阳:我们团队在设计这款NPU的时候,能够在比较短的时间有比较大的进步,实际上在很大程度上是与阿里巴巴达摩院算法团队合作(金榕、华先胜、王刚等),团队在人工智能领域有多年的积累,如果没有这种积累就很难想象NPU会在很短的时间迅速找到方向,包括到底要怎样的设计、要解决什么样的问题、要设计什么样的架构才能突破传统的CPU和GPU优势,以及怎么样通过软硬件一体化的方法找到一条新的道路。 我刚加入阿里的时候,实际上一段时间比较苦恼,就是做什么样芯片以及怎么做的问题,在达摩院算法团队的帮助下,比较快地渡过学习曲线。 算法角度不仅是一种对人工智能算法的理论研究,也做了很多实践上的探索。入手的时候,要对神经网络本身以及业务算法有很深入的了解,这种了解如果没有阿里达摩院团队在之前的时间积累是不可能达到的。 当初在做这款NPU的时候几个重要的思考点:一是为什么要做一个云上的大芯片,云上大芯片的考虑是什么呢?阿里巴巴云计算是快速增长的业务,在国内是属于非常领先的位置,云计算是我们的强项。所以,通过硬件设计如果能帮助云快速地拓展业务、降低计算成本、提供海量计算能力,实际上是非常核心的一步。尤其在今天云计算业务的前提下,需要硬核往下走,否则很难在算力提升和成本下降方面有很大的突破,这是当时考虑的一个点。 大芯片考虑是这样的,我们希望在一个很高算力的水平上做一款NPU,而不是做一款中端或者低端的芯片,这个考虑是什么呢?最重要的目的是阿里巴巴的芯片不是短期的商业化或者销售片,更多是要赋能将来真正实现技术突破,把云计算的成本降下来。 而与算法团队的合作,让我们也意识到真正能把算法和软硬件一体进行设计,必须要解决算法中的一些痛点,这些痛点是什么呢?包括刚才金榕老师提到的像Bert这种大模型,在算力和存储等各方面的要求非常高,传统的计算平台很难满足这样的需求,所以必须要通过一个较大算力的芯片,才能真正能帮助业务往前走。 商业模式是非常重要的一个思考,我们不是单纯做技术,更多是商业模式的考虑。商业模式就是怎样通过技术带给业务一种新的能力,这个能力是什么呢?就是能够实现新的功能或别人没有做的功能或者以前因为硬件限制等种种原因没有做的功能,要通过芯片技术帮助到业务,这是我们的想法。 另外再就是第一颗芯片为什么要做一个推理(inference)芯片,而不是训练(training)芯片,我们当时跟算法团队一起讨论下来的结论是说无论从阿里巴巴还有整个业界来看,一个很强的趋势是当training到一定程度时,真正下一步实际上更多的是inference,尤其在云上的inference,我们认为是非常重要的一个开发领域。 第一款NPU的主要目标业务,像城市大脑这种业务,包括视觉、视频分析等,这些业务有一个重要的特点是在提供算力后能大幅提高计算效力,让业务量达到一个突破,从而给云计算增加更多的流量,无论是用户流量还是计算量的增长,这才是真正解决通过硬件设计来帮助业务发展的目标。 第三,我们当初考虑到底做什么样的加速,阿里巴巴与其它互联网公司不一样的地方,像传统的互联网公司都会做搜索、广告等业务,是比较传统的互联网模式,而阿里巴巴除了有搜索和广告业务之外还有更多丰富的其它视觉类的业务,比如淘宝图片搜索、智能城市、智能工厂等应用,是更多CNN类应用、视觉类的应用场景。 这些算法牵扯到CNN算法以及DNN加速,我们通过业务上的了解之后,决定了CNN的加速可能对NPU是一个重点方向,同时要保证比较好的通用性,能把芯片扩展到将来新模型的适配。 那么,这款芯片结合业务上的思索,主要的特点是什么呢? 针对CNN类的,我们加速所有的卷积类,包括各种各样的卷积、反卷积、孔洞卷积、3D卷积等,还包括插值和ROI等;这些无论在分类网络、分割网络还是检测网络,都是常用的算子,我们对这些算子做了特殊的优化。 同时我们观察CNN网络,从ResNet逐渐发展到一个更复杂的网络结构,包括后来出现的Mask-RCNN和DeepLab这样的分割网络,从整个网络架构做深入分析,提炼出来架构上的特定优化策略。 我们的架构里还提到了重要的一点就是低延时和高能效,这个通过什么实现的呢?通过数据结构进行了特定分析,让数据在存储和访问的时候有非常高的效率,减少对内存I/O的需求。这块尤其对CNN类的卷积操作进行了很深入的优化,对数据进行复用,存取后进行指令算子融合,这样保证在单位内存访问下可以大幅提升计算密度,这是主要的创新。 第二,结合与算法团队合作的模型压缩和量化处理,这部分基本上用一种比较创新的办法,就是对整个全神经网络做了量化处理,对神经网络中间的激活函数等计算,在保持比较高精度的基础上,在存储上把精度降下来,这样可以减少内存带宽,这些都是我们在架构上的尝试。 第三,在通用可编程上做了尝试。当初设计架构的时候有一些新的网络算法还没有出现,包括后期看到的Mask-RCNN、DeepLab等,还是后来搜索用到的新型网络;我们在设计阶段经过算法上的尝试,保证了整个架构有一定的扩展性。 在高精度部分,混合精度也是一个主要的特色,混合精度8比特量化加速,主要处理CNN类的网络,对其它的非CNN神经网络需要比较高精度,我们增加了INT16的量化加速,同时有一个比较高精度的浮点向量处理器,包括激活函数、向量处理等都是用比较高的浮点运算支持的,这样保证架构在设计完成之后,对非CNN网络的适配,精度都可以达到需求。 含光NPU的板卡散热设计,将来在阿里云的部署上会采用被动散热的板卡,这样可以减少板卡的体积,进一步降低成本。在服务器里面,展区有插着8卡NPU的服务器已经跑起来了。含光NPU的整个版图,可以看到是4个核的设计,整个面积接近170亿晶体管,是TSMC12纳米的工艺,采用PCle 4.0。 我们通过比较有效的片上压缩处理和流水线的处理,目前在PCle 3.0已经达到今天78000的ResNet成绩,说明带宽还没有用完,还有一倍的带宽可以用,目前已经用PCle 3跑到了峰值性能了。 大家看到含光800是4核设计,中间有命令处理器和高速互联的4核之间的网络,4核完全是同样的设计,这样设计的好处是可以在设计之后,由于良率提升的需求,可以任意四个核心有一个或者多个核心出现坏损的情况下,还不会影响整个芯片的工作,这也是我们在架构设计时特别处理的。 每个核的设计有什么呢?包括有本地内存local memory,非常接近Tensor计算核,也就是计算尽量位于存储边上,每次读出来的data可以被高度复用,再做融合算子的计算,这就是为什么含光NPU可以把功耗降到比较低的重要原因。 Tensor Array是非常有效的,我们是INT8和INT16实现的,所以它的功耗非常低,而且设计结构与Systolic Array不一样,用FLOP数量非常少,这样对功耗也有很大的帮助。 中间是向量处理器(Vector Engine),向量处理器实际上可以提供多到Floating 24bit的精度,是非常高的精度,中间的sequencer还带有各种各样的Special Function Unit(特殊函数单元),指各种各样的激活函数,比如Sigmod、LogEXP等丰富的特殊函数,这实际上有点类似于GPU的特殊函数,所以有一定的扩展性,将来可以支持新的激活函数。 这个sequencer讲一下,它是由一个高效的硬件决定,这个实际上在软件Schedule的基础上做了硬件的Scheduling,是一个多方式的机制,可以看到在做Tensor Core Operation的同时还会做Bias Normalization,以及Special Function激活函数,这样可以用pipeline的方式并行处理。 看一下Resnet50的分数,强调一下我们有两种模式,一种叫高性能模式,一种叫高能效或者低功耗模式,图中是在高性能模式下跑出来的成绩,在这个模式下跑分数的功耗是276W,实际上比英伟达的还算低了,其它的两个是GPU、后面两个是比较新的AI芯片。 去年我们在设计的时候有一个小的故事,我们设立了多少倍的目标,那个目标就是最左边的那个,所以已经达到去年说的目标了。 我觉得更重要是单位功耗性能。一般来做高性能的芯片,往往能效比较差。这张图告诉我们,实际上架构的有效性非常好,单位功耗下产生的性能还是比其它的几家公司芯片有很大的优势,这个是在高性能模式下跑出的成绩。 我们应用的场景有数据中心,将来也希望覆盖边缘服务器,甚至一些大型端上的应用。我们设计芯片的特点跟其它芯片公司不太一样,我们不能有很多型号一次量产出来,所以只有一次流片的机会,尽量把同样的一块芯片用到多个不同的场景,这是我们当初设计的一个理念。 解释一下,四个核的跑在数据中心里,如果一个核、两个核、三个核的芯片怎么办呢?也可以用,就用到端上、边缘服务器的场景产品,实际上功耗可以降下来,如果没有那么多核或者不需要多核的话,可以并出来那种单核、双核的配置,这样可以实现很低的功耗,75W、50W甚至25W,但是算力还是相当好的,所以还是非常吸引人的。 大家看到276W可以跑到78000,但是通过降电压降频的话,100W多一点还可以跑到53000,这是非常有效的一个模式。所以,建议大部分的应用场景是用高能效的模式。 讲一下各种落地的业务。第一个最重要的就是城市大脑,目前在交通场景有很多交通摄像头,大家看到一个城市或者小区里面有上千甚至上万个摄像头,这样对处理视频的能力和算力要求非常高,含光NPU非常适用这种场景。这里主要的业务算法是什么呢?包括这么几个部分,第一部分先做目标识别,就是目标检测,这部分算法一般是基于SSD和Fast R-CNN、YOLO这些算法,主要是检测图像里的移动物体,比如机动车、非机动车等,从图中找出来。第二部分再做Tracking,Tracking是跟踪物体跑到哪里,运行轨迹是什么样的。目前这部分还是用CPU在做,我们现在与达摩院城市大脑团队合作,把这一部分转成CNN的网络,一旦成功的话就可以把算力充分地用起来,解决CPU的瓶颈。第三部分,找到对象之后做特征提取,这部分一般是用DenseNet或者比较深的ResNet网络,特征提取后去做ReID重新识别和分类,这部分业务算法流程基本上是这样的。 第二个也是重要的落地业务,拍立淘。拍立淘用户上传商品照片,照片经过AI的处理,首先做类目检测,判断出它大概属于哪一类产品,可能是鞋子帽子之类,根据类目推测的结果做主体识别,主体识别类似于刚才讲的目标检测算法,一般都是SSD或者是基于ResNet的算法。这部分做完主体检测之后,抠图产生出搜索目标,搜索目标处理后当做搜索的主体进行特征抽取,特征抽取之后形成特征向量进行检索,与数据库里的海量商品数据做比对,找到最接近的商品,然后把商品返回给用户,大概是这样的流程。这里涉及的算法,主要三步都是用CNN类神经网络实现的,这一部分在业务上完全可以适配了,目前大概有400M(4亿)的参数,现在完全可以在一个NPU板卡上跑起来了,这是拍立淘。 广告推荐和搜索是下一步想去做的业务,这是两个很典型的MLP网络,实际上不是我们主要的优化网络,但这一步可以验证精度各方面是否达到当初的设计要求,这是我们在积极尝试的两个业务。 智能服装设计是做潮流分析,通过海量数据分析出服装的流行趋势,可以做服装设计。这用到的是一种对抗生成式的网络GAN,GAN网络现在用得比较火的是换脸游戏,里面用到的也是相同的算法。我们当初在设计的时候也不知道有这样类型的神经网络,我们最近进行适配的时候发现基本上都没有什么问题,都可以跑起来,而且性能已经达到对应GPU的大概十几倍,我们原来设计的是ResNet这样类型,基本上在GAN网络上也可以达到类似的性能了。 其它几个包括盒马,这些都是智能店的应用,智能医疗也就是大量图片处理、进行医疗的分析,这些都是一些典型的图像处理应用。 最后一个就是弹性裸金属,把NPU放到云上去,通过云售卖NPU技术。 这个是我们的软件栈,目前的应用包括视觉类、自然语言处理、推荐、搜索这样的应用,主流神经网络框架都支持了;离线做编译、优化、量化处理;以及非常高效的驱动程序,对主流框架对接做执行。 总结一下Resnet的成绩,特别想提到一点是Mask R-CNN的demo(非常酷),可以跑4个video stream的Mask R-CNN,可以全速在跑,是非常不容易的,大家都知道其他GPU,要达到这个是很不容易的。 我们现在在落地,希望在今年年底的时候能开始量产,大概给大家介绍一下这个情况。谢谢大家!(文/宁川)
中台战略是阿里等互联网公司在自身的数字化转型过程中提炼出来的方法论,所谓“中台”即把企业可复用的共享IT模块和共享业务模块等集成到一个平台上,一方面拉通和强化共享模块之间的协同,另一方面为前端APP开发提供最大化可复用的共享企业资源。本质上,中台是对企业组织架构的重构,是对企业内部共享资源的重新利益分配,因此阿里中台战略之所以成功是因为阿里的共享业务事业部得以平等参与业务而掌握业务话语权。 对于其它进行数字化转型的企业而言,同样面临着企业组织架构重新调整的过程,一方面业务驱动而不得已为之,另一方面内部利益冲突而导致重复建设,造成中台拆了建、建了拆的局面。因此,成功的中台战略:一方面需要服务于业务前端的业务创新和营收创建,通过新业务和新营收而促成中台的发展;另一方面需要服务于内部组织的不断调整和反复过程,可以容纳各种变化而不必重复的拆建,还能不断提升内部管理效率。 自云徙科技公司于3年前创立以来,就以一年一个版本的速度推进中台产品化的进程。2018年云栖大会,云徙科技推出了包括业务中台和数据中台在内的数字双中台2.0以及前端数字营销应用;2019年云栖大会,云徙科技再次推出数字中台3.0版本,新版本强化了企业用户的直接使用体验,可以很容易地上手一个成熟的中台系统,同时强化的运营能力让企业业务前端可以更好的创新创收,而中台自身也可以不断适应新需求、新变化而无需重建。 云徙科技副总裁李楠表示,目前云徙科技有几十个中台项目在开发和交付中,集中了零售、地产和汽车等三大行业头部客户的主要需求。云徙科技相当于这三大行业的共享中台,因而能够不断把握用户需求而推出新版本。云徙数字中台3.0强化了前端运营能力、业务流程可配置能力以及研发数字化能力,为企业提供了一个高度产品化、可升级的数字化转型底座。 高度产品化的数字中台 云徙科技的中台技术最早脱胎于阿里的中间件技术EDAS。阿里企业级分布式应用服务EDAS以阿里中间件团队多款分布式产品作为核心基础组件,是阿里企业级互联网架构解决方案的核心产品。然而,EDAS是一个技术难度相当高的面向互联网技术团队的平台,对于企业IT团队来说不够易上手、易用、易管理,也缺乏面向业务使用者的可视化体验。 2016年创业开始,云徙科技就一年一个台阶的速度,在EDAS的基础上开发基于自己IP的产品化数字中台。李楠强调,云徙科技对企业级中台的产品化有着坚定的信念。这相当于当年的ERP开发,ERP在某种程度上是传统企业的数字化中台,而ERP开发经历了长时间对企业管理最佳实践的总结和沉淀,再落实到一个信息化系统中。ERP的产品化是以西方企业管理模式高度成熟和趋同为前提,但也是SAP等公司对ERP可产品化坚定信念的结果。 如今,中国企业的管理和组织模式经过了80-90年代的以制造业为主的发展固形后,正在经历新一轮的重组和再造——这就是面向“互联网+”和“智能+”数字商业战略的数字服务企业。据资料显示,2019年8月,上汽集团总投资20亿的云计算数据中心项目在郑州开工,这也是目前汽车行业最大、最先进的云数据中心,是上汽“电动化、网联化、智能化与共享化”战略以及“以创新的汽车产品和服务,引领智慧出行,成就美好生活”愿景的基石。 如果说上汽这样的传统汽车企业正在大规模面向“互联网+”数字服务转型,那么成立于2017年的爱驰汽车是一家用户深度参与的智能出行服务公司,成立一年内完成三轮融资且估值过百亿,2019年上半年爱驰汽车以50%入股江铃控股并整体运营陆风汽车。爱驰汽车的IT体系既包括面向制造汽车的稳态也有面向渠道和用户的敏态。爱驰汽车的IT要支持管理效能提升、产品创新和业务模式创新,也分为前台、中台和后台三大体系。 作为云徙科技的客户,爱驰汽车信息科技总监杭瑜峰在云徙科技数字中台3.0发布上表示,中台真正的策略是期望以不变应万变的状态,未来企业业务组织变化大、既有可预测性也有不可预测性,能否用最快的方式进行迭代,而不能把整个框架推倒重来,变化的是各种业务、组织、数据交换等,这是中台真正的意义所在。对于汽车制造企业来说,未来新业务的裂变,从制造商变成类似于滴滴的服务商,这种可能性也需要不变的中台的支撑。 李楠表示,企业IT团队不同于互联网公司技术团队,企业IT团队需要高度产品化的开发平台和工具,以及大量轻代码甚至零代码的用户体验。企业IT团队更关注的是业务架构和逻辑,让技术服务于业务是企业IT团队的强需求。而当前市场上有不少的所谓中台解决方案公司都是定制化的项目开发为主,很难提供高度产品化的中台软件系统,这一方面是缺乏对于中台作为企业软件的可产品化的信念,另一方面也缺乏足够的数字化转型企业样本而无法提炼共性需求从而形成产品化中台软件。 云徙科技CEO包志刚在数字中台3.0发布会上表示,云徙科技成立三年来已经与阿里云一起服务了40多家头部客户,目前公司85%都是属于技术人员,在为客户交付的数字平台上也实现了4000亿以上的企业交易数量。除了在汽车、零售和地产等行业聚集了足够的头部客户需求外,包志刚强调与当年的ERP产品开发相比,今天的数字中台软件开发有足够的数据支撑,可以极大加速软件的开发和产品化过程。例如云徙科技为上海一家快销企业交付的一个秒杀活动,2小时之内20万套商品销售一空,不仅销售额4个亿、占全年销售额的11%,关键的是近2万多直销会员全部上线,另有97万左右的消费者在线参与了这次秒杀,这些数据前所未有的改变了企业级软件产品的开发模式。 不过,更关键的还是云徙科技对于产品化中台软件的信念。李楠强调,过去一年来,云徙科技将几乎所有的收入和融资都投入到产品研发中,这才有了今天更加产品化、模块化、插件件、可轻松定制化、高可用、易管理的云徙数字中台3.0。 中台3.0:固化数字化转型的变与不变 (云徙科技副总裁李楠) 云徙数字中台经过了早期版本、2.0和3.0的三代迭代。其中,早期版本是偏向于底层的技术版本,2.0版本则在总结企业数字化转型的变与不变并试图沉淀相应的模块,3.0则极大丰富了可沉淀的模块,面向企业用户,以可插拔模块选取和组合模块,而对经常变化的模块采用可变引擎以及研发底座予以承接,3.0版本还相应推出汽车、零售和地产三大行业版本。 数字中台3.0的核心组件依然是2.0的双中台:业务中台+数据中台。不同的是,3.0版本的业务中台总结11大业务域、105项商业能力以及6大通用能力支撑中心,是对2.0版本业务中台13个共享服务中心及10个基础组件的进一步丰富、规整和完善。11大业务域包括:用户域、会员域、营销域、结算域、商品域、店铺域、交易域、内容域、履约域、服务域和评价域;105项商业能力就十分细化了,例如有账号体系、会员成长、门店库存、盘点、三方物流、预售、秒杀、分佣等;6大能用能力支撑中心则包括:业务网关、调度中心、工单中心、通信中心、支付中心和流程中心。 3.0版本数据中台提供了7大主题数据服务、10大数据模型和3大数据服务工具,相比2.0的10大模型和8大数据服务则进一步细分和扩展了相应的模块。全新7大主题数据服务包括:商业企划助手、营销助手、智能配补货、运营雷达、老板看板、店铺健康助手、团队健康雷达;3大数据服务工具则包括智能标签平台、自助分析平台和智能开发平台;10大数据模型则有属于分析模型的用户主题、商品主题、交易主题、物流主题、营销主题、渠道主题、评价主题,以及属于算法模型的推荐模型、补货模型和预测模型。 可以看出,无论是3.0版本的业务中台还是数据中台,都是站在企业IT团队和业务团队的角度,进一步提炼和封装了相应的能力模块,让企业用户可以高效的设计和管理自己的中台体系,无论是企业老板还是团队普通成员或者具有一定开发能力的业务与技术人员,都可以找到自己所需要的组件并搭建起自己的策略。 在业务中台和数据中台之上,云徙数字中台3.0推出了面向前台运营的BOC和面向中台运营的MPC。BOC是面向平台/商家插件化的商业运营工具,在之前云徙前端应用的基础上按领域模型形成了i-CDP会员运营域、i-Marketing市场运营域、i-Commerce商业运营域和i-Service服务运营域,每个运营域里都有详细的开箱即用的工具,以辅助前端业务人员直接运营业务进行创收。 而MPC是中台的“控制台”,面向企业用户进一步提供对业务中台和数据中台的可变化的配置和管理,总体目标就是让中台也能“动”起来。中台对于企业来说是如此的重要,而一个标准化的中台显然不能满足所有企业的差异化需求,同样的一个流程有的公司可能包含5个步骤、有的公司可能是7步,而同一家企业的中台二期三期建设过程中也需要对中台的能力进行翻新,因此就有必要对中台进行可视化编排与管理。xConfig让商业能力可编排,业务规则可配置,而MPC的中台能力管理、业务应用管理和API管理则分别提供不同程度扩展、管理和调整中台的方法,此外还有xOpen中台能力开放生态让开发者和第三方参与中台能力的生态建设与运营。 在中台之下,就是此次全新发布的i-DP云原生研发管理平台。此前,2.0版本的数字中台之下就是纯技术的PaaS和IaaS,对于企业的IT团队和业务开发团队来说不够友好。一个企业往往有几十个、上百个项目在并行开发、发布、上线和下线,企业的开发团队要与业务部门进行紧密配合完成一次又一次的秒杀、限促、拼购等业务活动,因此i-DP的目标就是减少80%非业务开发时间,提高业务交付速度,提升系统的可靠性,降低90%以上人工失误操作,实现规模化作业、智能化监控、主动响应异常事件等。 i-DP云原生研发管理平台为企业开发团队提供了开发门户,在管理方面提供团队管理、平台管理和效率工具,可以定义团队成员权限、提供报表管理和代码生成工具等;通过规划与设计、业务管理、计划与跟踪、迭代开发、知识管理、持续交付等全流程满足企业开发团队的开发需求;而在运营管理和运维监控等方面,i-DP也提供了丰富的工具以提高企业开发团队的生产力。i-DP还提供了xMaker企业开发者工具,包括可视化的业务模板工具、基于元数据的实体模型管理、代码生产线可视化、零代码/低代码开发等,以提升企业开发者个体生产力;xConnector则通过配置化,可实现零代码与外部系统的对接;xRuntime是面向微服务、大数据平台和应用支撑的经验证的系统运行时工具,保障系统质量。 总体而言,云徙数字中台从最开始的一个纯技术平台,到跟随行业头部用户需求而不断提炼和沉淀企业数字化转型的共享能力与共享模块而形成了高度产品化的软件体系,对于可变化的能力则提供相应的编排、配置以及更底层的开发平台,同时能够引入第三方以丰富中台的生态,如今的云徙数字中台已经是数字化转型的重要软件品类代表。 同时,云徙数字中台3.0的出现,也意味着企业的数字化转型已经从早期的摸着石头过河到如今逐渐清晰的路径,未来数字服务企业的组织架构和管理模型也开始清晰化。数字化转型已经渐入深水区,新一代企业级数字化转型软件供应商由此浮出水面。(文/宁川)
(阿里云智能容器平台负责人丁宇) 十年前,阿里云写下第一行代码,从此开辟了中国云计算产业的先河;也是在十年前,当阿里云开始酝酿云计算理念的时候,率先提出了去IOE的思想,即IOE技术无法承载互联网海量规模应用的压力,即使能承载也成本巨高。十年过去了,今天的阿里云已经是世界三大公共云IaaS厂商之一;如今,阿里云再次全面拥抱云原生计算,以世界级的领先态势,再次主导下一波云产业趋势。 阿里云智能总裁张建锋在2019阿里云峰会·上海表示,“今年是一个突破性的时刻,云计算全面替代传统IT的拐点已经到来。”而云原生就是企业上云的关键一环。 广义来说,云原生就是基于云计算模型的应用软件开发与部署方式;具体来说,云原生技术包括了容器、微服务、服务网格、无服务器计算等。过去十年,全球企业开始向以公共云、私有云以及混合云为代表的云计算系统迁移,现在已经从简单的服务器上云和数据上云等向着围绕云计算系统模型重构企业应用的高级阶段发展。Gartner报告指出,到2022年将有75%的全球化企业将在生产环境中使用云原生容器化应用。 中国信息通信研究院指出,云原生技术正加速重构IT开发和运维模式,快速将企业应用构建和部署到与硬件解耦的云平台上,提供了更大的灵活性、弹性和跨云环境的可移植性。云原生技术能够有效解决跨云环境一致性问题,缩短应用交付周期,消除组织架构协作壁垒。阿里云智能容器平台负责人丁宇表示,全面使用云服务构建软件系统时代到来了,未来软件都会长在云上。 丁宇介绍,作为国内最早布局云原生技术的厂商,如今的阿里云已经具备全球最大规模的云原生应用实践、最丰富的云原生产品家族、国内最大的云原生客户群以及最全面的云原生开源贡献。阿里云曾开启了中国的云计算时代,未来将帮助更多企业云上成功。 阿里云云原生的四个“最” 中国信息通信研究院经过多方面研究,总结云原生的概念为“适合云的应用”和“好用的云架构”。 阿里从2011年开始,就已经开始了云原生方面的尝试和实践,这比行业推广容器还要早几年,并且在早年完成了容器化改造,容器化以后实现了统一调度、混合部署、异地多活、云上可扩展的弹性等,节省双11 75%的成本,同样利用这套技术体系节省了30%日常IT的成本,容器化和云原生对阿里的技术红利非常明显。 目前整个阿里70%的业务完全运行在公共云上,同时也将大力推广和运用云原生技术,未来两年内阿里巴巴集团的业务将100%以云原生的方式运行在公共云上。阿里认为现在是“All in”云的时代,这个过程中积累了大量能力和技术,并把能力和技术沉淀到提供的云原生产品中,从而赋能整个行业客户。 当前,阿里具备国内国内最丰富的云原生产品家族。任何一家企业想要构建或升级自己的IT系统,从而加速数字化转型和核心技术互联网化升级,都需要用到很多组件,也就需要丰富的产品体系支撑,而阿里云则提供包括流程、应用架构、运行托管、可观察性等在内的完整云原生产品体系,可以完全基于云原生体系构建IT系统。现在,阿里云提供了8类20余款产品,可以完整覆盖整个云原生软件构建需求,涵盖底层基础设施、数据智能、分布式应用等全栈技术能力,可以满足不同行业需求。阿里云原生基础设施已经覆盖全球,已经服务了规模最大的云原生客户群体,覆盖了众多的行业以及包括新兴IoT、AI、基因计算、边缘计算等在内的众多场景。 在对云原生领域开源贡献方面,阿里云也是国内最全面的贡献者,8类20个项目涵盖了整个软件生命周期,包括编排调度、作业管理、无服务器框架等,主导维护etcd、containerd、dragonfly等多个CNCF明星项目的发展,已有超过10个项目进入CNCF云原生全景图。阿里云还积极参与Kubernetes 项目,贡献量位居全球前10。而在开源生态社区方面,阿里云已经加入CNCF、OCI、CDF等基金会,成为多个基金会的顶级会员。2019年1月,阿里云资深技术专家李响成为首个入选全球顶级开源社区CNCF技术监督委员会(TOC)的中国工程师,致力于推动云原生技术的落地。2019年1月,阿里云成为国内唯一入选Gartner《公有云容器服务竞争格局》报告的企业。 丁宇强调,十年前阿里提出去IOE,如今企业上云已经成为共识,今天阿里云希望帮助企业更全面的使用云原生技术,赋能业务、创造更大的商业价值。 阿里云原生实践 在阿里云看来,云原生首先可以支持互联网规模应用,可以更加快速地创新、和低成本试错;其次,屏蔽了底层基础架构的差异和复杂性;同时,服务网格、无服务计算等新的计算范式不断涌现,给整体IT架构能力带来了极致弹性,从而更好地服务于业务。用户可以基于阿里云容器服务构建面向不同场景的云原生框架,如面向机器学习的Kubeflow和面向无服务器计算的Knative等等。 阿里从2011年开始通过容器实践云原生技术体系。阿里体量大、业务复杂,推动云原生要找到合适的切入点。在双11规模性和成本压力的推动下,资源成本与效率优化成了阿里云原生的起点。阿里从容器入手,研究低成本虚拟化与调度技术。在资源成本的推动下,阿里完成了全面容器化,并在这个过程中推出了大量成果,PouchContainer是阿里开源的高效、轻量级企业级富容器引擎技术,具有隔离性强、可移植性高、资源占用少等特性,可以帮助企业快速实现存量业务容器化,同时提高超大规模下数据中心的物理资源利用率。 刚开始的时候,阿里内部有着惊人规模的存量业务,如何通过技术快速容器化存量业务,是阿里容器技术当年的重点难题。富容器帮助业务在单个容器镜像中打包业务所需的运维套件、系统服务等,富容器模式下的应用在不改变任何业务代码、运维代码的情况下,像在物理机上一样运行。富容器在保障业务交付效率的同时,在开发和运维层面对应用没有任何的侵入性。在此基础之上PouchContainer也在拥抱开放云原生技术标准, 基于Containerd 提供了企业级的容器运行时实现。 在完成了面向成本优化的资源管理之后,阿里希望通过云原生让开发者效率更高。为了构建更云原生化的 CI/CD,进一步做到标准化和自动化,从研发到上线流程,阿里引入了诸如Helm的应用标准化管理,也尝试了GitOps这样的部署流程。同时,阿里也开始探索服务网格,进一步提高服务治理的普适性与标准性,降低开发者采用门槛,进一步推动微服务在多语言和多环境下的普及。 为了降低应用部署难度,提高部署自动化程度,阿里开始采用Kubernetes作为容器编排平台。基于Kubernetes,阿里持续对研发、部署流程进行改进。在数以万计的集群管理当中,阿里容器平台团队探索并总结了四个让交付更加智能与标准化的方法:Everything on Kubernetes,利用Kubernetes来管理一切,包括Kubernetes自身;应用发布回滚策略,按规则进行灰度发布,也包括发布kubelet本身;将环境进行镜像切分,分为模拟环境和生产环境;在监控侧下功夫,将Kubernetes变得更白盒化和透明化,及早发现、预防并解决问题。 Dragonfly是一个由阿里开源的云原生镜像分发系统,主要解决以Kubernetes为核心的分布式应用编排系统的镜像分发难题。随着阿里业务爆炸式增长,2015年时发布系统日均发布量突破两万,很多应用的机器规模开始破万,发布失败率开始增高,根本原因是发布过程需要大量的文件拉取,文件服务器无法承载大量的请求。如果采用服务器扩容,扩容后又发现后端存储成为瓶颈且扩容成本也非常巨大,而大量来自不同 IDC客户端请求消耗了巨大的网络带宽、造成网络拥堵。同时,阿里大量的应用部署在海外,海外服务器下载要回源国内,浪费了大量的国际带宽而且还很慢;如果传输大文件,网络环境差,失败的话又重来一遍,效率极低。而Dragonfly的系统架构不涉及对容器技术体系的任何改动,可以无缝支持容器具备P2P镜像分发能力,大幅提升文件分发效率。截止2018年底,Dragonfly承载了阿里全集团 90%以上的文件下载任务、日分发峰值达到 1 亿次,100%成功支撑双十一营销活动数据抵达数万台机器,2018 年 11 月正式进入 CNCF沙箱级别项目(Sandbox Level Project)。 2019年6月,阿里云容器平台团队宣布了两个社区项目:Cloud Native App Hub——面向所有开发者的 Kubernetes 应用管理中心,OpenKruise——源自全球顶级互联网场景的 Kubernetes自动化开源项目集。云原生应用中心为国内开发者提供了一个Helm应用中国镜像站,方便用户获得云原生应用资源,同时推进标准化应用打包格式,并可以一键将应用交付到Kubernetes集群当中,极大简化了面向多集群交付云原生应用的步骤;而OpenKruise项目致力于成为“云原生应用自动化引擎”,解决大规模应用场景下的诸多运维痛点。 总结Kubernetes作为云原生技术的核心,在阿里落地的三个阶段:首先通过Kubernetes提供资源供给,但是不过多干扰运维流程,系统容器为富容器,将镜像标准化与轻量级虚拟化能力带给了上面的PaaS平台;第二步,通过 Kubernetes controller的形式改造PaaS平台的运维流程,给PaaS带来更强的面向终态的自动化能力;最后把运行环境等传统重模式改成原生容器与pod的轻量模式,同时将PaaS能力完全移交给Kubernetes controller,形成一个完全云原生的架构体系。经过不断打磨,阿里在Kubernetes规模与性能上取得了显著成果:存储object的数量提升25倍,支持的节点数从5000提升到上万,端到端调度延迟从5s变为100ms等等。 经过云原生的探索与改造,阿里基础架构体系达到了现代化和标准化。通过智能调度与PaaS平台,让自动迁移应用,修复不稳定因素成为了可能,阿里通过云原生技术大幅降低了上云的难度。 释放云原生红利 (阿里云容器服务研发总监易立) 阿里云容器服务研发总监易立介绍,阿里云容器服务从2016年5月开始正式商业化,在这个过程中沉淀出核心竞争优势,包括优化整合、极致弹性和海量镜像分发能力。在优化整合方面,阿里云无缝整合超过20款云产品,让开发者和企业可以非常简单的使用云资源;阿里云容器技术与阿里云虚拟化技术进行了充分整合,提高了应用的执行效率。阿里云还提供了丰富全面的应用层和资源层的弹性能力,能够在90秒之内快速伸缩节点,对海量数据处理或者大业务流量都有良好支持,竞价实例可降低70%成本。阿里云可以支持上万节点并发拉取镜像以及镜像全球复制能力,用户只需要推送一次镜像就可以在阿里云18个region进行镜像拉取。阿里云容器服务一直保持非常高速增长的势头,过去三年在规模上保持着400%的增长速度而且还在持续。 接下来,阿里云容器还将从新边界、新范式和新计算三个方向进一步释放云原生技术的红利。新边界,即指的是云原生计算可以对云边端应用进行统一协同,特别是5G时代利用容器技术处理物联网边缘计算、AI实时边缘端预测等。2019年6月,阿里云发布了边缘容器“ACK@Edge”产品,可实现云、边、端一体化的应用分发,支持不同系统架构和网络状况下,应用的分发和生命周期管理,极大简化分布式应用分发的挑战。 新范式指的是全新方式构建、交付和运维应用。阿里云在2019年7月发布了以应用为中心的混合云2.0,可以管理阿里云和用户的私有集群,提供了统一的安全管理、资源感知和监控日志等端到端能力,并在此基础上提供统一资源管理和调度,让用户在跨集群中充分利用云资源实现弹性能力,此外还提供了智能流量治理能力,方便就近访问和故障转移等功能。前面提到的OpenKruise项目源自于阿里巴巴经济体过去多年的大规模应用部署、发布与管理的最佳实践,从不同维度解决了Kubernetes 之上应用的自动化问题,包括部署、升级、弹性扩缩容、QoS调节、健康检查、迁移修复等等。 新计算指利用新架构创造新价值。基因计算是精准医疗的基础但需要海量计算能力,动辄一次提交任务就需要数百T数据处理和计算,阿里云所提供的混合云高性能基因计算解决方案可以充分利用云的弹性能力以及对数据的调度和算法优化,使得像全基因组测序计算时间从30个小时缩短到5个小时,极大提升计算效率、降低计算成本。实时大数据处理已经成为企业数据智能化场景下最重要的计算需求,阿里云即将发布Flink on Kubernetes产品,可以在公共云和专有云以及边缘计算中统一方式进行Flink实时计算能力交付。 目前,阿里云的云原生技术服务了大量互联网、制造、金融、政务等领域企业和机构,拥有国内最大云原生客户群。 工业巨头西门子通过云原生满足了上线周期、扩容、运维等方面的高要求,仅用数月时间就完成了MindSphere基于阿里云平台的开发、部署。互联网超级平台微博的日活用户超过2亿,借助云原生搭建起高效稳定的机器学习平台,分钟级创建上百节点的GPU计算集群、秒级启动大规模分布式AI训练任务。家居行业巨头居然之家在两年前将渲染服务迁移至阿里云,通过云原生等技术服务,降低IT计算成本50%,系统可用性却提高到99.96%。 小程序是云原生应用的典型代表之一。为了进一步推广和提升云原生应用,为开发者释放云原生技术红利,2019年3月,阿里云、支付宝、淘宝、钉钉、高德等联合发布“阿里巴巴小程序繁星计划”,提供20亿元补贴、扶持200万+小程序开发者、100万+商家。阿里云还正式发布了小程序云,打包了一系列阿里云服务,特别是云原生的Serverless函数计算,可以低成本、高效率、快速构建月活百万的小程序应用。 2019年是阿里云十周年,从2009年开始首倡“去IOE”,阿里云就致力于推动中国进入“上好云”时期;而从2019年开始阿里云推出全线云原生产品家族以及大力倡导云原生计算,阿里云在面向未来十年推动中国进入“用好云”阶段。相信随着越来越多的企业从迁移上云到在云端重新构建业务,一个全面数字化的新十年将带来又一波上云高潮,越来越多的企业将转型为软件企业和互联网企业,而数字经济将成为新的经济范式!(文/宁川)
(云徙科技CEO包志刚) 当前,中国经济高速增长、经济规模快速扩张,但经济结构的优化调整却滞后于需求结构的变化与升级。中国有着完整的工业体系和日益完善的基础设施,拥有近14亿的人口规模和世界上最大规模的中等收入群体,消费结构持续升级正在形成强大国内市场。但我国的制造企业运营处于粗放式状态,高端产品与服务供给不足、个性化产品与长尾产品不能有效触达消费者,无法满足人民日益增长的高品质生活需要。 随着以电子商务、网约车、共享住宿等为代表的社会化互联网平台的发展,既带来了新模型和新业态,也带来了新型市场关系。新模式、新业态对应的新型市场组织运行方式,正在冲击工业社会以企业为核心的传统组织架构,重构经济社会运行中各方主体关系,而以社会化互联网平台为代表的新型市场关系则正在倒逼企业运营模式变革——出现了与社会化互联网平台对接的企业数字中台。 对于处于经济主体地位的制造企业来说,企业数字中台涉及三个关系的调整。在2019年6月21日的云徙科技数字创新年会上,云徙科技CEO包志刚强调:商品端到消费者端的协同,为数字营销领域;企业与员工之间的连接以及与工作的协同,为数字化企业管理领域;生产线、生产设备以及产品终端的连接协同,为工业大数据领域。其中,以数字营销为代表的企业前端与消费者及市场关系的调整,是整个企业数字化转型的有力抓手和推动力。 基于数字中台的数字营销是新型的企业与市场协调机制,也反向推动企业向精细化、高质量、高效率管理运营发展,特别是基于全域消费者和用户大数据以及打通企业内部全域业务流程的分析、决策与在线运营,在不显著改变企业实体基础设施的同时,通过软性的业务流程重组、创新与协同,持续拉升企业经营业绩,为走向未来的数字服务经济打下基础。 数字中台第二波 众所周知,中台的概念起源于阿里。阿里自2008年开始了“大中台、小前台”数字化转型,从2009年开始建设共享服务中心,打通淘宝、天猫、1688等三套前期建设的“烟囱”式电商系统,从共享业务、共享数据和共享技术平台等层面,对整个阿里IT体系进行了变革。以阿里为代表的社会化互联网电商平台以及阿里电商和中台技术最早对外输出的大型企业电商平台中石化易派客、茅台电商等,是数字中台第一波拥抱者。 自2016年云徙科技成立开始,作为阿里中台模式和技术对外输出的合作伙伴,云徙科技开始探索如何为企业批量化复制阿里中台。2018年8月,阿里云首次发布“双中台+ET”数字化转型方法论,2018年9月云徙科技宣布获得1.5亿元A+轮融资,同时推出数字双中台战略:业务中台+数据中台,进一步产品化中台技术。其中,业务中台让企业像搭积木一样快速搭建前端互联网业务,数据中台则让全域数据沉淀到统一的数据平台上,打破了不同业务部门之间的烟囱式IT架构和数据孤岛,业务中台与数据中台联动形成用户的数据化运营。 2019年6月21日的云徙科技数字创新年会上,包志刚强调云徙科技在成立至今三年内探索了不同行业的数字中台建设和数字营销转型,在前期积累的40多家头部企业客户的基础上,选择了进一步聚焦于快速消费品、房地产和汽车三大细分制造行业,作为进一步推动数字中台与数字营销普及的下一个“主战场”,或可称为数字中台第二波。 这三大细分制造行业,有着共同的特点即都需要运营高黏度客群:快速消费品的复购率高,特别是单品消费金额较低、消耗迅速的子行业,容易形成高黏度客群;房地产商则需要围绕小区,把已购房业主转换为会员和粉丝,围绕业主需求展开周边业务,包括旅游、教育、医疗、商品等,形成新的可持续商业模式;而汽车企业一方面需要为车主持续提供保养服务,另一方面可以围绕车主群体进一步提供增值服务,同时还可以把线上活动的线索与4S店联动形成订单。 从云徙科技所选择聚焦的三大细分制造行业,可以看出这三大行业都需要深度运营核心会员群体,也就是20%的高价值客户。此前,在中台战略刚出现的时候,主要是通过社会化的第三方互联网平台和企业自建数字中台,形成对全域消费者和客户的覆盖,特别是以前被忽略的80%客户。80%的客户属于长尾客户,他们往往是一次购买或少量重复性购买,但也可能被转换为20%忠诚客户。之前由于缺乏有效的手段而难以覆盖这80%的客群,而通过互联网平台就可以抓住这80%的客群,这也是数字中台第一波的主要观点。 到了数字中台第二波,在覆盖全域客户群体的基础上,反过来要集中服务好20%的核心客群。因为对于更多的制造企业来说,已经能够通过第三方互联网平台很好的覆盖全域消费者和客群,企业更在乎的是对20%核心客群的数据挖掘以及满足这20%核心客群对80%长尾商品与服务的一揽子需求,从而获得更高的收益。换句话说,围绕第三方社会化互联网平台所形成的新型市场调节机制,正在外延出企业数字中台和数字营销连接机制,进一步巩固和完善新型企业市场调节机制,形成数据与算法驱动的“手”。而在此基础上,企业有机会发展核心业务之外的生态商品与服务业务,形成可持续发展的商业模式。 数据化运营:走向新商业生态 数字中台第二波中,上海飞智科技电子有限公司(以下简称:飞智)和良品铺子是两个典型的代表企业,他们并不自建类似阿里那样完整的电商平台,而是通过自建会员中台与第三方社会化电商平台联动,通过数据化运营对二八定律中20%的高价值核心客群进行深度运营,提升高价值高黏度客群的营收贡献度,同时围绕其周边需求拓展新商业生态,实现从制造业向服务业的升级。 飞智是一家专业游戏手柄制造企业,于2014年推出了手柄“黑武士”系列初代产品,用户用一款手柄就可以在手机、电视、盒子、电脑等多种终端上玩热门手游和电视游戏。飞智定位于手游外设,确立了硬件、软件和服务三大业务板块:硬件为游戏手柄,软件为飞智游戏大厅APP,服务为飞智主播KOL玩家共创玩法攻略及直玩家互动线上线下活动。 飞智创始人兼CEO汪沁在2019云徙科技数字创新年会上介绍,飞智长期以来面临的困惑是:用户是谁?他们在哪里?购买了游戏手柄后的体验如何?飞智主要渠道包括天猫和京东以及各渠道商实体店,其中在京东、天猫已经达到了60%的市场占有率,飞智游戏APP是给玩家进行游戏的探讨、分享的在线社区,现也有50万周活跃。这些渠道彼此割裂,无法关联同一用户在不同渠道的行为,也无从得知用户是谁、他们在哪、体验如何等。 飞智早期的成功来自于注重产品的研发和技术,在品类上有很多微创新,也形成了诸多技术专利,从而引领飞智完成了“从0到1”的阶段性成果。2018年以来,飞智进入了焦虑期,因为在京东和天猫都达到了60%的市占率,已经很难实现进一步的上升,而获取外部新客对细分品类来说又成本较高。手游外设作为一个细分品类,一个用户一年的消费量也就是2个手柄或者是几个外设,所以飞智开始思考如何扩大战略,成为更好的连接玩家和游戏世界的外设品牌,因此需要更好的理解玩家,从而打造游戏体验升级的装备。此外,飞智还希望有机会成为引领用户体验升级的完整的软硬件结合玩家服务。 为此,飞智选择与云徙科技合作会员中台,通过中台打通和连接不同渠道的会员。例如,飞智游戏APP会员、公众号订户、QQ群活跃玩家等全部数据都收入统一的中台,链接同一用户在不同渠道的行为、采购、意见等。原先,飞智只有用户基本信息,现在可以通过用户登陆APP进行关联,从而获得登陆软件、游戏时长等日常游戏行为,以及在飞智活动中的参与度、社区互动讨论等标签,就可以对用户进行完整的分层和赋予不同的标签。该解决方案上线一个月,系统新增100万会员;客户满意度89%,比原来提升30%;从客户服务、论坛、APP等渠道沉淀2万条产品建议,为产品研发提供有效参考。 汪沁强调,在数字中台上最终实现了用户数据和体验的闭环。对于企业来说,永远存在二八用户理论,头部用户对于企业来说非常重要,活跃的头部用户可以持续带来新用户、提供完整的产品行为数据以供企业运营参考、贡献产品研发创新思路等。原先,飞智的头部用户分散在几千个QQ群,但在数字中台基础上全部标签化和分层化,例如是否为《王者》玩家等,而对于持续喜欢和购买飞智产品的普通人群,也得以在数字中台沉淀下来。飞智还设计了飞券,通过优惠将天猫上的高黏度客户导流到飞智自有平台,从而更好的持续服务。这样,飞智就能围绕玩家需求,设计新的产品、提供统一服务以及运营相关的增值数字服务。 良品铺子是2006年成立的休闲零食类企业,具备全渠道、全链路的经营能力。目前,良品铺子产品高达1000多种,在全国有2000多家门店,并进一步推出了“高端零食”的品牌战略,已连续三年全国销售领先。良品铺子成立的原因,是因为消费升级时代的消费者需要更有品质更能享受生活的零食以及中国农业已经具备产业化基础,而专业的休闲零食品牌及店铺能为消费者提供更专业更有品质、更丰富更新鲜周转更快、更有体验及IP的零食一揽子解决方案,得以快速发展。 由于零食并不是一种目标性很强的产品,消费者往往因为冲动或一个场景触发而购买,并且消费场景无处不在,如办公室下午茶、踏青出游、节庆送礼、看剧零食等。因此良品铺子一直在探索除了实体专业零售店之外的其它渠道,包括平台电商、社交电商、APP、小程序甚至电视剧植入及引流等。到2018年,良品铺子已经在53个渠道积累了7400万会员,消费者可能在任意渠道购买零食,但需要在其它渠道连接和打通用户体验,为“高端品牌”创造品牌形象,这就需要打通彼此割裂的渠道并整合所有渠道的会员数据,从而提供跨渠道的统一的用户体验。 良品铺子副总裁周世雄2019云徙科技数字创新年会上介绍,良品铺子要构建一个以用户体验为中心的,围绕用户旅程的多场景,无论是到店里购买还是线上购买都要方便统一,因此需要要建立一个会员中台以管理全渠道的用户,从多渠道经营转向以用户为中心的经营。良品铺子与云徙科技合作会员中台建设,主要目标是要实现三通:全渠道的数据通、权益通和运营通,打通之后就能够实现全渠道会员的永续经营。 基于会员中台,良品铺子的会员运营思路包括:让会员在不同渠道都能积累购买“分值”,根据购买频率等形成会员等级,从而享受不同的会员权益;对于第一次购买的顾客,需要在10天内给客户第二次触达以形成再次购买,培养品牌忠诚;对于易流失的沉睡客户,设计营销策略以唤醒他们并吸引再次到店;对于已经固定购买的会员,还需要帮助他们拓展可购买的品类,从而获得更好的美食体验。而用户画像的刻画、用户生命周期的提炼和个性化管理、个性化的营销策略配置以及执行等,都需要依靠会员中台来落地执行。 从云徙科技的实践可以看出,围绕第三方社会化互联网平台的新型市场协调机制,更多的企业正在自建数字中台以形成对接,从而构建一个基于技术平台、全域数据分析和智能算法驱动的全新市场体系。在此基础上,对接中国已有的工业体系和基础设施,以及世界上最大规模的中等收入群体,让产业结构能够跟上消费结构的升级和变化速度。在数字中台第二波,企业并不寻求建设一个跟阿里一样或类似的通用电商平台,而是主要通过对接形成双方的客群和数据流通,从而在全域消费者覆盖和核心客户运营两方面取得平衡,形成新的二八定律,让每个消费者和客户都能发挥各自的作用和价值。 在2019云徙科技数字创新年会上,云徙科技还发布了SaaS版的数字营销云,力争让更多的中小制造企业也能享受到数字中台的好处和收益。云徙科技还发布数据运营服务内容,主要涉及四大模板:会员服务、营销活动、数据化运营、精准营销。云徙科技的“数字双中台+数字营销云+数据运营服务(技术+业务+运营)”数字化解决方案,是通过实践总结的有效数字化转型方法,能够帮助更多的制造企业尽快走上数字化转型道路。 中国人民大学商学院院长毛基业在2019云徙科技数字创新年会上表示,数字化营销是传统企业数字化转型效果最明显、因而最先启动的板块,而能快速响应数字营销的中台提供新一代互联网架构保障,有着不可比拟的优势。当然,数字营销和数字中台建设仅仅是企业在数字经济时代的组织变革序幕,随着技术平台嵌入到社会的方方面面并相互连接起来,一个新的“手”正在形成当中,将有可能与传统“无形的手”一起,形成“两手抓”的新宏观经济体系——我们正在走向这样的新时代。(文/宁川)
对于企业来说,数据灾备就相当于买保险。而“保险”二字,相当于一个心理保障,对于灾难的心理恐慌有多高,购买保险的意愿和出价就越高。中国企业对于灾备的建设处于方兴未艾阶段,特别是随着数字化转型与数字经济发展,数据不仅维持着企业的运营,更与实体经济紧密结合,数据损失即意味着重大经济损失。 近年来,中国的业务连续性和数据灾备等建设仅局限于金融、电信等大型企业的少数领域,其它行业的认识和认知还不够,也没有认识到数据灾备对于企业生存和发展的重大关系。实际上,只有当企业亲自经历了数据丢失带来的重大经济损失,才会对业务连续性和灾备有深刻的认识。 根据有关市场分析,2015年我国灾备市场约136.8亿元,到2022年将达到329.1亿元。政府、军工、金融、电信、交通、能源等大企业市场对灾备的需求呈规模化增长态势。在灾备解决方案中,基于公有云的云灾备增长迅速。2019年5月29日,阿里云发布企业级云灾备解决方案,云上灾备成本相对传统线下节省50%。 对于企业来说,类似阿里云的企业级云灾备就相当于第三方保险公司,企业无需大规模自建线下成本高昂的灾备中心,而采购公有云灾备解决方案,共享业界最佳灾备实践,大幅降低灾备成本的同时,提高全面保障的能力。 数字经济,灾备升级 数据是新时代的能源,而我们正处于数据能源新时代的开端。市场调查公司IDC在2014年发布的第七次《数字宇宙报告》,预计到2020年,数字宇宙(指由全球所有消费者和企业所创建的数据,包括视频、音频和文件等)规模将达到44ZB。 140多前的1879年,爱迪生经过几千次试验发明了电灯,当时的人类对于电能的重要性还远远认识不足。之后过了90年的1969年美国把人类送到了月球,1970年空中客车公司诞生,全世界全面进入电力电能时代,几乎所有的人类文明都被电力化电能化。从大规模的现代化生产车间,到更大规模的城市建筑群,再到电力电能全面普及的民航、火车、医院等生命生活基础设施,每一次停电所造成的社会影响力量级,都在不断“换代升级”。 在DT时代,数据备份的重要性,将随着数据应用的深度和广度而不断加深。之前的信息技术时代,IT系统和数据的灾备就已经十分重要。有专家认为,如果不进行灾难恢复以及业务连续性规模,将有5%的概率引发企业的财务危机;而美国德克萨斯州大学的早期调查显示,只有6%的企业可以在数据丢失后存活下来、43%将彻底关门、51%将在两年内消失。 随着人类从信息化进入数字化和智能化时代,信息技术逐渐与企业业务和流程融为一体,数据丢失将会对企业产生毁灭性影响。数字业务对于灾难恢复的要求也远高于传统IT甚至更加苛刻,RTO(能容忍的恢复时间)从小时降到分钟以内、RPO(能容忍的最大数据丢失量)也要求尽可能低。 云灾备是灾备技术趋势 十三五规划明确提出“对于信息安全、数据安全,灾备是最基础的技术需求,几乎所有的信息资产都需要灾备保护,以确保在任何意外故障情况下,信息系统的正常运转”。 灾备技术国家工程实验室副主任、清华大学教授舒继武在阿里云企业级云灾备解决方案发布会上介绍,历史上的灾备主要是容错系统的一个研究方向,现在的灾备则是容错计算、信息安全和系统管理三个研究领域的综合。 云灾备是灾备业务的实现形式,主要包括云备份与云容灾,这二者是一个有机体,其中云备份是指备份技术将数据直接备份到公有云上,进而实现数据备份与恢复功能;而云容灾则是指通过数据/系统的云端迁移、高可用等方式实现业务的快速接管,保证业务连续性。其中,云灾备的特点包括:减少基础设施、降低IT成本;按需付费,具有高度机动性;可快速恢复,具备高度灵活性;安全备份,以服务为导向。 传统灾备具有“两高一低”的弊端:高成本、高浪费、低利用率。对于企业的传统灾备来说,通常要自建灾备中心,备份机房的平时利用率只能达到20%,但却要付出100%的成本,不仅硬件投入大而且三年过维保期,如果三年之年不出事故,备份机房就基本浪费了。 灾备对于企业来说,就相当于买保险,而如果要买保险,当然是找到第三方商业保险公司更为划算。云灾备已经成为大势所趋,Gartner预计到2020年,90%的容灾操作会发生在云端。 本次阿里云发布的企业级云灾备解决方案,采用了国内首个磁盘级数据持续复制技术,同时支持混合云和跨云的多平台融合架构,为企业提供五大能力:用户数据中心和公共云的相互容灾;业务不停机,完成容灾演练;首个云原生支持弹性容灾,只需部署最低负载;一键容灾快速恢复,RTO、RPO可达秒级;完善的数据加密体系,保证数据的极致安全。 陈绪强调,阿里云企业级云灾备的独特能力包括:本地和云上皆可快速恢复;首家大数据异地双活容灾;端到端的数据加密检验,云端容灾数据自动多副本保存;五分钟启动备份服务;高达1:30的备份数据重删比;异地备份方案成本比传统方案更低。 阿里云企业级云灾备还符合四个极限目标,即不在同一火山地震带、不在同一水系、不在同一电网、不在同一运营商网络出口,最大程度地保障业务和数据稳定安全。 阿里云企业灾备的实力 灾备对技术、管理、成本等有着综合的要求。《信息系统灾难恢复规范》GB-20988-2007国标中提出了6级相关要求,SHARE 78国际组织提出了7级国际标准,恢复时间从72小时到分钟级不等、恢复点从1至7天到0级不等。 陈绪强调,阿里云企业级云灾备体现的是包括网络、数据库、存储等在内的全方位的能力。例如,数据可靠,全链路加密,支持用户自己代理的密钥——即整个存储、传输过程都经过加密且只有用户可见全过程,而数据可靠性通过3AZ(3个可用区)实现,这在国际上也是先进的。而之所以能够达到高等级的安全可靠,一个很大的原因是阿里云的技术都经过了双11的演练。 双11作为全世界最好的技术练兵场,每年峰值都在不停的提升。阿里云是解决双11业务支撑最核心的杀手锏,在双11业务到来的时候,所有的环节都已经检测过一遍,系统能承受负载和压力也都百分之百测试过了。正因为有阿里双11的实战演习环境和模式,才保障了阿里云企业级云灾备的技术能力,包括为制造、金融、医疗等企业提供一键容灾,例如业务恢复、数据保护和网络自愈,最大程度保护本地和云上业务稳定运行。 灾备演练是任何灾备方案成功的关键,没有经过灾备演练的灾备方案,都不能称之为成功的灾备方案。而灾备技术并不孤立,涉及备份、复制、虚拟化、存储、网络、超融合等多种不同技术,系统复杂性高、建设要求复杂,而好的灾备方案要求实现用户的“故障无感知”,即业务平滑过渡、数据无损失。此外,成本还要可控,在同等级灾备能力下达到更低的成本。 具体来说,阿里云企业灾备背后的技术除了飞天整体能力外,还包括阿里高可用机房、超强容灾云服务器、存储、数据库灾备等极致的技术能力。 在高可用机房方面,阿里云的不间断IDC可双向引入独立市电、机架服务器AB路供电,通过双路供电让电池后备电源无缝接管25分钟,N+1冗余柴油发电机可在1分钟内接管;而阿里云的高可用骨干网,可实现不同AZ之间低延时高速互联,再加上AZ内双冗余网络架构以及IDC 3路由出口光纤冗余,进一步保障了网络的可靠性和高可用;最后就是3+N超多线接入BGP,保证客户在数据传输的过程中不被不同的网络困扰。在超强容灾云服务器方面,阿里云的云服务器部署从物理机、机架、数据中心和跨区域的可用区四个层面进行保障。而飞天的盘古存储,从数据保护、高可用性、IDC基础设施等层面进行了数据可靠性保障,其中包括与清华合作的多项领先技术。 在数据库灾备方面,阿里云对目前市场上的主流数据库,都能进行完全高效的灾备备份,可准确评估数据库到RDS的兼容性,具体到每张表、每条SQL;而DTS数据传输服务则能全量性能达到70MB/s、实时同步性能高达3万TPS,传输粒度可细化到记录级别,具有链路秒级恢复能力,链路可靠性高达99.95%。阿里云PolarDB还在近日发布重大更新,支持Oracle等传统数据库一键迁移上云,解决了企业核心业务上云的难题。 凭借多层次防护、跨区域容灾等能力,阿里云已连续三年入选Gartner全球云存储魔力象限,并被列为全球领导者。在数据安全领域,作为亚洲合规资质最全的云服务商,率先发布《数据保护倡议书》,是首个提出“绝对不碰客户数据”承诺的云厂商。 在发布会上,陈绪代表阿里云发布了TCO承诺书:在企业灾备场景下,同样的容量、同样的带宽、同样的RTO和RPO、同样的容灾等级,阿里云承诺比自建灾备成本等低。敢写承诺书的都有底气,而阿里云的底气就来自于其技术实力本身。舒继武教授介绍,灾备技术趋势还包括容器、边缘计算、超融合等,这些丰富的灾备场景,只有在云灾备的前提下才有可能实现。正如何IT终将向DT过渡一样,传统企业灾备也将过渡到云灾备。阿里云作为亚洲最大的公有云厂商,无疑将颠覆传统企业灾备,把普惠灾备带来千万企业。(文/宁川)
数据库与中间件和操作系统并列为全球三大基础软件技术,也是企业IT系统必不可少的核心技术,银行、电信、制造、互联网等所有行业都依赖于数据库技术。由于其技术的高难度,数据库长期以来被少数公司控制了绝大部分市场份额。据不同的统计口径,全球数据库市场在300亿美金到600亿美金之间,商用数据库的领导厂商主要是Oracle、微软、IBM和SAP。 自1968年IBM推出了第一代数据库DB1以及1970年IBM工程师Edgar Codd写下了最早的关系型数据模型构想的论文,随后的30年间出现了著名的数据库公司Oracle(1977年成立)、Informix(1980年成立,后被IBM收购)、Sybase(1984年成立,后被SAP收购)、Sybase与微软合作的SQL Server(后由微软接管)等,全球数据库产业在2000年前后进行了第一次大战并主要形成IBM、微软、Oracle三巨头格局。 2000年以后的互联网和云计算技术变革,为数据库技术带来了“釜底抽薪”的底层计算系统变化,导致了以开源、分布式和云计算为主导的新数据库时代。2012年Google发布论文首次对外介绍了自研的具有划时代意义的Spanner全球分布式数据库、2014年AWS推出了云原生关系型数据库Aurora、2017年阿里云推出云原生关系型数据库POLARDB,2018年10月Gartner全球数据库魔力象限的领导者和挑战者象限出现了7强格局:微软、Oracle、SAP、AWS、Google、IBM和阿里云。 2019年3月21日的2019阿里云峰会·北京上,阿里云发布了POLARDB的2.0版本,实现了首次兼容Oracle数据库,可帮助金融、医疗、制造等大型企业在数小时内完成业务迁移。除阿里云外,其它国内云厂商也相继推出了自研的云数据库和分布式数据库产品。2019新年伊始,数据库产业50年的第二次“世界大战”已经硝烟四起。 电商巨头的技术溢出效应 从Gartner的2018全球数据库魔力象限来看,AWS与阿里云是两大电商巨头的对外技术输出平台,AWS与阿里云都推出了种类丰富的数据库产品。而Google虽然是全球互联网技术和云技术的“大牛”,但Google内部技术的对外商用化输出往往晚于市场,Cloud Spanner就是直到2017年才向市场推出。 过去十年,电商巨头的技术溢出效应十分明显。AWS目前已经推出的数据库产品包括Amazon DynamoDB(非关系型文档和键值数据库)、Amazon ElastiCache (提供Redis和Memcached开源分布式缓存数据库) 、Amazon Neptune(图数据库)、Amazon Elastic MapReduce(EMR)Hadoop发行版,以及Amazon Relational Database Service(Amazon RDS,支持Amazon Aurora、MariaDB、Microsoft SQL Server、MySQL、Oracle和PostgreSQL等的云数据库服务)以及云原生数据库Amazon Aurora for MySQL and PostgreSQL等。 而阿里云已经推出的数据库产品包括ApsaraDB for RDS(关系型云数据库服务,支持MySQL即AliSQL、SQL Server、PostgreSQL、Redis等)、PolarDB(云原生数据库,支持MySQL、PostgreSQL、Oracle)、HybridDB for MySQL and PostgreSQL(云数据仓库)、Elastic MapReduce for Hadoop、HiTSDB(时序数据库)、X-DB(分布式数据库)、GraphDB(图数据库)等,此外阿里云Apsara Stack还支持企业本地化私有云部署。 无论是AWS还是阿里云,所提供的数据库及数据服务种类繁多,覆盖了绝大多数用户场景,特别是由于电商交易系统的特殊性,AWS和阿里云等开发了支持数据强一致的交易型分布式数据库,能够满足金融类业务的苛刻需求,而成本则远低于商业数据库。 为什么电商企业如此孜孜不倦的钻研数据库呢?以阿里云为例。阿里最早从淘宝、天猫等电商业务发展起来,当时采用的就是IBM DB2和Oracle商用数据库,支持了早期淘宝、天猫的快速发展,这是阿里数据库发展第一个阶段。到了2011和2012的时候,双11开始上规模,业务高速发展对传统的Oracle企业级数据库解决方案提出了挑战,成本太高是首当其冲的挑战,其次当电商业务逻辑变复杂以后,需要理解Oracle数据库的技术实现,以便从根本上解决业务极限场景的挑战,但无论是请Oracle专家到现场的时间还是成本都无法满足业务要求,阿里巴巴从2012、2013年后就开始大规模使用开源数据库,这是阿里数据库发展的第二阶段。第三个发展阶段就是云时代,阿里云的业务快速发展要求自研云原生数据库,这就是POLARDB的诞生逻辑;以及在阿里集团业务中,传统用中间件进行开源数据库分为分表的解决方案也不能满足业务要求,这就是X-DB的的诞生逻辑。 简单来说,电商企业的技术溢出是被业务倒逼的结果。阿里电商双十一场景,在世界范围内来看都绝无仅有,这也给了中国电商企业登顶全球基础软件技术领导地位的机会。作为全球绝无仅有的高并发挑战,阿里分布式技术经过双十一极限流量洪峰的实战考验,这也是为什么阿里云能够首次代表中国厂商冲入Gartner全球数据库魔力象限。2018年,美国犹他大学计算机系终身正教授、世界级数据库系统专家李飞飞,正式加入阿里巴巴,任数据库产品事业部负责人以及达摩院任数据库首席科学家,他于2018年底入选了2018 ACM杰出科学家。李飞飞门下弟子遍布全球所有顶尖企业的数据库部门,但李飞飞自己却选中了阿里,其主要原因就是阿里的全球独一无二的业务场景。 云厂商集开源技术大成 (阿里达摩院数据库首席科学家李飞飞) 2019年是阿里云十周年、AWS进入第13个年头。云厂商对于开源技术的集大成,正在进入全新的阶段。2014年AWS发布Amazon Aurora的时候,当时称性能与商用数据库相当,但成本只有商用数据库的1/10。而2017年阿里云推出POLARDB的时候,在100TB的数据容量上提供了10倍于传统商业数据库的性价比,如今性能达到AWS Aurora的2倍。 不可否认,阿里云的数据库发展离不开Google和AWS等前辈的指引。谷歌最早提出了Spanner,可以实现跨数据中心的数据强一致性,这在当时是跨时代的技术,但谷歌其实是巧妙的利用了原子钟的硬件解决方案;PostgreSQL的XC/XL开源分布式数据库使用的是GTM(Global Transaction Manager)解决方案。阿里云的X-DB则采用了混合逻辑来解决分布式事务处理和查询,已经支持了几乎阿里集团所有海量数据高并发的场景。 如今,阿里云正在把多个领先的数据库技术融合起来,以满足客户的更多、更高需求。云原生数据库POLARDB采用了存储计算分离、软硬件一体化设计,通过高速的RDMA网络提供共享存储的架构,可以快速实现弹性缩扩容,单个实例可扩展到1000核计算能力、同时可以横向扩展到100TB存储空间,满足大规模业务场景的需求,2.0版本则兼容Oracle。据了解,POLARDB与X-DB的优势即将融合成一体,也就是即将推出的POLARDB分布式版本。 即将推出的POLARDB分布式版本是在POLARDB共享存储、一写多读的架构上结合X-DB的核心分布式技术,这样企业就可以利用X-DB的分库分表强一致分布式技术挂起多个POLARDB实例,支持几乎无限的水平规模拓展,满足企业级上百个节点高并发业务需求。POLARDB分布式版本的推出,将用一个通用商业数据库产品来满足公共云上大中小企业的需求以及线下企业级超大规模用户的需求。这款产品最大的好处之一,在于底层接入的不是单节点数据库,而是分布式共享存储且单机支持100T,这样一个200T的数据库只需要两个POLARDB实例即可,大幅降低了跨分区处理的可能性。 POLARDB分布式版本这样一个集大成的通用型全场景覆盖数据库产品,当前阿里云已经储备了足够的技术和实践,现在的主要工作是产品化、标准化,以便能够快速规模化部署。李飞飞认为,阿里巴巴在分布式数据库的某些领域和某些维度上,可能超过像谷歌这样公司在分布式领域的积累,这是因为任何技术都是业务推动衍生出来的,只要有业务场景就能推动其技术从跟随发展到后发领先。 除了分布式和云原生数据库技术外,李飞飞所带领的团队还专注于数据库生态工具库,也就是开发各种辅助工具帮助客户用好数据库。阿里云的一个数据库生态工具就是针对混合数据库和混合云之间的数据迁移工具ADAM,可以大幅减少不同类型数据库和云部署之间数据迁移的各种消耗和对业务的冲击;另一个工具是混合数据库管理,可以管理A/B数据库、云上和云下数据库等混部架构,满足业务对混部数据库的访问和统一控制管理需求。 据了解,阿里云数据库很快将在2019年SIGMOD大会上介绍阿里云双十一场景下的分布式数据库架构。此前,谷歌Spanner、AWS Aurora等都是首先在SIDMOD会议上发布。而阿里云将登陆2019年SIGMOD会议,这也代表了中国技术厂商的成就。 展望未来几年,全球数据库市场将迎来50年的第二次巨变。在2018 Gartner全球数据库魔力象限的7强格局中,AWS、阿里云和Google为开源技术厂商,微软、Oracle和IBM也大举支持开源技术。Gartner预计,开源数据库将在2019年占据20%的数据库市场份额,而到2023年75%的数据库都将登陆云平台。一场数据库的世纪之战,已经在所难免。(文/宁川)
(云徙科技创始人及CEO包志刚) 阿里巴巴CEO张勇在2018年10月31日致股东信中提及:阿里经济体在为消费者提供更好生活的同时,也在形成一个帮助企业完成数字化转型的基础设施。这个基础设施,就是“阿里巴巴商业操作系统”。 “阿里巴巴商业操作系统”到底具体长什么样?此前在2018年8月,阿里云首次发布“双中台+ET”数字化转型方法论,揭示了“阿里巴巴商业操作系统”的模型。2018年9月,基于阿里技术与商业实践推动企业数字化转型的创业公司云徙科技宣布获得1.5亿元A+轮融资,同时推出双中台战略:业务中台+数据中台。 2018年11月22日的广东云栖大会上,云徙科技创始人及CEO包志刚以及CTO李元佳分享了双中台战略及实践。 业务+数据双中台 (云徙科技的双中台产品体系) 什么是业务中台?什么又是数据中台?包志刚一句话总结:业务中台是“+互联网”,数据中台是“互联网+”。 云徙科技成立于2016年,包志刚曾在中国一家大型企业服务公司担任公司高级副总裁,主导过20多家企业的咨询项目,有近20年企业IT咨询及服务经验。2018年9月,云徙科技发布的数字双中台(i-Digital Engine)2.0以业务和运营管理为观点:其中的业务中台发布了13个共享服务中心及10个基础组件,13个共享服务中心有用户中心、会员中心、商品中心、交易中心、营销中心、结算中心、库存中心、物流中心、店铺中心、消息中心、内容中心、客服中心、评价中心,这13个共享服务中心可满足新零售业务运营的大部分需求。10个基础组件则偏向技术,用于支撑共享服务中心。 数据中台则是基于阿里大数据中间件搭建的轻量级大数据平台,主要提供了10大模型和8大数据服务。其中,10大模型为事件模型(浏览、交易、支付)的流量域、交易域、商品域、支付域、评价域,以及主题模型(人、货、场)的会员、商家、经销商、商品和店铺;基于10大模型,向上提供8种服务——商品分析服务、活动分析服务、买家分析服务、流量分析服务、交易分析服务、标签查询服务、人群筛选服务、自助打标服务。简单的理解,10个模型为新零售业务提供了基本的数据模型,而8个数据服务则为新零售业务提供了用户画像、商品画像、流量分析等运营服务。 对于企业数字化转型来说,现在就可以利用云徙科技的业务中台,迅速像搭积木一样快速搭建前端互联网业务,这就是“+互联网”;而数据中台则打破了不同业务部门之间的烟囱式IT架构、打通了数据孤岛,实现了“一切业务数据化”的目标,让全域数据沉淀到一个统一的数据平台上,进而可以实现数据驱动创新效果,例如可以快速在已有数据的基础上,孵化保险、教育、健康等周边生态业务,这就是“互联网+”。 李元佳强调,云徙科技最新推出的双中台战略,把数据中台的作用提高了,原先是业务中台起更大的作用,而现在把业务数据沉淀到数据中台后,打通全域数据形成不同的数据模型和事件模型,向上赋能企业的数字化运营。双中台战略,完成了业务数据化和数据业务化的过程,为下一步的数字化业务创新打下了坚实的基础。 所谓业务中台与数据中台的相互促进和连动,即业务中台提供丰富的数据、而数据中台则对所有数据进行汇聚后再反向指导业务。具体理解,企业客户在业务中台之上开发了一个营销促销活动,通过数据中台就可以清晰地看到哪一个区域的营销指标达标了,如果没有达标就会及时通知当地经销商团队,快速调整营销策略。这就是典型的用数据指导业务,让数据回到业务本身。 在双中台之上,就是新零售与新营销应用,而双中台的目的是为了帮助企业实现新零售和新营销创新。包志刚认为,新零售和新营销创新要三步走:第一,通过互联网架构、云计算技术构建企业全渠道体系,实现会员通、商品通、交易通,以及整个营销渠道的全局管理。第二,当营销业务中台沉淀了大量数据,再通过数据中台实现数据驱动业务的互联网化运营。第三,通过双中台积累的大量数据和实践,进行业务的创新,包括端的创新、场景的创新、业务模式的创新。针对新零售的全渠道销售和营销,云徙科技提供了全渠道销售i-Sales和营销智能i-Marketing以及智能服务i-Service三大应用类产品。 包括业务中台和数据中台在内的数字中台,全渠道销售、智能化营销和智能服务在内的SaaS软件,这就是云徙科技的“企业数字化转型”的核心服务。 改变做生意的方式 (利用数字中台快速构建应用) 在2017杭州·云栖大会上,茅台电商技术总监高文立分享了一张喜人的成绩单:从2012年开始,茅台电商交易额连续五年年增长率超过200%,“茅台云商”新零售平台成交额将达80亿元。 茅台借助阿里云上线的“茅台云商”,平台集社会化营销、溯源验证、大数据精准营销、跨界精品销售、收藏拍卖等于一体,推动线上线下的高度融合,阿里云与合作伙伴云徒科技共同为茅台打造了“业务中台”。 按照阿里云企业级互联网架构“厚平台、薄应用”的理念,茅台电商的中台包括营销中心、会员中心、商品中心、交易中心等十多个共享服务中心。 茅台云商平台形成精准的营销闭环,前至生产流水线、供应商包材,后至所有经销商、零售终端和消费者信息,以及终端卖出的每一瓶酒都会进入茅台云商数据库。基于全域数据,茅台还在打造线下智慧门店,不仅配备智能客服机器人、无缝支付体验,智慧门店还更懂用户,用户进店的那一刻,店员就能知道用户画像。 中台战略是阿里于2015年提出来的。阿里就像其它公司一样,也经历了从传统IT支撑公司业务到业务数据化再到数据化运营并不断孵化互联网业务的过程。今天,阿里巴巴中台战略的三个核心产品为企业级分布式应用服务、分布式数据库和消息队列服务,可以帮助企业快速构建出灵活而快速支撑业务、能够应对互联网各种业务场景的中台。云徙科技正是基于阿里的这些技术产品之上,快速帮助企业客户建立自己的双中台以及基于双中台推进数字化转型。 李元佳强调,云徙科技两年实践下来,中台战略是企业数字化转型的重要路径。建设中台是一个系统的工程,因为双中台是企业IT系统的基座,引入中台势必需要对现有系统做不同程度的重构。云徙科技与客户一起梳理营销、交易及客服等业务,让企业能够在数字化转型中真正获益。 云徙科技为企业数字化转型提供整体赋能,包括开发、运维、合作伙伴接入规范等,帮助企业实现IT建设、渠道和方法的总体转型,降低导入整个系统的成本。包志刚则强调,企业数字化转型导入双中台和新零售界面,首先必须是一把手工程,企业领导者要想清楚互联网模式和互联网运营与传统做生意方式的不同之处,例如当有了业务中台和数据中台后,就能实现互联网业务的运营,包括吸粉、转换、团购、秒杀以及千人千面电子货架、会员精准画像和精准推荐等。 在双中台和数据化运营之后,云徙科技还帮助企业进行数字化业务创新:端的创新,包括抖音广告、微信活动、天猫活动等;场景智能化,增强用户体验感和智能化,例如护肤品品牌通过日晒时间和位置调研以及皮肤深度拍照及图像识别,提供相应的配方及采购建设,提高复购率;业务的延伸,例如房地产公司从服务业主和建筑本身,延展到服务于生活圈业态,包括装修、家具、商业、医疗、养老、教育、酒店等多业态发展。“所有的系统都要长在一个中台之上,原来已有的数据资源就可以快速共享给新业务。就像淘宝和天猫聚集了大量商品、结算、商家信息,就能培养聚划算、闲鱼、蚂蚁金服等高利润的业务,因为所有的会员是打通的,这就是阿里新零售实践沉淀能力后再赋能到企业。”包志刚强调。 “数字化趋势是一个社会发展的新时代,互联网已经到了产业互联网下半场,这波机会是中国企业的机会,再不抓住就赶不上世界潮流了。欧美没有中国这样的互联网产业,中国有最好的场景、有大量消费者,数字化转型必须要做!”包志刚的这番话,或许验证了为什么在资本寒冬的2018年,云徙科技还能获得1.5亿A+轮融资的原因——数字化转型是整个市场所看好的方向,批量复制数字中台就是快速推进数字化转型的重要路径。(文/宁川)
“中国是制造业大国,挑战非常大。中国改革开放40年所积累的制造业能力,原先是靠人力资本和资源消耗型,但是今天进入到了技术创新竞争中,制造业除了自动化以外还可以实现智能化。两年前我们开始提出云计算如何和制造业结合,在广州、重庆、浙江等地进行了尝试。很幸运的是,我们的这些尝试与国家战略和策略相吻合。”2018年11月8日的广州云栖大会上,阿里云总裁胡晓明提出了与广州的新十年之约:十年前阿里帮助广货北上;十年后要帮助广东打造新制造样本。 2016年10月的杭州云栖大会上,马云正式提出了“五新”:新零售、新制造、新金融、新技术与新能源(即数据)。其中最具挑战性的,就是新制造。对于一家互联网电商公司,阿里已经在零售、金融、云技术和大数据等方面有了丰富的积累,但新制造?对于产业互联网来说,技术是硬币的一方面,行业经验与知识是硬币的另一方面,而2016年的阿里和阿里云,显然在工业知识方面缺乏相应的积累。 如今两年过去了,阿里云在过去两年陆续落地了浙江的supET工业互联网、重庆的飞象工业互联网以及本次发布的广东飞龙工业互联网,其中supET工业互联网刚获选了第五届世界互联网大会的世界互联网领先科技成果。此外,阿里云陆续帮助协鑫光伏等企业实现了新制造和工业互联网项目,取得了令人瞩目的成绩。更重要的是,阿里云派遣了大量工程师到生产制造车间一线,获得大量工业知识,迅速完成了工业知识的“原始积累”。 工厂数字化:重构智能制造 在2018年11月的广州云栖大会上,阿里云物联网首席科学家丁险峰分享了对工业4.0、智能制造和工业物联网的认知与思考,提出建立基于工业物联网的数字工厂“操作系统”,实现从智能制造到普惠制造。 “什么叫智能制造?很多人说智能制造就是建一条全自动的生产线,但其实智能制造不仅是建一条全自动的生产线,对现有生产线的能力改造也是智能制造。如果只建设全自动化的生产线,那么小企业怎么办?我们要寻找出来一条适合中国中小企业普惠制造的一条智能制造之路。”丁险峰提出了面向中小企业智能制造的重要性,就是要实现工厂的数字化。 在物联网时代,工厂数字化就意味着在数字空间建立信息物理系统。丁险峰认为,基于物联网的工厂,其“操作系统”就是调动物理世界资源,即“人、机、料、法、环”(全面质量管理中5个影响产品质量的要素),这就像计算机操作系统管理计算资源那样。如何把人员、机器、物料、方法和环境都连接起来,就要靠工业物联网,从而建立工厂的“调度系统”,提升工厂效率到较高水平,就像计算机操作系统把计算机资源发挥到较高水平那样。 阿里云的工业物联网为制造数字化提供了基础设施,包括:端、边缘计算和云平台。 “端”主要通过AliOS Things(阿里物联网操作系统)、Link kit SDK(阿里智能生活物联网飞燕平台)等安全地连接各种端设备;边缘计算则实现工业数据的实时分析与实时决策,然后直接下发机器执行;而一个更为广泛的云平台,则实现了连接管理、设备影子、设备模型等,从而管理数字化的物、料、机器等,在此基础设施之上再用大数据、人工智能等产生各种应用解决方案:包括设备运维、机床数字化改造、产品视觉检测等场景解决方案,以及远程监控、故障预测、设备台账等工业APP。 “智能制造的核心思想是重构信息化软件,用物联网进行数字化的工程。”丁险峰介绍,阿里云实现了一个高效的软硬一体化的智能制造解决方案,可以连接到云上可视化看板和数据分析平台等,同时也可以把数据发送到车间里的智能手机和平台电脑上,让工厂里的员工拿着平板电脑移动办公、随时掌握生产中的每一个要素。该解决方案还可以连接到各式工业设备上,非常适合中小制造企业。此外,阿里云还在云上建立了AI算法管理平台,打通了各种摄像头和机器数据采集设备。例如一个小型制衣制造工厂,用摄像头完成了制造过程的数字化,再通过人工智能大幅提高智能排产能力和定单完成速度。 对于智能制造来说,工业互联网起了什么作用?丁险峰强调,工业互联网是智能制造的重要基础设施,智能制造是调度“人、机、料、法、环”,而工业互联网则是重构“人、机、料、法、环”。生产制造中涉及到很多工业和商业元素,比如材料、产品、销售、物流等,以广泛而离散的方式被组织起来,而工业互联网则能够把这些元素结合在一起,连接不同的供应商、客户、资金等,打通从定单到生产、从消费者到制造端,重构“人、机、料、法、环”。 总体而言,在智能制造方面,阿里云主要想通过物联网对制造工厂进行数字化改造,形成数字化服务能力,再通过工业互联网连入整个产业。这就像台积电那样,为上千家芯片设计公司做代工,从而让毛利率达到50%,成为最赚钱的制造业服务化公司。而经过连接,阿里云还能够为工业提供大量SaaS软件,进一步提升工业制造的智能化水平。 工业互联网:重构电商生态 在2018年11月的2018广东云栖大会上,阿里云正式发布飞龙工业互联网平台,该平台立足广东,辐射粤港澳大湾区,帮助广东打造新能源、电气装备等八大工业互联网产业集群。此前,在2018年8月的2018重庆云栖大会上,阿里云发布了飞象工业互联网平台,帮助重庆从智能制造、智能汽车、智能交通等领域打造“亚洲最智能大型城市”,助推智能化重庆发展高质量发展经济带。而在2018年6月,浙江省发布工业互联网战略,培育由阿里云、中控和之江实验室共同打造的supET工业互联网平台。 短短一年间,阿里云就在浙江、重庆和广东推出了三大工业互联网平台。“去年,阿里云把工业互联网总部设在广东黄埔区,打造飞龙的工业互联网平台。同样,重庆的工业也很多特色,比如重庆摩托制造业很发达,我们与工信部、重庆南岸区政府共同进行了打造飞象工业互联网平台。在浙江,我们也得到了浙江省政府的支持。我们积极在各个区域,把区域经济和互联网技术做深度融合。”胡晓明在2018广东云栖大会上接受采访时表示。 那么,阿里对于工业互联网的布局,到底是基于一个怎样的深层考虑?胡晓明在谈到“五新”两年来进展时强调,阿里的核心是电商,电商的背后是制造、零售、金融和流通等,因此阿里的“五新”布局总体上是围绕加强电商核心以及进一步升级电商战略。比如,阿里电商的ToB和ToC业务所销售的商品,就有很多是来自浙江、广东和重庆等地的制造业。 因为阿里云的工业互联网总部在广州,那么阿里云想要帮助广东打造的智能制造样本就非常重要。胡晓明表示,中国需要走出有中国特色的智能制造样本,充分利用中国电子商务和互联网高度发达的特色,不仅通过智能制造降低成本,更可以带来创新和提升效率,而阿里想要驱动的是C2B模式即从消费者到制造业。“我们认为一定可以通过数字化改造、物联网和工业互联网等实现C2B,我们正在积极推进。” 阿里云还在广东尝试把工业互联网和制造业打通,实现消费者到制造业的C2B改造。这一方面是因为广东对阿里巴巴电子商务来说是最重要的省份——在今年双11节中,广东全天贡献476亿销售、占比22.3%、位列全国第一;而在另一方面,广东本身也是“世界工厂”,制造业规模位列全球第五,包括华为、荣耀、VIVO、OPPO、美的等广东制造品牌也为双11做出了重要贡献。因此,广东的制造业领先就意味着全球领先,在广东率先实现工业互联网与制造业互联就有着重要的意义。 为了表明扎根广东的决心,胡晓明还获得了广州人才绿卡,身体力行示范广东效应。阿里云华南总经理徐栋表示,阿里云的工业互联网总部落在广东,不仅只做广东业务,而是要覆盖全国。因此,广东的新制造样本也将是全国的示范。 总结而言,经过两年的发展,阿里云认为工业互联网是新制造最重要的基础设施,而阿里云所打造的工业互联网有三个核心能力:第一,工业物联网服务,实现云边端一体化管理,服务了纺织服装、电子制造、机械加工等行业;第二,工业数据智能服务,实现工业数据智能化分析应用,服务了光伏、橡胶、化工、电力等数十个行业;第三,工业APP运营服务,帮助软件开发商和系统集成商实现一站式的工业APP开发、集成、托管、运维等工作。 工业物联网、数字化工厂、工业互联网、工业云平台、ET工业大脑等,这些是阿里云在新制造领域的主要布局。而在2018广州云栖大会上,胡晓明、丁险峰等阿里云的领导层已经能够娴熟的讲述工业知识,阿里云的飞龙、飞象、supET等工业互联网平台都已经融入了大量的工业知识和实践,这一切都是阿里云的工程师深入到车间一线与工人师傅面对面交流、亲眼看明白每一道工艺流程的结果。 如果在两年前还有人质疑阿里云缺乏进入工业互联网和智能制造所需要的工业知识和实践积累,那么两年后阿里云向外界展示了过去两年中所保持的进入工业领域的决心和强力执行结果。阿里云用自己的实践,向外界证明了互联网公司快速学习的能力,以及由“码农进车间”可能是更快实现产业互联网的路径。(文/宁川)
2018年11月7日,第五届世界互联网大会在浙江乌镇开幕。当天下午是备受瞩目的世界互联网领先科技成果发布活动,本年度共入选了15项代表性领先科技成果,其中来自阿里云、浙江中控和之江实验室联合建设的supET工业互联网平台是唯一入选的工业互联网平台。 当前,我国工业互联网平台建设相当活跃。在前不久发布的2018中国工业互联网活力指数暨工业互联网平台活力榜指出,我国工业互联网平台领域涌现了大量参与企业,既有传统ICT企业,也有互联网企业,以及专注于工业信息化的企业,已推出各类工业互联网平台产品和解决方案,而阿里云的supET工业互联网平台也入选了该活力榜TOP 15榜单。 主要服务于浙江乃至整个长三角工业企业转型升级的工业互联网平台,supET以工业大数据分析为核心,提供云计算、物联网和人工智能等先进技术,对接淘工厂等打通消费互联网,为全球的工业企业数字化转型和工业互联网平台建设提供了一个样板。阿里云总裁胡晓明在领奖时表示:supET平台让服务商为制造业提供服务时更加方便,让制造业应用新一代信息技术时门槛更低,最终实现驱动数字产业化、服务产业数字化,让工业数字化转型更简单。 集成工业知识与专家 (上图为阿里云总裁胡晓明) 根据2017年出版的《工业化蓝皮书:中国工业化进程报告》统计的工业化综合指数排名,在东部地区,长三角地区工业化水平最高,2015年的工业化综合指数为98(最大值为100),已经十分接近后工业化阶段。走进后工业化阶段的长三角地区,其下一步的发展空间和模式探索对于全国来说具有重要示范意义。 在去年的世界互联网大会期间,浙江省政府与工信部签订了部省共同推进工业互联网发展合作协议,力争打造世界领先的工业互联网平台。为此,在浙江省政府、省经信厅的指导和大力支持下,阿里云牵头、联合浙江中控、之江实验室共同建设supET平台。2018年6月14日,浙江省发布工业互联网战略,在全国率先推进建立“1+N”工业互联网平台体系和行业联盟,打造具备国际竞争力的产业联盟体系。“1”即指培育一个跨行业、跨领域、具有国际水准的国家级工业互联网平台——supET工业互联网平台,“N”则指培育一批行业级、区域级、企业级等多级工业互联网平台。 建设工业互联网,一大难题是知识与专家资源。目前,工业互联网跨越的领域既多又广,没有一个专家在这个领域拥有超过40%的知识。因此,知识集成和专家人员的集成将是推进工业互联网发展的大难题。而supET工业互联网平台要打造可以说是一个广场式的工业互联网平台,让N个行业领域和M个技术提供商形成基于平台的多边市场,为每一类垂直行业的工业企业打造一个解决方案专卖店、形成聚合生态。 在“N”的目标范围中,既围绕石油化工、汽车制造、电子制造、船舶修造、纺织服装、工程机械、供应链物流等领域培育一批具有引领作用的行业级工业互联网平台,又面向毛衫、经编、袜业、水晶、轴承、螺杆等浙江省块状经济产业集聚区培育一批具有地方特色的区域级工业互联网平台,还围绕龙头企业上下游产业链生态圈培育一批具有市场竞争力的企业级工业互联网平台。 而“N”的最终目标还是汇聚到“1”,这个“1”就是阿里云负责提供的云计算能力、工业大数据模型和算法以及丰富的生态协同创新模式。也就是说,通过supET工业互联网平台的大数据、人工智能等技术打破知识不对称,打造一个以数据为关键要素的一站式服务平台;再通过工业互联网的网络化、数字化和智能化,打破信息不对称。具体的作法之一,就是让汽车、纺织、物流、化工等行业龙头企业把自己的知识和数据通过supET平台显性化,再逐步转身成这个领域的工业知识和数据模型服务商,反过来服务中小企业。 2018年4月,李伯虎院士、何积丰院士、朱森第主任等9位知名专家高度认可浙江省发挥政府协调作用,加强顶层设计,自上而下推进平台建设的做法,认为supET工业互联网平台紧扣×××《深化“互联网+先进制造业”发展工业互联网的指导意见》精神,符合当前国际工业互联网发展的最新趋势和我国国情,总体架构设计合理,技术方案先进可行,具有创新性,为我国发展工业互联网开辟了新模式、新手段、新业态。 开放型工业大脑为中枢 supET平台基于阿里云的基础能力,提供面向工业领域的三种核心PaaS服务能力:一是工业物联网服务,实现云边端一体化管理,服务了纺织服装、电子制造、机械加工等行业;二是工业数据智能服务,实现工业数据智能化分析应用,服务了光伏、橡胶、化工、电力等数十个行业;三是工业 APP 运营服务,帮助软件开发商和系统集成商实现一站式的工业 APP 开发、集成、托管、运维等工作。 supET平台的核心差异化点就是基于ET工业大脑开放平台的工业数据智能服务。2018年8月1日,阿里云发布ET工业大脑开放平台。ET工业大脑是工业智能数据服务的中枢,可挖掘海量工业数据的潜藏价值,提高良品率、降低故障率、降低能耗,提升工业企业的生产效益。早在2017年3月,阿里云就推出了ET工业大脑,2018年8月进一步推出ET工业大脑开放平台,合作伙伴基于该平台可以轻松实现工业数据的采集、分析、挖掘、建模,并且快速构建智能分析应用。 实际上,工业数字化转型有三层——产线数据的采集、基于数据的全局决策、分析结果与控制指令的实时下达,ET工业大脑只负责其中的三分之一工作,即基于数据的全局决策,其它环节都与生态伙伴合作。在基于数据的全局决策方面,ET工业大脑开放平台将开放3大行业知识图谱、19个业务模型、7个行业数据模型以及20+行业算法模型;同时,生态伙伴可以在该平台上进行编程,将行业知识、大数据能力、AI算法便捷地融合到一起,为工厂量身定制智能应用。 对于企业来说,在ET工业大脑开放平台上,只需两步就可以打造智能工厂:先通过数据工厂实现快捷上云,再基于AI创作间训练出工厂的专属智能。此外,该平台还极大降低了操作门槛,普通工程师也能轻松进行操作,项目实施周期从过去的6个月缩短至最低6天。 为了支持合作伙伴更方便地使用supET平台的基础服务,阿里云决定通过合作伙伴成长计划定向支持生态建设。阿里云将在已有合作伙伴管理体系的基础上,建立supET合作伙伴分级认证管理体系,保障合作伙伴体系的健康发展,确保服务质量。 目前supET平台已经有200多家生态合作伙伴,提供数据采集、数据开发、算法开发、软件开发、解决方案、系统集成等各种服务。未来3年,阿里云将面向工业领域招募上千家生态合作伙伴,以实现智能制造成功案例的规模化复制,加速推动制造业的数字化转型。 实践出真知 (上图为车间里的阿里云工程师) 前面提到,目前我国工业互联网平台主要有三类参与企业,阿里云作为出身互联网系的参与者,supET工业互联网平台何以在半年之内脱颖而出?这一方面是阿里系自身生态的“1+N”效应,另一方面是阿里云工程师积极实践的结果。 在阿里系自身生态效应方面,必须要提到阿里云IoT技术体系。阿里云在IoT物联网领域的核心价值为:提供开放、便捷的IoT连接平台;提供强大的AI能力;实现云、边、端一体的协同计算。目前,阿里云支持2/3/4G、LoRa、NB-IoT、eMTC等95%的IoT相关通信协议,开发者可快速接入阿里云IoT管理平台,降低IoT接入门槛。阿里云的AI人工智能ET工业大脑已经应用到了工厂车间、养猪农舍,大规模赋能实体经济。阿里云还提供了横跨云、边、端多个维度的计算服务和AI能力,包括物联网操作系统AliOS Things、IoT边缘计算产品、通用物联网平台,实现物的实时决策和自主协作,将物联网真正推向智联网。 作为“新制造”的最重要基础设施,supET不仅提供阿里云的丰富能力,还能通过淘宝、天猫、聚划算和全球速卖通等对接消费者和零售商,通过阿里1688批发平台和阿里全球外贸平台服务零售商和批发商,因此supET不仅仅能够将工业互联网推向制造业,还能同时将消费互联网融入工业互联网中来。特别是对消费类制造企业进行轻量数字化改造,为C2M的制造模式摸索经验,最终实现消费互联网与工业互联网的深度融合。 supET可能会成为数字化服务的“淘宝网”,让数字化服务能力成为一种可以在互联网交易的商品,并采用云上系统集成的方式实现一站式服务交付。通过开放包容的线上工业互联网生态,让数字化服务的需求方和供给方在supET平台上相遇、在supET平台上工作,让数字化服务更加简单。 除了阿里云已经有的丰富技术与业务生态外,在研发supET特别是ET工业大脑算法的过程中,阿里云的工程师还要克服到车间写代码的挑战。过去,阿里云的工程师在办公室里写代码,但要解决中国制造企业转型的难题,不能只坐在电脑前凭空想像或根据教科书及相关论文等编出一套工业算法,因为脱离了真实工业生产场景的算法,很容易被工艺专家全盘否定。为此,阿里云的工程师下到一线工厂车间,与工人师傅面对面交流,亲眼看明白每一道工艺流程。 到车间里写代码,已经成为了新一代阿里云工程师的“时尚”。他们之中大多是年轻人,海归博士、毕业不久的大学生、工作十年的资深工程师、金融业跳槽来的“金领”、“老阿里人”等形形×××,却都认同且坚持这种新的工作办法。 “中国制造2025不光是个口号,它将是未来经济的基础。”这是新一代阿里云人的心声,也是supET工业互联网平台的历史责任。随着supET的不断实践,未来将有更多的中国工业制造企业通过这个平台实现数字化转型,迎接云科技时代的全新挑战、奠定未来经济的基础。(文/宁川)
杭州•云栖大会是一年一度的阿里云开发者大会,于2015年升级为“云栖大会”。作为中国云计算产业的年度盛典之一,每年的云栖大会都马云的亮点:2015年,马云认为未来十五年中国将产生三个美国的内需;2016年,马云提出了“五新”;2017年,马云宣布成立了“达摩院”;2018年,与往年的云栖大会有一个非常不一样之处,这就是马云带了一票国际朋友圈,集体登陆阿里云! 来自沃达丰德国公司的云与安全负责人Santi Ribas在2018杭州•云栖大会的ChinaConnect专场上表示,欧洲客户传统上在欧洲开展运营,但现在他们对于进入中国、在中国进行运营、寻找中国市场机会,更感兴趣!Santi Ribas代表了所有出现在2018杭州•云栖大会上国际厂商和跨国公司的心声,他们是:SAP公司全球CEO Bill McDermott、VMware全球COO Duncan Hewett、西门子Mindshare全球COO Ralf-Michael Wagnert等全球技术企业代表,以及来自奥林匹克转播服务公司、亚洲航空、Louis Vuitton、洲际酒店集团等全球客户代表。 不过,这些国际企业不仅仅是登陆阿里云、与阿里云共同开拓市场,更重要的是通过阿里云来体会中国的创新速度:2018年4月,杭州市西湖区人民法院上演了一场“一个人的法庭”,原告在家中、被告在1200多千米开外的律师事务所,靠智能系统在线面对面,而书记员是“机器人”,庭审现场仅法官一人。“你是否已经准备好,按着中国速度创新?”阿里云国际业务首席架构师王宇德如是发问云栖大会上的“老外”们。 跟上中国创新速度 路易·威登(LOUIS VUITTON)是著名奢侈品品牌,迄今已有百余年历史,产品涉及箱包、香水等领域,在全球拥有460多家门店,约19000名员工,旗下14个官方电商平台覆盖了19个国家和地区。路易·威登正在进行的数字化转型不只是开设电商网站,还要打通更多国家和地区、实现全渠道销售、推行以客户为中心的客户关怀项目,并连接所有客户。 LVMH集团大中华区CIO Jianzhang Bao在2018杭州•云栖大会上介绍,路易·威登正在实施数字化转型战略,其中一个服务为:在任何地区和任何路易·威登门店、以及所有官方电商平台提供各种商品,用户只需要点击手机下单就能完成购买。此前,路易·威登的中国官网在2017年上线电商功能,其部分业务已经在阿里云上运行。 与LVMH有同样想法的,还有洲际酒店集团(IHG)。洲际酒店集团在全球近100个国家和地区运营超过5400家以上的酒店,而大中华区到今年6月份已经建立了超过350家开业酒店,还有330多家在建酒店。作为大型的酒店集团,洲际酒店集团正在与阿里云一道积极拥抱并推动数字化转型。 中国正在经历消费升级,这极大促进了旅游业的蓬勃发展,酒店业面临着新的机遇和挑战:如何实现更快更高质量地发展。在不久的将来,洲际酒店集团在大中华区就将迎来400家开业酒店的里程碑,之后如何更好地为客户群服务,更快、更好、更高质量打造酒店的产品,一直是洲际酒店集团关注的问题。通过云平台,运用云计算和大数据整合线上线下的渠道深度融合,塑造符合品牌内涵的差异化产品服务,这是洲际酒店集团期望与阿里云的合作成果。 洲际酒店集团以每年约10个应用的速度向阿里云平台进行迁移,其中包括洲际酒店集团旗下非常重要的增长引擎,诸如智选假日所有的管理产品、管理应用软件,都正在往阿里云平台迁移,并在过去几个月开始大规模的部署。业务向阿里云端迁移之后加速了洲际酒店的数据链打通,使得酒店与酒店之间的碎片化数据得以整合。利用阿里云平台,洲际酒店加快了开店的速度。2018年洲际酒店已经能够达到一周开业一家酒店的速度,预计2019年可以做到每两三天就开业一家酒店。 洲际酒店集团大中华区酒店及业主信息技术解决方案副总裁钟捷在2018杭州•云栖大会上表示,洲际酒店集团未来也会与阿里云在大数据、AI智能计算方面进行更深度的合作。钟捷表示,选择阿里云是因为阿里云在云计算和云服务商领域佼佼者,在中国居于领先地位,其次也非常看重阿里整体在互联网领域的广阔经验,希望在云平台的基础上有更多的数字化和创新思维的碰撞。 除了LV和IHG外,阿里云国际业务首席架构师王宇德介绍,意大利豪华邮轮公司Costa Cruises与阿里云合作,为邮轮上的中国游客提供基于人工智能的语音服务。当船上的中国游客有任何问题,都可以用中文问房间里的智能音箱,人工智能语音助理可以回答超过97%的问题,这样就让Costa Cruises可以更好的服务中国游客,同时减少了语言沟通方面的障碍。 加入中国创新平台 中国市场有何独特之处?这里有10亿人口,而美国只有3亿左右的人口。庞大的人口数量,带来了庞大的手机和互联网用户数量,在全球哪里能找到这么庞大的实验场?只有中国。这是VMware高级副总裁、亚太及日本地区总裁Duncan Hewett在接受2018杭州•云栖直播间访问时所表达的。2009年的时候,Duncan来中国时还使用纸币;前不久,他连续三天没有使用任何现金。“这个市场变化如此之快,我们要赶上。”怎么赶上?加入进来! 9月20日,在2018杭州•云栖大会上,全球企业软件领导厂商VMware与阿里云宣布达成战略合作,提供面向企业的混合云解决方案,全面帮助企业数字化转型。阿里云是VMware在中国的首家“Cloud Verified Partner”(云认证合作伙伴 )。VMware全球首席运营官Sanjay Poonen来到了2018杭州•云栖大会,他解释何为“Cloud Verified Partner”。之前,VMware在全球有4500多家VCPP(VMware Cloud Provider Program)合作伙伴,其中有超大规模云服务商愿意与VMware进行更深入的合作,即为“Cloud Verified Partner”。 阿里云总裁胡晓明介绍,本次与VMware的合作相当深入,采用深度融合的方式,用户一个帐号可以横跨两大体系。双方的团队从今年4月份就开始了对接,VMware美国团队和中国团队在背后做了大量工作,与阿里云的工程师们一起,尽快向市场推出合作的产品和服务。在全球前三大IaaS供应商中,VMware已经与其中的两个达成了战略合作,一个是AWS,另一个就阿里云。显然,与VMware的本次战略合作,是阿里云自己技术水平过硬的结果。 SAP是另一家来到2018杭州•云栖大会的全球企业级软件巨头。SAP作为全球最大的企业级软件供应商之一,过去的46年来在25个行业和7个业务领域的处于领先地位:全球76%以上的交易均采用SAP技术和解决方案;1.5亿云用户在180个国家和地区使用SAP的解决方案;全球价值1.9万亿美元的业务在SAP业务网络上运行。 在2018年9月20日的杭州•云栖大会上,SAP 公司CEO Bill McDermott与阿里巴巴集团CEO张勇共同宣布战略合作,计划将在阿里云IaaS上提供SAP S/4HANA Cloud 和SAP Cloud Platform,以帮助客户加速向云端迁移,成为智慧企业。阿里巴巴和SAP早在两年前就达成初始合作,通过阿里云为中国客户提供企业级的云服务。本次杭州•云栖大会,SAP CEO Bill McDermott亲自到场,充分显示了过去两年多年,SAP对阿里及阿里云的了解和认可。 Bill McDermott 表示,“云是技术发展的最佳方式。中国是SAP的第二故乡,对我们来说是一个非常重要的市场。阿里云为我们提供基础设施,将世界上最好的、最现代化的ERP系统放在上面,这样就可以为客户服务,创造巨大的价值。“ 另一家选择在今年落户阿里云的是全球工业互联网领域最著名的西门子MindSphere。9月19日,阿里云和西门子就工业物联网操作平台MindSphere落地中国内地市场的技术路线图和具体实施计划进一步签订了合作协议,双方计划于2019年第一季度末面向国内客户发布“MindSphere on Alibaba Cloud”正式(general availability)版本。 作为Paas层面的MindSphere,是西门子基于云IaaS的开放式工业物联网操作系统。此前,MindSphere2.0版主要和欧洲软件商SAP合作,进驻在SAP HANA云上。2017年10月,MindSphere2.0升级到3.0版本,西门子选择了亚马逊AWS云平台。西门子(中国)有限公司执行副总裁兼数字化工厂集团总经理王海滨在2018杭州•云栖大会上接受采访时表示,“我们认真地评估了云基础设施厂商的能力,亚马逊云服务、微软Azure和中国的阿里云,都属于第一阵营。”而MindSphere在中国落地在阿里云上,“原因在于阿里云基础设施的成熟度、性能所达到的水平是走在前面的。” 与中国一起走向全球 世界是平的。这本2005 年出版的全球热销书,在今天的互联网和云计算时代,得到了有效验证。今天,阿里云在全球有18个数据中心区域、49个可用区、1500多个CDN节点,有效打通国内外不同电信运营商网络之间的互联互通。在阿里云的体系,一个帐户就可以通遍全球的阿里云基础设施,而无需中国及中国以外两套帐户。 来自于沃达丰的Santi Ribas介绍,一家专注于汽车行业的德国工程类公司,有很多创新体系和产品。该公司一是利用技术优势进入中国,二是高效管理团队要与中国团队无缝合作。通过阿里云平台,实现了在法兰克福和上海阿里云之间的快速连接,在两个云之间的快速对接、通过云上数据平台的共享,通过中国的互联网就能快速查询和接入总部数据,为上海客户提供更好的数据支持。 而9月19日,在2018杭州•云栖大会上,奥林匹克转播服务公司 (OBS)CEO伊阿尼斯·埃克萨科斯(Yiannis Exarchos)与阿里云总裁胡晓明一起发布了奥林匹克转播云。奥林匹克转播服务公司将通过“奥林匹克转播云”平台,向所有的奥运会持权转播机构(RHBs),及时、高效、安全地传送奥运会的相关影像;同时各个转播机构可以在云上设置专属工作台,直接获取奥林匹克转播服务公司发送的内容和产品。 “奥林匹克转播云”利用阿里云的云计算基础设施,为所有奥运会持权转播机构创建了最佳的媒体转播环境;平台上的媒体直播服务,还为转播机构尝试新节目创意或进行互动直播,提供了安全的测试环境。在奥运会比赛结束后,转播机构既可以选择把“奥林匹克转播云”上存储的内容,迁移回本地,也可以选择将内容保存在“奥林匹克转播云”上,用在今后的奥运转播中。“奥林匹克转播云”将在2020东京奥运会的转播中投入使用。届时,阿里云、英特尔、OBS三方还将合作为转播机构提供虚拟现实直播服务。 显然,“奥林匹克转播云”是对阿里云技术实力和全球化布局的认可。2018杭州•云栖大会期间,阿里云与中国联通国际有限公司签署了南非节点基础设施及SAG产品合作协议。双方在南非约翰内斯堡按照阿里云标准共同建设和运营网络节点基础设施,并就阿里云新网络产品(智能接入网关,简称SAG)在南非本地的入网认证、本地物流、市场推广、产品运营、线下服务等环节进行深度合作。作为国内首家将服务拓展到非洲大陆的云服务商,阿里云将和中国联通国际有限公司及所属南非运营公司合作,基于双方在非洲大陆部署的首个“无缝连接”阿里云全球云资源的网络节点,通过SAG产品共同为南非本地及中资企业等客户提供敏捷弹性、智能快速、安全可靠、低成本的企业混合云解决方案。 在非洲,阿里云还与肯尼亚共同发布了“肯尼亚野生动物智能保护项目”。该项目利用IoT、大数据和AI等技术,帮助肯尼亚政府建设一套可持续有效对野生动物进行保护的数字化系统。借助阿里云IoT物联网技术,可以24小时监测野生动物位置、移动速度、体温等多维度信息。利用大数据和AI等技术,无人机、红外相机将自动识别进入保护区的是否为盗猎者,并进行预警和巡护人员调度。同时还可以实时监测、采集保护区内包括天气、生态、动物等信息,用于科学研究、保护区监控、动物习性等各方面分析。 本文一开始提到“一个人的法庭”,“这些新杭州故事,明天将会在更多城市发生。”阿里云总裁胡晓明在2018杭州•云栖大会上表示,将以杭州为起点,向全球更多城市输出数字中国的“杭州方案”。 在马来西亚,ET城市大脑在杭州率先成功的特种车辆优先调度方案被吉隆坡引入,测试显示救护车到达现场的时间缩短了48.9%。在中东,阿里云正在和有“中东MIT”之称的哈利法大学共同探索解决能源领域的重大前沿问题。 随着SAP、VMware、西门子等重量级国际科技企业的产品和服务登陆阿里云,以及聚集在阿里云周围的国际企业客户越来越多,阿里云正在形成强大的生态量能。这是一种强者恒强、赢家通吃的局面,这些B2B企业会为阿里云带来更多的合作伙伴和客户。可以说,今天的阿里云,正在迎来最好的时候。(文/宁川)
(上图为SAP公司CEO孟鼎铭与阿里巴巴集团董事局主席马云会面) 当前,中国经济增长进入中速平台和高质量驱动阶段。面对产业结构调整、资源环境挑战、数字技术与创新带来的行业颠覆与机遇,中国企业转型势在必行。然而,过去三年,仅有少数企业突破转型困境,还有不少企业应用数字技术力度不足,目前中国各行业的数字能力建设尚处于初级阶段。 中国企业如何能够快速实现数字化转型?SAP作为全球最大的企业级软件供应商之一,过去的46年来在25个行业和7个业务领域的处于领先地位:全球76%以上的交易均采用SAP技术和解决方案;1.5亿云用户在180个国家和地区使用SAP的解决方案;全球价值1.9万亿美元的业务在SAP业务网络上运行。自2010年以来,SAP就对解决方案组合进行了重大修改,以支持全球企业的数字化转型。 2018年,SAP推出了智慧企业框架,将投资350亿美元开发的以数据为中心的智能平台SAP HANA以及收购的各种企业业务云解决方案结合起来,从客户体验、制造与供应链、数字核心、员工管理和网络与支出管理五大维度为企业快速实现数字化转型,具体落实到重塑生产制造与供应链、变现客户体验与销售线索、自动化采购与费用管理、智能化员工体验与人才管理等四大场景,为企业实现端到端重构大型流程、增强企业智能、实时连接产业价值链、简化IT运营、基于云的加速创新等五大能力。 在2018年9月20日举行的杭州云栖大会上,SAP 公司CEO孟鼎铭与阿里巴巴集团CEO张勇共同宣布战略合作,计划将在阿里云IaaS上提供SAP S/4HANA Cloud 和SAP Cloud Platform,以帮助客户加速向云端迁移,成为智慧企业。SAP公司还在2018杭州云栖大会上全面展示了数字化转型的四大场景。 五大维度推进数字化转型 (上图为SAP 公司CEO孟鼎铭与阿里巴巴集团CEO张勇宣布战略合作) 市面上关于数字化转型产品、技术和服务种类繁多,特别是最近两年来人工智能热度的蹿升,很多厂商都声称能够提供以人工智能为核心的数字化转型解决方案。但其中不少厂商,要么是新进入企业级市场领域,仅以单点技术取胜而缺乏已有生态的支持;要么就是来自于传统企业级软件领域,但在云和人工智能等新兴技术领域的投资力度不够。SAP则在企业端到端的完整解决方案中皆融入了人工智能技术。 根据中国软件网、海比研究联合中国软件行业协会应用软件产品云服务分会发布《2017年中国云ERP市场研究报告》,SAP在2017年中国云ERP市场份额排名第一。该报告强调,SAP的ERP云解决方案费用相较于本地部署低了很多,部署时间也大为缩减,旗下套装也能满足包括大型、中型、小型企业的不同需要。 2015年2月,SAP推出了史上最重要的产品:SAP S/4HANA第四代ERP套件。基于HANA内存实时数据库,S/4HANA可在本地内存中处理海量数据,能显著降低数据处理时间,还提供公有云部署、本地部署及混合云部署三种模式。2018年6月,SAP进一步推出了另一个重大的新产品:SAP C/4HANA全新CRM套件。SAP C/4HANA是对收购的Hybris、Gigya 和 CallidusCloud解决方案整合,支持所有前端业务功能,如消费者数据保护、营销、商务、销售和客户服务等,以消费者为核心的C/4HANA不像传统CRM软件那样仅关注销售。 以SAP S/4HANA为数字核心,整合新发布的SAP C/4HANA以及之前陆续收购的采购云Ariba、费用云Concur、人力资源管理云SuccessFactors等SAP云应用,再结合SAP云平台和SAP HANA数据管理套件的数字平台以及SAP Leonardo智能技术,这些为SAP所提出的智慧企业打造了五大维度的能力:提供一流的客户体验并重构业务模式;实时管理行业价值链,推动生产力的逐步改变;使员工能够利用数字技术实现更多价值。 SAP智慧企业从客户体验、企业制造与供应链、数字核心、生产力和员工管理能力和网络与支出管理五大维度,为企业实现快速的数字化转型提供了一个完整的技术能力平台:SAP HANA将所有SAP解决方案转移到基于云的实时数据管理平台;SAP Data Hub跨数据源提供编排和元数据管理;SAP Cloud Platform作为一个开放平台,通过API和微服务提供创新;从前台到供应链、从物流到执行的全面客户体验;把基于人工智能技术和自然语言的下一代自动化嵌入到解决方案中,彻底改变人与系统的交互方式。可以看出,SAP智慧企业是一个完整的从五大维度加速企业数字化转型的体系。 落地数字化转型 SAP智慧企业由智慧企业套件、数字平台和智能技术三大部分组成,其中的智慧企业套件以场景化方式为企业落地从五大维度的数字化转型解决方案,切实把人工智能等技术与企业的实际业务流程结合起来。 SAP智慧企业套件包括一个数字核心和四大业务场景,其中的数字核心即为SAP S / 4HANA,这是适用于25个行业内所有组织的智能ERP,其简化的架构将实时数据转换为智能洞察,推动更智能、更快速的决策。SAP S / 4HANA还具有支持语音、具有上下文感知能力、精通业务的数字助理,汇集了最新的数字用户体验。通过人工智能技术、自然语言、预测分析提供的智能和学习功能,SAP S / 4HANA实现关键流程的自动化。而SAP S /4HANA的下一代流程可帮助组织通过技术和创新的智能应用重构业务,采用行业最佳实践来启用新业务。 具体到四大数字化业务场景套件,则包括重塑生产制造与供应链、变现客户体验与销售线索、自动化化采购与费用管理、智能化员工体验与人才管理等。 其中,制造与供应链场景套件,让企业可以数字化整个关键的制造和供应链过程,把机器学习、AI、区块链等嵌入业务流程,通过物联网和数字孪生双胞胎管理实时扩展的供应链,推动企业业务和商业模式的转型。SAP 智能ERP已经在企业内部实现了端到端业务流程,嵌入AI等新技术后就可以创造端到端的从设计到运营的智慧流程:通过前端交互界面抓取用户需求,把数据实时传送到ERP后台,让设计团队可以创新产品和服务,还可通过SAP采购系统获得外部设计团队支持;在柔性化生产方面,支持小规模定单生产、个性化柔性制造。这样就完成了从收集客户声音,到围绕用户需求的产品设计,再到后台柔性化生产制造全新制造与供应链场景。 在2018杭州云栖大会SAP展台上,可以看到“从设计到运营——柔性智造”的展示,展现从基于实时客户洞察的研发设计、到便捷的在线选配和订单评估、再连接数字化的柔性制造平台等,并把这些环节融会贯通,快速转化为小规模定制产能。以车企的柔性智造为例,车企从公众平台、用户反馈、结构化调研等渠道进行基于机器学习的用户需求分析,再进行需求驱动的智能设计,通过灵活的选配定制和柔性产线配置,辅助以制造可视化和智能分析,最终利用互联打造智慧工厂。 客户体验场景套件,借助SAP C /4HANA可以深入洞察客户行为,预测客户期望,并积极主动地满足客户的需求,最终交付优秀而独特的个性化客户体验。在2018杭州云栖大会SAP展台上,可以看到“从线索到现金——智慧商机转化”的展示:通过构建360度客户视图,及时洞察客户需求,并通过智能系统,快速完成咨询、报价、交易及各种服务,在提供完美客户体验的同时,加速商机转化。例如,销售人员可以利用客户端的物联网,获取设备的运行情况并将之转换为销售线索;而C/4HANA还可以进行销售订单的完成率预测、报价转换率预测等精准销售预测;SAP Co-Pilot数字助理则能直接嵌入报价等销售流程中,让销售人员通过自然语言与数字助理对话,完成各种数据的调用和综合分析。 采购网络与费用管理场景套件,利用SAP Ariba、SAP Fieldglass和SAP Concur等SAP业务网络,以简化差旅、费用和发票管理;通过全球最大的商业网络进行寻源、采购和付款;管理外部员工并与他们互动,从而提高可视性,增强员工自主力,控制成本并降低风险。 员工管理场景套件,借助SAP SuccessFactors和SAP Fieldglass以及SAP Fiori,简化工作流程、提高生产力和创新能力。在2018杭州云栖大会SAP展台上,通过“从员工体验到人才决策——全面劳动力管理方案”的展示,可以了解到SAP SuccessFactors如何为员工提供包括培训、考核、出差,甚至异地救援等在内的便捷和人性化体验;帮助HR和业务管理者实现端到端的人才全生命周期管理;给决策层实时的劳动力洞察与分析。 赋能企业数字化转型五大能力 (上图为SAP展台的柔性制造展示) SAP智慧企业不仅是业务流程自动化,而是一个愿景,包括SAP构想的企业未来的业务模式、员工工作模式以及客户体验。通过端到端的集成、结合深入的行业专业知识、把商业智能融入产品,SAP智慧企业为企业实现了端到端重构大型流程、增强企业智能、实时连接产业价值链、简化IT运营、基于云的加速创新等五大数字化转型的能力。 在整个SAP智慧企业三层框架中,“智能技术”即指SAP Leonardo平台。借助SAP Leonardo,能够将智能技术嵌入客户的核心流程中,支持客户利用自己的数据,发现模式、预测成果并提供行动建议。对于想要进一步加速创新的客户,SAP将提供行业创新软件包和开放式创新服务,支持利用设计思维方法,构建行业特定的全新业务模式。 如今,SAP Leonardo Machine Learning已被嵌入SAP所有产品应用中,包括 SAP S/4HANA Cloud(ERP云)、SAP C/4HANA和SAP Ariba(采购云)等。SAP Leonardo Machine Learning Foundation 可支持客户开发自己的应用,新增了物体检测、图形化文字识别及文本分类等智能服务。SAP Conversational AI能帮助企业开发智能聊天机器人,提供强大的端到端工具包,用于训练、开发和监控聊天机器人。 而SAP智慧企业的“数字平台”层,则是借助 SAP Cloud Platform 和 SAP HANA Data Management Suite,轻松收集、连接和协调数据,以及集成和扩展智慧企业套件内的流程。SAP Cloud Platform Blockchain 是SAP面向企业推出的全新区块链即服务,支持客户利用 Hyperledger Fabric和 MultiChain等区块链技术,轻松构建和扩展可信业务解决方案。截止2018年6月,已有 65 家企业参与了SAP区块链联合创新计划,借助区块链增强的制造和供应链产品,提高交通运输、食品和药品等行业的透明度、安全性和协作性。 在2018杭州云栖大会SAP展台上,可以看到多种利用SAP智慧企业解决方案的实践。“智慧养鸡场”展示了基于SAP Cloud Platform云平台和机器学习技术开发的智慧养鸡场方案,能够实时监测鸡场状况,及早发现疫情并采取行动,大幅减少鸡场的损失,提升鸡场的利润,并通过优化用药提升鸡肉质量。有趣的是,SAP还可以通过机器学习,训练对于鸡咳嗽、打喷嚏等异常声音的识别,以更好的监控鸡场疫情。“智慧养鸡场”是SAP联合创新中心与客户合作打造的新型解决方案。“智慧医疗冷链”展示了SAP与宜链物联网(iLian)联手打造端到端的温控溯源体系——从药品生产车间出发,监控整个在途运输状况,只要扫码即可追溯疫苗全周期状况,包括追踪药品流动过的地点和温度,“智慧医疗冷链”是SAP全球Co-Innovation Lab研发。“智慧预测维护”展示了基于SAP Cloud Platform云平台的Sky Eye,监控汽车电池状况并及早预警,一旦发生状况可提供远程维修,保障用户的交通出行安全。 通过AI、大数据、区块链、物联网等技术,SAP与合作伙伴一起赋能企业数字化转型。SAP认为客户需要从当前的架构转向新的数字就绪环境,许多公司都有大量的定制化内容,没有哪两家的数字化转型方案是相同的。SAP与17个全球战略服务合作伙伴一起合作,通过优化客户的实施过程,推动以商业价值为中心的方法和路线图、扎实的业务案例和加快的投资回报。 今天,凭借多种成熟的解决方案和以设计思维为主导的创新方法,SAP致力于帮助企业实现数字化转型之旅,从而成为一家智慧企业。SAP强调,数字化转型是一个漫长的旅程:越早开始,就越会在数字经济中获得竞争优势。2018杭州云栖大会期间,SAP公司CEO孟鼎铭还与阿里巴巴集团董事局主席马云会面。正如马云在大会上表示:“我们都相信未来,我们都拥抱未来。用了新的思想、新的理念、新的技术的企业,一定会成为未来的赢家。”(文/宁川)
根据Gartner 2017年全球公有云IaaS市场份额报告,全球前三甲已无悬念:AWS、微软与阿里云,紧随阿里云后面的是Google和IBM。在竞争激烈的以公有云为代表的下一代全球企业IT市场,终于不再是IOE一统江山的局面,阿里云把一抺中国红带入了全球视野。而且,还很可能是永远性的,因为2016年Gartner这份报告中还统计了14家厂商,到了2017年就只剩6家! 全球公有云IaaS前五大家都是自研技术的代表,而阿里云的自研技术亦不逊色于其它四大家。在到底是自研还是直接使用外部现有技术这两条路线之争中,阿里云最终选择的是走自主研发道路。然而,自研技术这条道路并不是阿里云自己求来的,而是在阿里自身业务发展过程中,随着业务规模的不断扩大而被倒逼出来的。在这个过程中,突破了现有技术的天花板。 所以,不是阿里云要抛弃传统IT架构,而是传统IT架构无法承载阿里云的规模;也不是阿里云刻意不用现成的技术,而是这些技术也无法承载阿里云的规模;这些都是2009年写下第一行代码时的阿里云工程师们所想像不到的。当“一花一世界”不再是比喻,而是一朵花就变成一个世界那么大时,该怎么办?可以说,今天的阿里云技术也不是神话,也是在解决问题的过程中,人肉打磨出来再凝聚沉淀下来的经验总结。 打掉了Hadoop的飞天5K集群 在整个阿里云的飞天系统研发历史上,5K集群非常具有典型代表意义。代号为云梯1的机群,搭载了开源的Hadoop大数据系统;代号为云梯2的机群,承载的是阿里云当时自研的ODPS(Open Data Processing Service)开放数据处理服务以及底层的飞天系统,ODPS后就是阿里云对外提供的自研大数据计算引擎MaxCompute。云梯1和云梯2都是当时阿里集团处理海量数据存储与计算的系统,2008年两个云梯启动时,阿里内部已经有了9个Hadoop集群。 云梯1和云梯2这样的竞争在阿里内部其实非常普遍,技术团队内部的争论非常厉害,甚至当着马云的面也不掩饰。Hadoop作为大数据的标志性项目,本身更加成熟,在技术人员心目中地位很高,感情很深,但是可控性、安全性的问题可能更会在长期成为过不去的坎儿。 2013年8月15日,基于阿里云飞天的云梯2规模达到5000台服务器规模,而且实现了跨机房,并经受了整机房断电的严苛考验。该平台计算100TB排序只需30分钟,远超Yahoo!在当年7月刚刚创造的71分钟世界纪录。阿里云成为世界上屈指可数的具备这一能力的公司之一,也是第一个对外提供这种大规模计算能力的公司。对于阿里云来说,2013年是拐点。 所以,后来阿里的自研技术团队都实行了自研技术与原有技术两套方案并行、灰度逐步切换流量、出现问题及时回滚等保护机制。一句话总结,阿里自研技术能够在阿里内部站住脚并赢得长期发展,是阿里内部的市场竞争、优胜劣汰的自然结果,并不是权威压制。 随着飞天5K项目的成功,飞天平台用技术实力证明了其在“性能强劲、架构灵活,可支撑业务飞速发展;技术自主可控,安全可靠;成本更具优势”等方面,远超Hadoop集群的优势。2014年,阿里启动“登月计划”, 将计算和数据处理统一转移飞天平台之上,并从长远的安全可控等角度考虑,支持云梯2上、云梯1下。 不过故事并没有就此结束,在云梯1和云梯2竞争到5K规模的时候,两个技术方案的原理其实是不一样的,云梯2是基于阿里业务、从底层硬件到上层应用的完整技术体系设计与优化,为未来的服务器规模的无限扩展打下了基础,这也就是今天阿里云能够成为全球前三云计算的前提。Hadoop等技术的终极设计目标并不是为了无限扩展,而阿里云很多自研技术的一个基本要求,就是要支持“无限扩展”,甚至直到今天还在为这个目标努力中。 为了中小企业而“飞天” 今天,可以在各种渠道读到阿里云自研的故事,包括王坚如何在阿里内部被各种骂。王坚当时坚持做云计算,不仅阿里内部都看不懂,外部的李彦宏和马化腾等大佬也看不懂,都认为做云计算没有前途。有一年在阿里云事业部年会上,王坚一上台就委屈地哭,他手拿话筒,对同事说:“我挨的骂甚至比我一辈子挨得骂还多,但是我不后悔。” 但为什么是阿里做成了云计算?做成了飞天?飞天早期曾经有一幅对联:梦想永在凌云意意气风发,代码成就万世基积沙镇海。这样的豪情壮志背后,真正掏钱为自自主研发买单的是马云。马云有一句经典的话:我愿意给阿里云每年投10亿,连续投十年,做不成再说。 2009年,马云要求当时的胡晓明创业阿里金融,为的是解决中小企业融资的问题,每笔贷款不超过100万、通过线上方式完成,而且必须要跑到阿里云上。胡晓明后来回忆,“2009年6月1日,马云找我谈,说你必须创业,你一定要考虑,如何解决当年在做阿里巴巴的时候借不到钱的时候痛苦,必须去解决,所有中小企业的融资难问题。” 这就是胡晓明与阿里云的渊源。从2009年开始,胡晓明创立阿里金融、王坚创立阿里云,阿里金融还要跑在阿里云上,相当于“一边盖房子,一边还要搞装修”,而且阿里金融还是金融业务,对底层计算的要求更高。 阿里金融和阿里云这对难兄难弟,开始了一起“飞天”之旅。“明明可以坐高铁,却偏偏要骑自行车去上海。”这是当时研发工程师对阿里金融要跑在阿里云上的评价。 这其中就有很多故事。阿里云第一任技术总监林晨曦是跟随王坚加入最初的阿里云,王坚与林晨曦之前都为微软亚洲研究院同事。林晨曦回忆后来做5K项目时,从腾讯新来的同学入职阿里云,第一天上班的时候看到我们说,你们是真的做! 林晨曦感叹,可能当时很多人都很难想象,我们可是真的做。阿里不仅是真的做云计算,而且一开始就服务于阿里金融这样对底层计算基础设计要求极高的互联网金融业务,更不用说在2009年的时候,互联网金融本身就是一个新鲜事物!马云要求阿里金融必须跑在阿里云,因为必须要给阿里云一个“压力”。 林晨曦回忆:在阿里云的四年,像是过完了一辈子;以后的事情,都是下辈子的。很多阿里云的新同学,都是刚入职就马上出差。而那几年,阿里云的离职率也非常之高,很多人都坚持不下去。阿里金融在内部又称为“牧羊犬项目”,在与早期阿里云的合作过程中,经历了“人肉云计算的巅峰时期”,“分布式计算”也被调侃成解决“分步试”的问题。 曾鸣后来回忆:整个阿里巴巴做云计算的过程也非常艰难,太辛苦,做不下去了,很多人觉得不可能做成,虽然相信未来是美好的,但是实际是坚持不下去的,基本上两年淘汰三分之一。 2014年底,胡晓明接手阿里云并任总裁,在继续保持大力投入技术自主研发的同时,阿里云的商业化进程实现爆发式增长。12306、微博、春晚、世界杯等国民事件背后都有阿里云的支撑。 自主研发并不意味着不开放。到目前为止,阿里一直是开源社区的坚定支持者和杰出贡献者。阿里对于开源技术的贡献,从最初的全面掌握开源技术、贡献众多的Bug和支持各种开源标准,例如阿里是Linux基金会、MariaDB基金会、CNCF、Xen project等数十家开源基金会的顶级会员;到后来把自研技术拿出来开源作为对开源社区的回馈,从2011年开始阿里就持续向开源社区做出贡献,这是阿里一条独特的从开源中来、回归到开源但又高于开源的道路。 目前阿里开源和维护的开源项目超过150个,涵盖中间件、开发框架、数据库和各种工具类软件,其中阿里开源的Weex、Ant Design、Dubbo、Fastjson 在GitHub上Star已经破万,阿里在GitHub上Star数超过170000,组织排名前十。GitHub 2017年数据统计显示,阿里巴巴是唯一一家入围GitHub 顶尖贡献名单的中国公司。 今天,阿里云站立在世界之巅,成为全球公有云前三强,背后是技术与技术、技术与人、人与人之间无数博弈的结果。阿里云的历史告诉我们,新技术的本质是人们根据现实的需求,对已有技术的重新组合,从而解决新的问题。以前,IOE是这样成长起来的,现在阿里云也是走的这条道路。归根结底技术都是人的产物,人才是真正推动技术进步的主要因素。所以,真正创造阿里云的,是阿里人。(文/宁川)
(上图为蚂蚁金服副总裁刘伟光) 蚂蚁金服到底是一家做什么的公司?在蚂蚁金服开放金融科技之前,大家会理解蚂蚁金服是一家以互联网金融业务为主营业务的公司,支付宝就是蚂蚁金服的互联网金融平台和工具。互联网女皇玛丽•米克尔在2018《互联网趋势报告》中列出全球TOP20互联网科技公司排行榜,蚂蚁金服与腾讯、阿里巴巴跻身十强,名列第9。截至2018年3月31日,支付宝与其全球合作伙伴的年活跃用户数达8.7亿。 然而,从2016年开始,蚂蚁金服宣布开放自己的金融科技,当年推出蚂蚁金融云以及“互联网加速器”计划,希望在5年内帮助1000家金融机构向新金融升级。2016年到2018年是蚂蚁金服猛烈开放自研科技的两年,2017年6月14日蚂蚁财富开放平台大会上,时任蚂蚁金服CEO的井贤栋宣布“蚂蚁金服所积累的技术能力和产品,将全面向金融机构开放,成熟一个开放一个。” 南京银行、光大银行、浦发银行、中国人保健康等相继与蚂蚁金服合作,支付、理财、保险、小微企业金融、农村金融、消费信贷等所有蚂蚁金服金融产品都已经与金融机构开放合作,数据库、中间件、大数据等蚂蚁金服核心技术陆续开放,而这些仅仅是冰山的一角。2018年7月2日,蚂蚁金服副总裁刘伟光透露之前承载蚂蚁金服金融科技开放的金融云品牌即将全面升级,新品牌将诠释蚂蚁金服金融科技对外开放的宏大构想。 刘伟光介绍,蚂蚁金服金融科技的团队包括业务拓展与咨询团队、架构师团队和交付团队构成,这些团队的背后就是蚂蚁金服庞大的研发和工程师团队。从蚂蚁金服金融科技的团队构成,就可以看出蚂蚁金服金融科技的“野心”:要做新一代世界级金融科技供应商,成为数字金融商业时代的助推器。 数字金融要实现普惠机遇 今天蚂蚁金服正在做的事情:一方面通过支付宝等互联网金融业务积累的基础之上,发明面向全社会的数字金融商业愿景;一方面通过金融科技开放,把蚂蚁金服所积累的所有技术,根据数字金融愿景结合客户的实际需求,形成一个又一个的金融科技解决方案,最终支撑客户一步一步走向数字金融大未来。 2018年6月8日,蚂蚁金服对外宣布新一轮融资,融资总金额140亿美元。蚂蚁金服方面表示,本轮融资将主要用于支付宝的全球化拓展,自主科研投入和全球顶尖人才的招募,从而提升支付宝及其合作伙伴向全球消费者和小微企业提供普惠金融服务的能力。井贤栋就此表示:“科技是面向未来的核心驱动力,我们将持续强化在区块链、人工智能、安全、物联网和云计算方面的布局,用科技驱动包括金融服务业在内的现代服务业发展,并进一步打造开放的生态系统,通过技术投资和创新,在不同的国家寻找合作伙伴,为全球个人和小微企业带来更安全、透明、高效和普惠的金融服务,让数字经济的红利惠及到更多的人群。” 从井贤栋的描述来看,数字金融就是普惠金融的商业模式,是互联网金融的高阶阶段。简单理解,所谓数字金融就是金融形态像水和电那样可以被随时接入,随时成为所有传统企业和产业进行转型升级以及向数字经济发展的基础设施。这个愿景,在今天由支付宝和微信为代表的第三方支付实现了一小部分——遍布大街小巷的几乎所有商铺都可以使用手机支付,甚至马云都惊呼街边的乞丐都可以扫码收钱。 扫码支付仅仅是数字金融的一个开始。2018年6月25日,全球首个基于区块链的电子钱包跨境汇款服务在香港上线,港版支付宝AlipayHK的用户可以通过区块链技术向菲律宾钱包Gcash汇款,第一笔汇款仅耗时3秒钟,而传统的跨境汇款因过程复杂,到账通常要10分钟到几天不等。刘伟光介绍,他最近去拜访了一家南方的银行,该银行位于一个旅游城市,这个行长希望实现一个不像银行APP的银行APP,比如可以做成旅游APP的样子,通过新模式来摆脱传统银行APP单一转账功能。而这家南方银行的需求还可以反过来思考:当下那些旅游APP,能否根据自己的场景,便捷地创建旅游金融服务呢?比如根据热点而创建时效性强的旅游保险等。 过去,一个比特承载的是数字信息,未来一个比特将同时承载数字和金融信息,这就是未来的数字金融,而且是数字金融、数字经济、数字社会三位一体的未来商业世界。从这个角度来说,数字金融与智慧地球是一个量级的愿景,解决的是全人类使用和消费金融的问题,创造的是全人类面前平等的金融机会以及由此带来的发展机会。 开放金融科技推动数字金融发展 实际上,数字金融是一个发展中的社会和商业愿景,而支撑数字金融的金融科技也是一个发展中的科技体系。 到目前为止,到底什么是FinTech(金融科技)?其实一直没有一个清晰的定义。刘伟光强调,为什么只有金融行业出现了Fintech金融科技,其它行业并没出现制造科技、零售科技等词汇?一个关键的原因在于,传统上的IT技术在金融行业属于支撑地位,而现在随着支付宝等互联网金融形态的出现,IT技术与金融业务已经合二为一,甚至IT技术还在引领金融业务形态的发展,这就是金融科技的精髓和核心思想。 一个典型的例子是余额宝。在基金证券行业,余额宝背后的天弘基金就走过了科技推动业务高速发展的历程。过去基金公司通过网银销售基金,而天弘基金利用互联网入口和大数据的精准营销与触达技术,在短短三年时间一跃成为世界第一大货币基金,而之前中国最大的基金公司也要用二十年才能成为第一大基金公司,这就是科技为这个时代带来的伟大变革。 今天,支付宝已经形成了一个完整的金融科技支撑下的金融服务业务体系。如今的支付宝是以每个人为中心,在中国拥有5.52亿活跃用户的生活服务平台,目前支付宝已发展成为融合了支付、生活服务、政务服务、社交、理财、保险、公益等多个场景与行业的开放性平台。除提供便捷的支付、转账、收款等基础功能外,支付宝还能快速完成信用卡还款、充话费、缴水电煤费等上百种城市和生活服务,还可享受消费打折、好友建群互动、轻松理财以及信用积累等。 而这一切的背后,不是一项或几项技术,而是一个技术体系。刘伟光强调,在互联网金融发展过程中,大量依赖于新兴技术来推动业务发展,但这并不代表某项新兴技术就代表金融科技的全部,无论是区块链、人工智能还是大数据,都不能完整表达金融科技的含义。金融科技是一个技术体系经过长期发展演变后,金融业务与科技相互促进、相互融合、相互渗透的产物。金融科技涵盖了所有新兴金融技术,包括区块链,人工智能,智能风控,同时包括IT基础架构升级换代的技术体系,也就是大家熟悉的云计算和大数据,所以是一个完整的支撑和实现金融业务的技术堆栈。 当然,实现数字金融这样一个宏大的愿景,将是一个长期的发展过程。而蚂蚁金服多年发展出的金融科技是一个完备的技术体系,如何把服务于蚂蚁金服内部的金融科技剥离出来形成可以对外输出的技术解决方案,这就是刘伟光团队要解决的问题。之前,蚂蚁金服内部的技术团队已经陆续开源了自己的核心技术,比如OceanBase数据库的对外开放、SOFA中间件的对外开放等,但蚂蚁金服内部仍有大量的技术有待于独立出来为外部的金融机构所用。 刘伟光带领的金融科技团队,摸索出六大金融科技与业务结合的优先路径:移动优先、人工智能增强客户体验、360度大数据中台、基于人工智能的风控体系、分布式金融核心以及基于区块链的场景创新。这六大路径,是当前期望数字化转型的传统金融机构可以马上采用的金融科技解决方案。刘伟光强调,过去银行业、金融业、保险业等进行IT系统升级建设时,要找国外的IOE等公司构建底层架构,在风控领域、Core Banking、移动开发等领域也有专业的公司,而在今天的数字化转型中,只有蚂蚁金服可以提供全栈式的技术合作。 “今天,当一个金融机构客户想要构建一个数字金融新业务时,需要技术解决方案供应商能提供自下向上的所有能力,而且需要敏捷开发的组织和方法,将技术与业务实现完美的结合,推动业务快速上线,这正是蚂蚁金服的独特优势。我们每项技术背后都有蚂蚁金服自身场景的练兵场,蚂蚁金服带给客户的价值不仅是技术,还有来自业务背后的思考和实践。”刘伟光强调。 刘伟光总结,很多金融机构愿意与蚂蚁金服合作,更多在于:第一,蚂蚁金服的数字化思维,包括开发和创新的理念;第二,蚂蚁金服自身的互联网金融实践;第三,蚂蚁金服用技术引领业务发展的方式,非常吸引传统金融机构。 2018年6月,据路透社消息,蚂蚁金服已经决定对发展方向进行战略调整:从支付公司转型为一家技术服务公司,技术服务将占到三分之二收入,支付将成为次要业务。安信证券首席分析师赵湘怀认为,蚂蚁金服从Fin向Tech回归科技公司本质,正在成长成一家全球化的金融科技平台型公司。 也许,从今天开始,我们就将见证一个来自中国的新一代世界级金融科技供应商的诞生。做数字金融商业时代的助推器,这就是蚂蚁金服金融科技开放的“野心”。(文/宁川)
众所周知,2007年的时候,整个淘宝网是一个几百兆字节的WAR包(Java网站应用程序包),大小功能模块超过200个,在当时淘宝业务几乎每隔几个月就翻倍的高速发展情况下,这样的应用架构给当时有着500多人的淘宝技术团队带来了很大的压力。蚂蚁金服的前身支付宝团队当时也在淘宝里,作为淘宝的支付交易模块。而从2006年底开始,现任蚂蚁金服CTO、时任支付宝第一代架构师程立(花名:鲁肃)就开始思考对于支付宝架构的改造,以适应整个淘宝的架构发展,这就是蚂蚁金服中间件的源起。 从淘宝“大饼一沱”的紧耦合系统中分拆出来的松耦合系统,就只有分布式计算架构可选,而淘宝又是互联网应用,于是就需要创造出一个互联网规模的分布式计算架构,“分布式事务”就是在这个拆分过程中出现的问题。淘宝最初是基于IOE设备,无需考虑事务一致性的问题;而在互联网分布式架构下,由于网络和PC服务器等设备的不可靠,数据不一致问题很容易出现。而支付宝作为金融交易系统,对事务型的状态数据一致性处理以及交易成本的要求更高,这背后就是资金安全:资金处理绝对不出差错,交易与数据具备强一致性,在任何故障场景数据不丢不错。 现任蚂蚁金服数据中间件负责人尹博学(花名:育睿)介绍:蚂蚁金服分布式事务(Distributed Transaction-eXtended,简称 DTX)除了协调数据库的事务之外,还可以协调服务的一致性,是在数据库层之上,从业务层保证不同业务之间的数据一致性——即复杂系统之间的一致性,这就是面向未来的核心金融系统。DTX之所以被称为“黑科技”,是因为自设计之初到现在,无论系统多么复杂、交易规模多么庞大,DTX都能在极短的时间内实现数据的一致性:用户无论在哪里,都可放心、流畅地使用支付宝。 (蚂蚁金服数据中间件负责人育睿)黑科技到底有多“黑”? 尹博学是在2017年被吸引加入蚂蚁金服,之前他在百度也做着类似的工作,但蚂蚁金服在金融级交易这个领域的规模全球独一无二:蚂蚁金服DTX在分布式架构下做到了交易数据的强一致,是目前唯一在超大规模金融级分布式架构上实战验证过的分布式事务方案。 尹博学强调,“事务”是贯穿于所有的金融交易,而金融级交易的数据一致性是要强保证的。例如,支付宝用户A给支付宝用户B转钱,A减钱、B就必须要同时加上钱,这两个动作必须一起成功或是一起都不成功,而不能成功一半,也就是说不能A减了钱但B没有加上,这就会导致资损。 本质上,金融核心系统中的微服务架构,在进行业务垂直拆分和数据水平拆分后,存在大量的微服务和单元数据库,一个完整金融业务需要调用多个服务和数据库完成。同时,不仅微服务之间需要解决一致性问题,不同系统之间的调用也存在事务边界问题,那么强一致的分布式事务服务就将发挥重要作用。 DTX分布式事务服务能满足复杂场景和高并发的挑战,充分考虑各类异常情况,且具备足够的伸缩性、高并发和高可用性,支持跨机房的事务协调能力。“这一整套的协调方式,虽然不是我们独创,但可以认为蚂蚁金服做到了工程的极致。程立最初设计分布式事务的时候,当时只有BASE是一种相对比较成熟的理论,但能达到蚂蚁金服这个量级的,目前只此一家。除了性能和吞吐之外,还要衡量考虑扩展性。集中式架构下用DB2或者Oracle架构,可以从1万个事务提到10万个事务,但是从10万提到200万就几乎不可能;蚂蚁金服可从200万变到2000万,甚至更高,而且成本低。”尹博学表示。 DTX黑科技的亮点很多,其中包括:大规模、高扩展、高性能、低成本等。2017年,DTX支持了双十一峰值25.6万TPS的支付请求;涉及支付、转账、理财、保险等各种业务场景;在支付宝内部,接入DTX的系统超过100+个;每天处理资金以千亿记,确保资金的绝对安全;按照双活可扩展设计,不受地域、机房等限制,无限加PC服务器等机器就能水平无限扩展;而当出现故障的时候,可很快恢复。整个过程,从始自终,都绝对保证资金安全。 从方法论上保证强一致 2007开始支付宝核心开始SOA服务化之路,服务化拆分一开始就遇到了跨服务分布式事务问题。传统的基于数据库本地事务的解决方案,只能保障单个服务的一次处理具备原子性(一次事务中所涉及的所有操作全部执行或全部不执行)、隔离性、一致性与持久性,但无法保障多个分布服务间处理的一致性。由于业务约束(如红包不符合使用条件、账户余额不足等)、系统故障(如网络或系统超时或中断、数据库约束不满足等),都可能造成服务处理过程在任何一步无法继续。一旦数据不一致,就会产生严重的业务后果。 传统分布式事务需保证ACID属性,强调一致性,要求强一致;而BASE则是与之相对立的理论,认为为了可用性(Availability)而牺牲部分一致性(Consistency)可以显著的提升系统的可伸缩性,这就是异步操作。蚂蚁金服分布式事务产品DTX分别基于两种理论实现了两种模式:基于BASE理论的TCC模式和基于ACID理论的FMT模式。 TCC方案其实是两阶段提交的一种改进,将整个业务逻辑的每个分支分成了Try、Confirm、Cancel三个操作,其中Try部分完成业务的准备工作、Confirm部分完成业务的提交、Cancel部分完成事务的回滚。这三步仅仅是方法论,具体在每一步的操作实现,则由所涉及的服务自行设计代码实现。以简单的A向B转账为例,A加钱与B减钱的操作由两个参与方服务来实现,A和B的两个Try会同时进行业务系统检测和资源预留,只有两个Try都成功了才会往下进行Confirm操作以提交金额的增减。对于复杂的操作,还会在一个分布式事务里嵌套多层参与方,只有每层的Try都成功了,才会完成整个分布式事务的第一阶段,中间一旦任何一层失败都会回滚。 为了解决 TCC 模式的易用性问题,蚂蚁分布式事务后来又推出了框架托管模式(Framework-managed transactions,简称 FMT)。FMT是一种无侵入的分布式事务解决方案,该模式解决了分布式事务的易用性问题,在该模式下,开发者只需关注一阶段操作,框架会自动解析SQL语义,生成二阶段提交和回滚操作,使分布式事务的接入更便捷,该模式下对业务代码几乎无侵入,框架能够“自动化”地解决分布式架构下的数据一致性问题。 “DTX本身是有嵌套的,如果调了一个服务,可能它下面还调用了其它服务,也是分布式的,从而形成多级复杂嵌套。DTX是一个方法论级的保证,不管分多少级,只要层层提交成功了,最终就都能成功提交。”尹博学介绍。DTX本身带有实时监控,可以监控实时的事务信息,包括事务数、成功率、平均耗时等,也可以与链路监控相结合,根据DTX上报的实时信息,提供历史趋势图、同比/环比分析、报警等功能。 这样的DTX就能够保证每年的双十一支付峰值。2017年的支付峰值25.6万笔/秒,相当于200万个分支事务,也就是这200万分支事务都要达到最终一致状态。在峰值的那几秒钟,DTX每秒钟要维护200万分支子事务,监控它们的状态运行,要保证达到最终的一致性;如果200万个分支事务里面发现不一致,就要快速处理。支付宝双十一大促的交易笔数和峰值每年都在以惊人速度大幅增长,蚂蚁金服所面临的极端技术挑战——如何支撑如此大规模交易并保证一致性问题,在全球范围来看都不曾有企业实现过。 如今,整个DTX团队规模并不算大,那又是怎么实现25.6万笔/秒的世界级工程呢? 在阿里集团工作了8年的郎晓东(花名:冰魂)介绍:极致工程主要是靠异步化来实现,也就是延迟提交。在延迟提交的情况下,数据还是对的,不阻碍交易流程,这就叫异步化。也就是说,在极限峰值的情况下,支付宝能向淘宝的请求发出Confirm,保证虽然现在没执行但5分钟之后一定会执行,那么淘宝就可以放心地告诉用户购买成功了。因为双十一大促的最高峰值通常持续时间不长,那么在洪峰之后,稍有喘息就可以释放IT资源来处理“蓄洪”那部分操作。“异步只是在极限情况下采用,双十一零点一过,又是同步了。异步主要是针对成本,如果多加几倍的机器,也可以做到同步,但用户体验要同成本效益达到最佳平衡,又要保证资金安全,因此就开发出了异步的模式。”郎晓东表示,异步模式让DTX具有极强的可扩展性,交易量翻多少倍都可以支持。 当然,处理200万个分支事务/秒的峰值,在搜索等其它非互联网金融领域也是有互联网公司能达到这样的规模,但是要求的严格性不一样。尹博学介绍,协调参与方多的时候,出错的概率就高,一般架构的网站对严格性的要求并不强,数据不一致也问题不大,或者数据最终达到一致性但时间较长也无所谓。但蚂蚁金服属于金融业务,就必须要在高性能、低成本的前提下达到数据的强一致。 用软件保证强一致 “总结蚂蚁金服DTX在工程上的卓越性:首先就是能处理支付峰值200万分支事务;其次是大规模互联网分布式架构;第三,在数据分布设计上采用了抵近存储,也就是让数据靠近业务,再通过批量技术来处理,以减少交互开销、提升整体吞吐性。最重要的就是DTX是通过软件实现分布式,保证处理能力的线性与水平扩展,没有单点、消除单点。”尹博学强调。 所谓用软件实现分布式,即不依赖底层的硬件,默认底层的硬件随时会挂掉。而对于DTX来说,还是在最高的业务层实现的强一致,这就意味着甚至默认底层的数据库也可以随时挂掉。 早年间,淘宝还采用的是Oracle数据库、MySQL开源数据,后来又开发出了自研数据库OceanBase。OceanBase(以下简称OB)金融级分布式关系型数据库也是蚂蚁金服的“黑科技”之一,让用户像使用单机数据库一样方便的使用OB,同时提供更高的性能与更好的服务稳定性等。 DTX的强一致与OB的强一致,有什么区别呢?比如有一张用户表,这张用户表大到单机存不下,那么就在OB里存了两台机器,例如是M1和M2两台机器。一个事务既要操作M1上的一行数据,同时又要操作M2上的一行数据,那么这个事务的一致性是由OB来保证。但在蚂蚁金服架构里还有一张更大用户表,会被拆成25张用户表,这25张用户表中的每张可能“塞”到一个OB集群里,从业务的角度要操作跨两个OB集群的事务,这就是DTX来实现。 DTX主要定位于用户视角的跨库访问,包括单服务、跨服务协调底层多存储资源,支持多种底层数据库,包括MySQL、Oracle、OB等。 对于DTX来说,这些下一层的数据库,也被视为“硬件”。比如OB会认为磁盘属于比较慢的硬件系统,而DTX也同样会极力优化下层数据操作的总体执行性能,因为要考虑到网络延时,这样DTX就会把一次操作的多条SQL语句同时发给OB而不是顺序发送,从而大幅提高单线程的处理能力。简单理解,就是DTX作为处于最高业务层的强一致性方法,统领下面各层资源,在每一层都进行极致优化,从而达到整个DTX操作的最优化。“我们只能把软件当成硬件来优化,一般的公司也不需要优化,因为也抠不到那么细。”尹博学强调。 “没有最大,只有更大” 在谈到来蚂蚁金服一年多的体验,尹博学说这就是不断突破对于“大”的认知。 “在蚂蚁金服场景下,会突破对原有理论的认识,升华到另一个境界。在这么大的交易量下,很简单的问题会变得很复杂。因为你没有在这么‘大’的场景下思考问题,你想当成认为理论就应该是这样。但当遇到这么大的交易量,会发现要考虑的很复杂。当你经历过了这么大的交易量,再用理论总结这个复杂问题时,发现它又会变得比较简单。这是一个认识的深化,原来没想到过这么大的场景、这么大交易量下的主要矛盾是什么,发现了以后又变简单了。”这是尹博学的感觉。 峰值达到每秒25.6万笔、一天要生成几十亿笔交易的订单号,这个“天量”已经突破了所有现有技术的极限,那么解决“天量”规模背后的技术思想就是把同步事情变成提前做或延后做,“抓住这个思想,就会发现又变得简单了,当然前提是要保证提前做或者延后做都是对的”。DTX的对外输出 如今,DTX技术在对外输出的过程,又变得简单了起来。张森(花名:绍辉)于2011年加入淘宝,于2015年转到蚂蚁金服,之后一直在中间件SOFA团队,主要从事数据中间件分布式事务。 张森介绍,蚂蚁金服的分布式事务有两个名字:对内叫XTS,ExtendedTransaction Service可扩展事务服务;对外叫DTX,Distributed Transaction-eXtended分布式事务。2016年张森负责开发了分布式事务后台运维的自动化,2017年分布式事务产品又开发了可托管版本:FMT,该模式主要是解决用户接入和使用DTX的效率问题,让用户可以基本无侵入的方式下解决分布式事务问题。2018年蚂蚁金服将推出第三代分布式事务解决方案,也就是XA(eXtended Architecture)模式,全面支持标准XA协议,覆盖面广,可无缝接入支持XA的数据库、消息等,帮助传统业务上云,并与自研数据库OceanBase共同打造实时数据一致性的整体解决方案。 蚂蚁金服的技术在2014年开始向生态伙伴和关联机构输出(比如网商银行、天弘基金、Paytm等) 在2017年,南京银行成为了首个国内银行机构客户。在南京银行互联网金融平台项目中,蚂蚁金融级分布式架构解决方案作为一个整体输出,而SOFA中间件包括DTX作为其中非常重要的一部分在项目中落地。2014年是蚂蚁金融科技元年,为了更好的支持网商银行的长远发展,在架构设计初期网商银行架构组就选型DTX做为分布式事务的解决方案。 总结DTX对外输出的优势:第一,相比竞争对手而言,DTX覆盖的金融业务种类是最广的,因为蚂蚁金服是全金融场景,包括了支付、理财、银行、保险等;第二,经过大流量检验过,成就了极致的工程实现;第三,理论发展较快,比如业界其它厂商还停留在TCC模式下,蚂蚁金服已经针对云上的新需求提出FMT、XA等模式,大幅度减少接入的复杂性,并能与蚂蚁金服自研的分布式关系型数据库OceanBase 共同打造实时数据一致性的整体解决方案;第四,金融级解决方案,通过专业的架构转型咨询和实施交付服务,使蚂蚁金服沉淀多年的工程实践精粹与行业落地能力能够结合用户自身的场景进行打通和赋能,为金融机构架构转型带来推动作用,同时也将开放场景定制化能力、大促保障等业务内容,为用户进行量身定制打造最佳方案,为金融机构数字化转型保驾护航。 回顾蚂蚁金服SOFA DTX最近十年的发展过程,简单讲就是一个不断求解金融场景超大规模交易量下分布式架构设计的问题及其工程实现,以优异的性能保障业务数据的一致性,支撑数亿级用户的资金操作。支付宝/蚂蚁金服用十四年时间成就了8.7亿全球用户(2018年5月数据,包括支付宝及其全球合资伙伴)、小微企业与金融机构的普惠金融梦想。“为世界带来更多平等的机会”,一个更加包容、更加可持续、更加绿色的数字金融——这才是蚂蚁金服SOFA DTX分布式事务的黑科技之道。(文/宁川)
2017年底,IDC发布了2018年全球IT产业预测,主要结论就是以云、大数据、移动和社交等为代表第三平台所推动的数字化转型将进入第二阶段:从以公司为主、孤岛型创新的实验性阶段,走向基于平台和生态系统、数字产品与服务爆炸的倍增创新阶段。IDC高级副总裁和首席分析师Frank Gens就此评论:在上升的数字经济中,所有企业必须像原生数字企业那样运营,围绕大型数字创新网络来重新架构企业,最终成为新的企业物种。 IDC预测到2021年,全球50%的GDP将被数字化,而每个行业的增长,都会受到数字产品与服务、数字化运营以及数字关系的驱动。这也就意味着2021年将会是数字经济与数字化转型的拐点,届时数字经济与数字化转型的影响力将超过50%全球GDP的临界点。如果一个企业在新一轮的数字化转型中落后,IDC认为这个企业将持续失去市场份额,到完全失去竞争的能力。 而在2018年3月由国家工业信息安全发展研究中心、中国两化融合服务联盟联合发布的《中国企业上云指数》报告指出,我国上云企业的软件和数据云化水平较低,目前我国仅有40.3%的企业使用了云服务。企业上云指数由基础云化、云化创新、管理变革三个一级指标构成,当前我国企业上云的基础云化还较弱。 在我国走向数字化转型2.0的阶段,阿里作为原生数字企业代表,把自己多年的数字转型1.0和2.0经验,通过阿里云对外输出:构建“大中台、小前台”,打破大企业的部门墙、数据墙、业务墙,构建产品技术和数据能力的强大中台。 数字化转型的困惑 2015年,国务院出台《关于积极推进“互联网+”行动的指导意见》(以下简称《指导意见》),提出“互联网+”的四大方向:着力深化体制机制改革,释放发展潜力和活力;着力做优存量,推动经济提质增效和转型升级;着力做大增量,培育新兴业态,打造新的增长点;着力创新政府服务模式,夯实网络发展基础,营造安全网络环境,提升公共服务水平。 这四大方向中,第一大方向就是组织变革,第二大方向其实是“+互联网”——用互联网技术优化现有的组织运营,第三大方向才是“互联网+”——用互联网技术彻底改造企业、创造新业态。 2015年至今,在全社会推进“互联网+”战略的过程中,存在着认知上的困惑:到底什么是真正的“互联网+”,或用IDC的术语即到底什么是“原生数字企业”。因此,在过去几年中所实践的大多数“互联网+”最后都成为了“+互联网”。 而在传统企业中,需要申请预算和立项来落实业务创新和IT系统建设,正是这种经典的项目制的IT系统建设方式,导致了阻止企业创新的“组织墙”与“数据墙”,也阻碍了企业走向真正的“互联网+”。 所谓“组织墙”,即部门墙和业务墙,就是在传统企业中,业务部门提出需求、信息中心部门进行系统集成商招投标,再进入到需求收集、需求分析、开发、测试、上线等的项目周期中,在这个过程很容易出现“烟囱”式的IT系统:一方面是开发团队考虑不同业务的需求,往往提出独立建设;或是新的业务或开发团队认为之前的技术和业务的历史包袱太多,还不如重新构建;最终的结果是导致大量重复的功能和业务在多个IT系统中同时存在,这些“烟囱”式IT系统就是隐形的“组织墙”,同样的功能却不能互连互通,就出现了“数据墙”。 而这种项目制的IT系统建设方式,在过去20多年的中国企业建设历史上一直反复上演。 由于业务和数据被“烟囱”式IT系统分割到了不同系统中,于是后来提出了基于ESB企业服务总线的SOA方式,试图打通不同系统之间的业务和数据。但SOA在传统企业项目制的机制体制下,出现了本末倒置的结果:这主要是服务提供团队的KPI考核仍是以项目制为主,基于多一事不如少一事的心态,往往不愿意对前面一个项目中已经封装好的服务进行改造以适应新业务的需求,于是又会新起一个服务,相当于又建立了一个SOA形态下的“烟囱”;而对于愿意做事情的服务提供团队来说,会因为之前服务设计的能用性和前瞻性不足,造成改动困难,于是又建立了一个SOA形态下类似的服务,相当于又起了一个“烟囱”。 更为重要的是,在传统企业中的IT部门长期处于“业务支持”地位,很多企业IT部门的职能主要是项目管理,既不能对业务全局有前瞻性把控,也无法提出创新的业务想法,为企业带来新的业务增长点。 阿里巴巴中间件首席架构师钟华有着15年的中间件经验,在他的《企业IT架构转型之道》中介绍了2008年前的淘宝,走的就是项目制的IT系统建设道路,也产生了“烟囱”式IT系统,导致出现了“组织墙”与“数据墙”。 建设数字中台的两大核心经验 针对“烟囱”式IT系统的弊病,一个基本的解决方案就是企业的共享服务中心。说到共享服务中心,就不得不提到阿里提出的“大中台、小前台”战略。 美军在二战时以军为作战单位、越战时以营为作战单位、中东战争时以7人或11人的极小排为作战单位,就是用强大的中后台导弹指挥系统,支持前端小团队的快速判断,从而引领完成整个进攻。 今天,“大中台、小前台”的思想已经成为了主流数字化转型思想。不仅互联网企业几乎全部走上了数字中台战略,华为等企业也走了建设数字中台的道路。 阿里其实也经历了类似的过程:从2009年开始建设共享服务中心到后来真正建成中台战略,了解这个过程对于真正理解阿里所提出的中台战略有着重要的影响。 2003年,阿里成立了淘宝事业部;2008年,又成立了B2C模式的天猫(最初叫淘宝商城)。加上1999所成立的1688,阿里在2008年的时候一共有三大电商体系,三套“烟囱”式IT系统。特别是天猫虽然出身于淘宝,但与淘宝是两套完全独立的业务体系和IT系统,两套电商平台都包含了商品、交易、评价、支付、物流等功能。2009年开始,阿里成立了共享事业部,与淘宝、天猫为同一个平级部门。但当时的淘宝和天猫在业务贡献上显然比共享事业部有更大话语权,共享事业部还处于IT支持形态,缺乏业务话语权而只能在夹缝中生存。 2010年,当时市场上的团购业务蓬勃发展,阿里集团决定建立自己的团购平台。在前期共享服务建设的基础上,依托共享服务体系中的用户中心、商品中心、交易中心、评价中心等,阿里仅投入产品经理、运营和开发等十几名员工就在1个半月的时间成功上线了阿里自己的团购平台。阿里团购平台上线后在短期内展现了超出所有人想像的流量吸力后,阿里集团投入大量资源到这一新兴业务中,这就是后来的“聚划算”团购平台。 “聚划算”的出现,初步体现了“大中台,小前台”的能力。更为重要的是,在2010年的时候,阿里集团提出,无论是淘宝、天猫还是1688,如果想要接入“聚划算”就必须要通过共享业务事业部。这样,共享业务事业部就获得了与阿里三大电商平台一样的业务话语权,最终奠定了共享事业部成为今天阿里集团的核心业务平台而不仅是IT部门。今天,阿里前端的淘宝、天猫、聚划算等25个业务前端单元,都是构建在共享业务事业部的“共享业务”单元之上,在“共享业务”单元的下面才是阿里云技术平台;阿里集团前端业务的所有公共、通用的业务都沉淀到了“共享业务”单元,包括了用户中心、商品中心、交易中心、评价中心等十几个中心,“共享业务事业部”也是“大中台”的具体组织实践体现。 所以,总结阿里发展数字中台的核心经验:原有的共享IT部门必须要找到极强的互联网业务作为抓手,把自己变成核心业务部门,才能够真正转型成为企业的共享业务事业部,而不是某种变形的、换汤不换药的共享IT部门,这也就是阿里共享业务事业部经常讲的“业务滋养”的概念。 阿里发展数字中台还有一个关键经验,这就是共享中心的技术团队组织构成,不再是之前与业务相匹配的流水线模式:之前是UED用户体验设计师对于前端交互界面、架构师和开发人员对应业务逻辑、运维工程师和DBA对应数据库等;而阿里共享业务事业部则改为由架构师、UED工程师、开发人员、运维工程师和DBA等组成一个新的技术组织,对应于一个共享业务单元进行持续开发和运营。这种组织模型中最核心的就是架构师:技术出身的架构师要对不同前端业务中的公共和通用业务有深刻的理解,还要时刻掌握市场发展趋势,这样就能不断从不同前端业务中抽象出可以沉淀到共享业务中的业务点,还能前瞻性从共享业务层面提出业务创新方向再反哺给前端业务。 复制阿里巴巴的数字化转型 再回过来看《指导意见》中提出的组织变革、“+互联网”、“互联网+”等三大“互联网+”主要方向,结合阿里自2008年开始的“大中台、小前台”数字化转型,可以看出“+互联网”让传统企业开始具备互联网思维,通过让IT部门直接掌握互联网业务为抓手,以架构师为主对共享业务模块进行抽象而沉淀出共享业务中台,再辅之共享云技术平台,从而推动整个企业进化到“互联网+”的数字化原生模式,在这个过程中完成组织变革,这就是阿里巴巴式数字化转型之路,也可以说是传统企业数字化转型的“红宝书”。 钟华表示,在用阿里技术推动企业数字化转型、建立数字中台的过程中,第一大挑战是业务、其次才是技术。所谓业务挑战,就是从业务视角,把共性的业务模块沉淀到共享业务中台,把个性化的业务剥离出去后形成前台。阿里云企业业务事业部总经理赵杰辉介绍说,为了帮助企业更好的梳理业务,阿里云企业业务推出了架构师咨询服务团队,这个团队源自阿里的共享业务事业部中间件技术团队,同时又从IBM、Oracle等公司招聘了咨询专家,专门帮助传统企业进行基于数字中台思想的数字化转型架构设计。更重要的是,阿里云架构师团队能与传统企业分享阿里自己的数字化转型过程与经验,让传统企业学习到阿里数字化转型的“神”。 在共享业务抽象与沉淀的过程中,还需要一个开放的技术平台来承载不断沉淀下来的共享业务单元,这就是阿里云中间件Aliware平台:主要包括企业级分布式应用服务EADS、分布式关系型数据库服务DRDS、消息队列MQ、缓存等支撑“双11”核心交易业务所需的中间件平台,还包括直面了双11洪峰流量和保障阿里全生态业务稳定性的高可用基础设施如全链路压测平台、限流降级和流量调度平台、异地多活及单元化、高可用评测体系等,以及脱胎于鹰眼的监控诊断和数字化运营平台——提供了针对分布式应用架构所需的服务链路跟踪、服务分析、实时业务指标监控和报警等功能。 其中,阿里云企业级分布式应用服务EDAS是企业级互联网架构解决方案的核心产品,整合了阿里整套分布式计算框架(包括分布式服务化框架HSF、服务治理、运维管控、链路追踪EagleEye和稳定性组件等),以应用为中心,帮助企业级客户构建并托管分布式应用服务体系;消息队列MQ则整合了阿里巴巴集团内部Notify、MetaQ和开源产品RocketMQ三大消息服务优点集一身的消息服务,对实现分布式计算场景中所有异步解耦以及双11大促场景下提供削峰填谷的功能起到了重要作用。 阿里云中间件平台最大的优势,就是结合了整个阿里建设数字中台、完成数字化转型的方法论和经验,并固化到技术平台上,再通过“双11”的检验形成了一套成熟的技术体系。比如,阿里云中间件的性能测试PTS,就是卓越的SaaS化性能测试平台,全新的面向DevOPS的简易但强大的编排能力,完全不需要传统商业性能测试软件那样的复杂门槛,同时具备强大的分布式压测能力,可模拟海量用户的真实业务场景和流量,其核心能力基于服务阿里全生态多达4年以上的单链路/全链路压测平台,可将性能压测本身的工作持续简化,最大程度优化成本、稳定性和用户体验,帮助企业提升商业价值。 波司登是阿里云中间件对外输出的典型案例。波司登作为已有40年历史、主打羽绒服的知名品牌,从11个农民和8台缝纫机起家,做到市值60多亿港元的港股上市公司,在经历了上一个十年的高速发展之后,与绝大多数传统服装行业的品牌商一样面临着挑战。从2013年起,波司登开始提升直营店的比重。对于有着3000多家门店的品牌商来说,想要很精准地预测在什么时间、把什么货挪到什么地方非常困难。这种缺货也被称为“结构性缺货”,即货是有的,但没有在正确的时间,出现在消费者需求的地方,导致货源充足的地方可能卖不完、有的地方却买不到。高库存“冻”住了企业的现金流,高缺货又严重影响了用户体验。 2015年开始,波司登IT团队开始考虑建立新的零售系统架构。波司登和阿里云合作,利用企业级互联网架构技术搭建“零售云平台”:2016年初开始建设,短短5个月之后就可以实时监控波司登全国3000多家门店的库存和销售数据。按照阿里云互联网中间件“厚平台、薄应用”的理念,波司登“零售云平台”主要建成了全局共享的业务中台:包括库存中心、用户中心、交易中心和订单中心等。例如,“库存中心”将原本分散在各地的仓库、门店的库存数据,以及和线下割裂开的线上库存数据,全部都“聚拢”在了一起。有了基于库存中心的自动补货系统之后,波司登大胆地将库存“后移”,在试点区域取消经销商仓库,由系统自动为经销商门店和直营门店补货。 “零售云平台”已给波司登带来了显著成效:库存中心的智能补货系统有效减少缺货损失21%,售罄率同比增长10%;会员中心帮助波司登建立了会员社区、会员俱乐部,实现了与500万会员的互动活动,会员复购率达到20%以上。更为重要的是,“零售云平台”已经从技术支撑转变成为了企业营利的“枢纽”。 另一个例子是中石化易派客。易派客作为中石化首个互联网架构的电商平台,采用阿里云中间件平台,从立项到上线只用了3个月,易派客的订单中心、用户中心、支付中心、物流中心、呼叫中心等几大模块都在短期内构建完毕。易派客上线仅120天,就有100余家单位在易派客上开展采购业务,涉及100多个物资小类,包括9000多种商品,80多万种单品,订单总额达到3.8亿元。截止2017年4月,易派客的交易总额已经突破900亿元。 如今,阿里云重塑企业核心业务框架的客户已经覆盖了政府、税务、人社、银行、保险、石油石化、零售快消、汽车制造、互联网平台等众多行业。 赵杰辉强调,传统IT满足了小部门的目标,中台式的IT架构是从公司全局角度鼓励创新和效率,将数据从成本中心变成价值中心。“大中台、小前台”的中台战略更符合DT时代的组织和业务机制,让前台的一线业务更敏捷,可以更快速适应瞬息万变的市场,而中台则能够整合整个企业的数据能力和产品技术能力,对各个前台业务形成强有力的支撑。 马云曾说过:未来三十年不属于互联网公司,而是属于用好互联网的公司。未来30年,数据将成为生产资料,计算会成为生产力,互联网是一种生产关系。 正如马云所言,数字化转型从1.0走向2.0的阶段,也是从“+互联网”到“互联网+”的过程,体现了企业组织生产运营的根本性变革,阿里云中间件平台及架构师咨询服务则在这个过程中扮演了重要的牵引作用。 更重要的是,阿里云中间件平台固化了阿里自身的数字化转型经验,涵盖了数字化转型1.0和2.0及之后的数字化运营阶段,向外界和世界输出了中国自己的数字化转型模板。正所谓数字化转型,中国造。(文/宁川)
2019年10月
2019年09月
2019年07月