DT时代,阿里不再藏住“技术公司”标签

简介: 虽然Jack马先生总是口出惊人之语,但事实证明他说的话总是不断被应验。

虽然Jack马先生总是口出惊人之语,但事实证明他说的话总是不断被应验。

2016年的“新零售”现在已经是公认的零售新篇章,而2014年的“人类正从IT时代走向DT时代”,也在逐渐变成现实——不管什么样的企业,都习惯要“大数据”一下。

这其中,阿里自己往往成为“预言”的忠实拥趸,新零售跑马圈地,现在大数据也要“搞个大新闻”。

不久前,阿里云在其峰会上发布了大数据服务产品飞天大数据平台,从公开信息来看,该平台被称为“中国唯一自主研发的大数据计算引擎”,以及“全球集群规模最大的计算平台”。

参数能力上,有诸如单一引擎支持10万台服务器组合计算、支持600PB计算能力等。

今年6月以来,阿里在AI能力上频频对外界秀肌肉,连续获得5个世界大赛第一(详见相关报道),现在,阿里云高调发布“飞天大数据平台,在马云口中的DT时代大干一把的野心摆上台面。

大众心中“商业”标签浓厚的阿里,拉开遮盖的幕布,开始把“技术”标签显露出来。

大数据技术之争,

为什么“商业”阿里却率先冒出?


众所周知,DT时代一定建立在云计算基础之上。

但是,当大数据技术和服务成为云计算标配时,为什么“中国唯一自主研发”以及“全球集群规模最大”这些头衔会落到一贯以“商业”姿态示人的阿里头上?

这种“出人意料”,原因恰恰也出在“商业”两个字上

阿里云此次是“对外发布”飞天大数据平台,在这之前,这款产品已经在阿里云内部实质运行和服务了十年之久(以前称作MaxCompute平台,也是现在飞天的核心)。

某种程度上,阿里在大数据技术上令人意外地“冒出”,既有主观追赶DT时代的内在动机,也不能否认是被自己的“商业”发展所倒逼。


1、自身商业的业务膨胀所倒逼


阿里虽然是商业起家,但却技术上最早遭受规模化带来的技术压力。

2008年淘宝网上已经有9800万注册会员,用户一多就带来数据存储和计算的压力,而这个数字还在持续暴增。

在全球范围内,Google、AWS、微软也面临类似的问题,老的数据系统(例如Oracle Greenplum、Hadoop等)都没办法适应暴增的数据需求(类似于马车设计时没办法考虑到汽车的运载能力),各家都在研发自己的大数据技术。

而且,与搜索、社交不一样,“商业”场景下的用户与信息存储更复杂,个人信息、消费信息、金融信息,甚至早期的推荐机制,都对大数据技术提出了更高的要求。

所以,这造成一个奇特的现象:“商业”做得越成功、标签越浓厚,背地里“技术”就必须越深度。

我们今天看到阿里在商业上如日中天,已经是“技术没有拖后腿”的结果。

而面对几何级膨胀的商业需求能够不拖后腿,这样的技术拿出来对外开放时,获得“中国唯一”、“全球最大”之类的成绩似乎并不意外。

2009年阿里云成立时,“飞天”就已经事实上开始起步。

从其发展轨迹来看,20138月突破同一个集群内5000台服务器同时计算2016年2月单集群突破10000台2019多集群突破10万台,这样的技术成长,从时间线来看与阿里的商业成长几乎同频。

阿里系旗下的支付宝芝麻信用分淘宝商家的每日商铺账单高德优酷、阿里妈妈等大数据业务都通过MaxCompute平台进行,2018年双11单日处理超过600PB的数据,交易峰值平滑度过。

现在,阿里99%的计算和95%的存储都由飞天支撑,其展示出来的技术成就始终与阿里的“商业”标签紧密相连。


2、对外生态服务扩张所倒逼


阿里云在国内处在领先位置,服务大量大大小小的企业,这反过来像内部商业发展一样倒逼阿里云在大数据技术有所突破,毕竟,现在人人都在谈大数据。

例如,阿里云服务知名APP“墨迹天气”,该产品要为4亿用户提供气象预报服务,每天用户查询超过5亿次,对数据调用和运算产生很大压力,阿里云必须“跟上”客户的脚步进行技术革新。

类似高数据需求的客户还有很多。

此外,在过去几年的智慧城市大战中,阿里云抢先发车,在大本营浙江搞出许多明星项目。例如,其服务浙江“最多跑一次”政务体系建设,面临老百姓办事最密切相关的100个事项70多亿条数据,大数据平台没有跟上是无法想象的。

云计算生态越庞大,这种底层技术就必须越走在前面。


3“领头羊企业”的头衔所倒逼


一谈中国有哪些知名互联网科技企业,无非就是BAT等少数几个公司,而从市值上看,阿里又处在领头羊位置。

这是商业成功带来的荣誉不假,但其实暗地里,从国家层面看,商业的成功最终一定要承担技术的职责。

核心技术是国之重器,但谁来创新核心技术,责任只能落到这些商业上成功的企业头上。

2018年3月Forrester发布2018年一季度云端数据仓库》大数据服务榜单,阿里与AWS、Google、微软进入全球一线阵营

在全球范围内,阿里无法永远在“商业”标签下存在和发展,中国从IT时代走向DT时代,阿里这样的企业露出技术标签是时代的必然。


全新的DT时代,大数据平台如何参与竞逐?


DT时代替换IT时代,在全新阶段面前,核心的角逐场大数据平台究竟要怎么玩,没有经验可供借鉴。

作为孤例,拆解阿里云飞天大数据平台的一些做法,它们未必全面,但或可以作为行业参考。

image.png


1、“物”膨胀下的“DT系统”构建


DT时代,数据无非包括“人”和“物”两个部分,过去10年,“人”(即用户)的增长和沉淀已经基本完成,数据定格在高位。

下一步可以预见的是,未来10IoT的全面发展,基于“物”的数据将迎来新的爆发,万物互联、万物映射到数字世界,大数据将迎来新一波井喷。

所以,对大数据平台服务而言,关注“物”数据的膨胀成为重中之重。

以阿里云“飞天大数据平台”为例,目前该平台支撑全国442个城市、超过1000项公共服务,而在杭州的典型应用“城市大脑”,需要在数分钟内优化1300个核心路口、万级交通配时的控制参数,此外,还需要处置110种交通警情

这些,与大量交通IoT数据密切相关。海量物联网终端数据汇总、分析与处理,“物”数据膨胀下事实上构建了一套“DT系统”(相对IT系统)。

此外,在工业领域,“物”数据的膨胀也十分明显,以阿里云服务的协鑫光伏、天合光能等为例,大数据技术必须帮助这些企业完成上千个参数的最优搭配,提升制造的良品率,这是“物”数据的直接产业价值。


2、极致的“低延时”战争


5G不仅仅是速度快,更重要的是低延时。

低延时改变了数据传输和运算的逻辑,在包括工业在内的许多领域有着颠覆性价值,也为5G带来了改造世界的无限可能。

但是,5G毕竟只是负责信息传输的技术,在数据存储、调用、处理上,未来的5G还必须搭配与低延时“理念”一致的大数据技术服务,否则“孤掌难鸣”。

在此次阿里云峰会上,阿里巴巴集团CTO张建锋用手机淘宝APP做了一个现场展示,用户输入一个搜索关键词点击之后,下拉屏幕将出现与之相关的内容。

张建锋称,“每个人的购物喜好和变化,可以在秒级之内被计算出来。”7亿淘宝用户的行为与运算由飞天支撑,实现实时化。

想象一下未来5G物联网应用当中,当5G完成了极低延时的传输任务后,在需要大数据的部分,大数据技术无法用配合实现实时分析,最终总体响应能力没有发生根本改变,那样的变革很难创造颠覆性价值。

DT时代大数据技术的发展,必须与5G应用有相同的步调。


3、大数据普惠化倒逼“客户体验”


IT时代企业人人IT,同理,DT时代,企业也必将人人DT

阿里云飞天一发布就强调对中小企业的服务,大量需求大数据而又缺乏技术基础、近乎“小白”的中小企业在等着大平台赋能。

而既然是小白,既然DT时代要实现大数据的普惠化,门槛尽可能低、企业信息系统改造尽可能平滑就成为实操落地的关键。

谁能让中小企业零门槛拥抱DT,谁就占据时代的先机。

2019年1月阿里首款大规模分布式科学计算引擎Mars开源,该产品基于MaxCompute,在技术实现上,官方宣称降低编程难度,兼容 Numpy 接口,无需修改代码即可处理比原来规模大上万倍的数据量”。

显然,阿里云试图让大数据技术的开放变得和常规云服务产品部署一样简单,按照这个趋势,无代码部署也不是不可能。

DT竞争是组合拳,大数据平台只是开始


在此次峰会上,阿里云提出全面上云的拐点到了”,张建锋还把企业上云划分为企业基础设施上云、大数据上云、云上中台、云上智能四个阶段

对应地,阿里云发布了飞天云操作系统、飞天大数据平台、阿里巴巴双中台和智联网AIoT四个产品,一些媒体称之为阿里云的“四张王牌”。

而事实上,阿里云一次发布包括大数据平台在内的四款产品,涉及基础机构、数据中台、智能化等内容,本身就证明了DT时代的竞争是组合拳,大数据平台是其中的构成部分。

也即,只有大数据平台,撑不起DT时代的企业上云,在叠加的时代浪潮下,“客户”们的需求往往是多元化的,要技术、要运营、要紧跟趋势。

要想在DT时代有所建树,不管是大型云计算平台,还是中小云服务商,云基础架构、大数据技术、管理中台、AIIoT等可赋能的技术能力都是“标配”。

正因为如此,当阿里云决意把大数据平台开发出来,它就必须、不得不一次性推出云计算产品“全家桶”,只有这样才能全方位满足“客户”们的需求,单一的大数据技术无法形成全面的技术和生态势能。

当然,这也使得“商业”阿里更难以藏住“技术公司”标签,未来,阿里技术的一面将露出得越来越多。

相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
相关文章
|
3月前
|
存储 SQL 消息中间件
从 ClickHouse 到 StarRocks 存算分离: 携程 UBT 架构升级实践
查询性能实现从秒级到毫秒级的跨越式提升
|
Linux
在 Linux 系统中,“cd”命令用于切换当前工作目录
在 Linux 系统中,“cd”命令用于切换当前工作目录。本文详细介绍了“cd”命令的基本用法和常见技巧,包括使用“.”、“..”、“~”、绝对路径和相对路径,以及快速切换到上一次工作目录等。此外,还探讨了高级技巧,如使用通配符、结合其他命令、在脚本中使用,以及实际应用案例,帮助读者提高工作效率。
933 3
|
消息中间件 资源调度 关系型数据库
如何在Flink on YARN环境中配置Debezium CDC 3.0,以实现实时捕获数据库变更事件并将其传输到Flink进行处理
本文介绍了如何在Flink on YARN环境中配置Debezium CDC 3.0,以实现实时捕获数据库变更事件并将其传输到Flink进行处理。主要内容包括安装Debezium、配置Kafka Connect、创建Flink任务以及启动任务的具体步骤,为构建实时数据管道提供了详细指导。
669 9
|
存储 缓存 NoSQL
Redis常见面试题(二):redis分布式锁、redisson、主从一致性、Redlock红锁;Redis集群、主从复制,哨兵模式,分片集群;Redis为什么这么快,I/O多路复用模型
redis分布式锁、redisson、可重入、主从一致性、WatchDog、Redlock红锁、zookeeper;Redis集群、主从复制,全量同步、增量同步;哨兵,分片集群,Redis为什么这么快,I/O多路复用模型——用户空间和内核空间、阻塞IO、非阻塞IO、IO多路复用,Redis网络模型
Redis常见面试题(二):redis分布式锁、redisson、主从一致性、Redlock红锁;Redis集群、主从复制,哨兵模式,分片集群;Redis为什么这么快,I/O多路复用模型
|
Python
Python办公自动化:提取pdf文件中的图片
Python办公自动化:提取pdf文件中的图片
296 0
|
人工智能
写歌词的技巧和方法:打造完美歌词结构,妙笔生词AI智能写歌词软件
写歌词的技巧包括:开头吸引人,主体逻辑清晰,结尾画龙点睛。使用《妙笔生词智能写歌词软件》的AI功能,如智能写词、押韵优化等,可助你克服创作瓶颈,打造完美歌词结构,适用于民谣、摇滚、流行等多种风格。
|
运维 Kubernetes Cloud Native
主流定时任务解决方案全横评
定时任务作为一种按照约定时间执行预期逻辑的通用模式,在企业级开发中承载着丰富的业务场景,诸如后台定时同步数据生成报表,定时清理磁盘日志文件,定时扫描超时订单进行补偿回调等。
主流定时任务解决方案全横评
|
SQL 关系型数据库 MySQL
MySQL高可用架构设计:从主从复制到分布式集群
MySQL高可用性涉及主从复制、半同步复制和Group/InnoDB Cluster。主从复制通过二进制日志同步数据,保证故障时可切换。半同步复制确保事务在至少一个从服务器确认后才提交。Group Replication是多主复制,支持自动故障切换。InnoDB Cluster是8.0的集成解决方案,简化集群管理。使用这些技术能提升数据库的稳定性和可靠性。
1277 2
|
XML 存储 数据可视化
能快速构建和定制网络拓扑图的WPF开源项目-NodeNetwork
在现代软件开发中,数据可视化和可交互性越来越受到关注。为了实现这一点,通常需要使用各种图表、表格、网络拓扑图等控件。NodeNetwork就是一种这样的自定义方式,它是一个基于C# WPF的开源项目,可以帮助我们快速构建和定制网络拓扑图。
能快速构建和定制网络拓扑图的WPF开源项目-NodeNetwork