《大数据大创新:阿里巴巴数据中台业务模式解密》| 每天读本书

本文涉及的产品
阿里云百炼推荐规格 ADB PostgreSQL,4核16GB 100GB 1个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 本书基于作者在阿里巴巴的十年大数据从业经历,精彩演绎云上数据中台之道。

大数据大创新:阿里巴巴数据中台业务模式解密


内容简介:

本书基于作者在阿里巴巴的十年大数据从业经历,精彩演绎云上数据中台之道。全书基于大数据探索的大趋势,讲述阿里巴巴云上数据中台顶层设计,再以实际案例详述阿里巴巴云上数据中台建设及其业务模式的形成过程,总结云上数据中台沉淀的独特价值,并开诚布公地分享阿里巴巴以赋能为本质的大数据战略。

作者希望通过一名老数据人发自肺腑的分享,帮助尽可能多的有志于大数据构建、应用与创新者,构建自己的云上数据中台,从而拥有既“准”且“快”的“全”“统”“通”的智能大数据体系,以驱动各类业务数据化与数据业务化创新!

邓中华 著
电子工业出版社 出版

image.png

图书试读:

从大数据的概念被正式提出,到马云老师预言人类正从IT 时代走向DT 时代,大数据浪潮迭起。大数据同仁共同认知的一点是,大数据会对社会创新、产业变革、业务创新及每个人的角色定位产生近乎决定性的影响。

马云老师早在2014 年就提出了业务数据化和数据业务化,阿里巴巴因此付诸行动,通过全局数据监控、数据化运营、数据植入业务场景的各个链路等推进业务数据化;通过统一商家端数据产品、计量信用分,以及风险预测与防控等,推进数据业务化。但与此同时,我们也清楚地知道,在实现这个愿景的道路上存在着很多挑战,其中,如何提升大数据能力则是关键。

在2014 年以前的阿里巴巴,我们的计算资源分散各处,我们的数据指标经常相互冲突,我们的数据应用大多从数据源头向上耗费大量资源进行垂直开发。这种状况无法可持续地推进业务数据化与数据业务化。于是,阿里巴巴数据人协同起来,从业务视角而非纯技术视角出发,建设既“准”且“快”的“全”“统”“通”的智能大数据体系。其间,在极致追求技术提升的同时,我们自成OneData、OneEntity、OneService 三大体系,开发了致力于智能数据构建与管理的Dataphin、高效数据分析与展现的Quick BI 等产品,培育了一大批独具阿里特色的大数据人才,云上数据中台的建设也就水到渠成了。

今天的阿里巴巴,几乎所有的业务都运行在大数据之上,几乎所有的小二都在用大数据改善工作甚至创新。云上数据中台正服务着阿里生态中的数十个业务板块、百余家公司、千万级客户,在上万个业务场景中应用并催生创新。而每一年的双十一都在上演着数据奇迹。
以2016 年的双十一为例,当天实时计算处理的数据量达到9400 万条/ 秒,面向业务系统提供应用服务的单日数据调用约百亿次,而全链路完成数据采集、整合构建、服务展现仅需2.5 秒,这些惊人的数字背后是因为有强大的云上数据中台大数据能力在支撑。

如今,中国正处于数字化转型阶段,政府的各个部门及各行各业越来越相信大数据的力量。我们认为,这套在阿里生态内实战过的云上数据中台大数据能力及其推进业务数据化、数据业务化的云上数据中台业务模式,可以在阿里生态之外推而广之,赋能全社会!

2016 年9 月,我们不再将云上数据中台深藏于阿里生态内,开始以亲身经历的各种积淀对社会各界有志于大数据战略者伸出合作之手,帮助诸如零售、旅游、环保、地产、传媒、运营商、文教、政府部门等领域的客户构建自己的大数据能力,并在数字化转型之路上逐步走向成功!

一群有情有义、有梦想、有担当又有极强战斗力的人共同缔造了今天的阿里巴巴。但如何驱动大数据让世界更加美好呢?我们希望携手同道者,共创、开拓,进而修炼大数据能力,共同在大数据实践之路上走向成功!大数据能力本应无边界,越多地参与,才越有可能真正实现无边界。

永不停歇地奋斗,正因乐在于志!我们坚信,一切美好,都会因此开始的刚刚好!


胡晓明(花名 孙权)
阿里巴巴合伙人 阿里云总裁

相关实践学习
阿里云百炼xAnalyticDB PostgreSQL构建AIGC应用
通过该实验体验在阿里云百炼中构建企业专属知识库构建及应用全流程。同时体验使用ADB-PG向量检索引擎提供专属安全存储,保障企业数据隐私安全。
AnalyticDB PostgreSQL 企业智能数据中台:一站式管理数据服务资产
企业在数据仓库之上可构建丰富的数据服务用以支持数据应用及业务场景;ADB PG推出全新企业智能数据平台,用以帮助用户一站式的管理企业数据服务资产,包括创建, 管理,探索, 监控等; 助力企业在现有平台之上快速构建起数据服务资产体系
相关文章
|
1月前
|
SQL 存储 分布式计算
ODPS技术架构深度剖析与实战指南——从零开始掌握阿里巴巴大数据处理平台的核心要义与应用技巧
【10月更文挑战第9天】ODPS是阿里巴巴推出的大数据处理平台,支持海量数据的存储与计算,适用于数据仓库、数据挖掘等场景。其核心组件涵盖数据存储、计算引擎、任务调度、资源管理和用户界面,确保数据处理的稳定、安全与高效。通过创建项目、上传数据、编写SQL或MapReduce程序,用户可轻松完成复杂的数据处理任务。示例展示了如何使用ODPS SQL查询每个用户的最早登录时间。
95 1
|
1月前
|
分布式计算 Kubernetes Hadoop
大数据-82 Spark 集群模式启动、集群架构、集群管理器 Spark的HelloWorld + Hadoop + HDFS
大数据-82 Spark 集群模式启动、集群架构、集群管理器 Spark的HelloWorld + Hadoop + HDFS
154 6
|
1月前
|
分布式计算 资源调度 Hadoop
大数据-80 Spark 简要概述 系统架构 部署模式 与Hadoop MapReduce对比
大数据-80 Spark 简要概述 系统架构 部署模式 与Hadoop MapReduce对比
65 2
|
1月前
|
消息中间件 监控 数据可视化
大数据-79 Kafka 集群模式 集群监控方案 JavaAPI获取集群指标 可视化监控集群方案: jconsole、Kafka Eagle
大数据-79 Kafka 集群模式 集群监控方案 JavaAPI获取集群指标 可视化监控集群方案: jconsole、Kafka Eagle
53 2
|
1月前
|
分布式计算 资源调度 大数据
大数据-110 Flink 安装部署 下载解压配置 Standalone模式启动 打包依赖(一)
大数据-110 Flink 安装部署 下载解压配置 Standalone模式启动 打包依赖(一)
53 0
|
1月前
|
分布式计算 资源调度 大数据
大数据-110 Flink 安装部署 下载解压配置 Standalone模式启动 打包依赖(二)
大数据-110 Flink 安装部署 下载解压配置 Standalone模式启动 打包依赖(二)
69 0
|
21天前
|
SQL 存储 算法
基于对象 - 事件模式的数据计算问题
基于对象-事件模式的数据计算是商业中最常见的数据分析任务之一。对象如用户、账号、商品等,通过唯一ID记录其相关事件,如操作日志、交易记录等。这种模式下的统计任务包括无序计算(如交易次数、通话时长)和有序计算(如漏斗分析、连续交易检测)。尽管SQL在处理无序计算时表现尚可,但在有序计算中却显得力不从心,主要原因是其对跨行记录运算的支持较弱,且大表JOIN和大结果集GROUP BY的性能较差。相比之下,SPL语言通过强化离散性和有序集合的支持,能够高效地处理这类计算任务,避免了大表JOIN和复杂的GROUP BY操作,从而显著提升了计算效率。
|
1月前
|
存储 分布式计算 druid
大数据-152 Apache Druid 集群模式 配置启动【下篇】 超详细!(一)
大数据-152 Apache Druid 集群模式 配置启动【下篇】 超详细!(一)
40 1
大数据-152 Apache Druid 集群模式 配置启动【下篇】 超详细!(一)
|
29天前
|
SQL 存储 算法
基于对象 - 事件模式的数据计算问题
基于对象-事件模式的数据计算是商业中最常见的数据分析任务之一。这种模式涉及对象(如用户、账户、商品等)及其相关的事件记录,通过这些事件数据可以进行各种统计分析,如漏斗分析、交易次数统计等。然而,SQL 在处理这类任务时表现不佳,特别是在有序计算方面。SPL 作为一种强化离散性和有序集合的语言,能够高效地处理这类计算,避免了大表 JOIN 和大结果集 GROUP BY 的性能瓶颈。通过按 ID 排序和分步计算,SPL 能够显著提高计算效率,并支持实时数据处理。
|
1月前
|
机器学习/深度学习 运维 Kubernetes
AllData数据中台核心菜单三:数据平台(K8S)
杭州奥零数据科技有限公司成立于2023年,专注于数据中台业务,维护开源项目AllData并提供商业版解决方案。AllData提供数据集成、存储、开发、治理及BI展示等一站式服务,支持AI大模型应用,助力企业高效利用数据价值。
AllData数据中台核心菜单三:数据平台(K8S)
下一篇
无影云桌面