阿里云贾扬清:大数据和人工智能一体化是必然趋势

简介: 拥抱“融合”是大数据演进的新方向,⼤数据+⼈⼯智能⼀体化是⼤数据发展的必然⽅向,而人工智能是⼤数据业务发展的终极出⼝ 。

image.png

12月13日,阿里云计算平台负责人贾扬清在Flink Forward Asia 2020 峰会上指出,拥抱“融合”是大数据演进的新方向,大数据和人工智能一体化是必然趋势,而人工智能是大数据业务发展的终极出口。同时,他从不同角度讨论了Flink的开源技术,以及云时代下开源技术的发展和未来思考。

Flink开源社区 “渐入佳境”

从一个普通开源技术爱好者视角,贾扬清将2020年Flink发展定义为“渐入佳境”,主要体现在三大方面:

技术。今年Flink在技术方面取得两大新突破:一是Flink流批一体技术在阿里双11核心数据业务场景规模化成功应用;二是Flink实时计算峰值首次突破40亿条/秒。同比去年,不增加集群规模情况下提升了一倍的计算性能。

应用。Flink不再是一个居庙堂之高的技术,而是成为开源流式处理的事实标准,飞入“寻常百姓家”。比如中国信通院使用了Flink作为技术蓝本设计流式处理标准,云计算公司包括阿里云等均使用Flink作为流式处理的底层引擎。

社群。Flink开源社区高速增长,登顶Apache最活跃的邮件列表;Flink项目是Github提交次数最多的Apache顶级项目之一。去年Flink Forward Asia 参会⼈数达2000⼈,Flink 极客挑战赛吸引了4000+开发者参与;今年大会切换到线上、线下同时举办,Flink 极客挑战赛的颁奖更让大家看到了越来越多开发者对于开源技术的热情以及勇于挑战的精神。

开源让云更标准化

贾扬清认为:开源让云更标准化。他提到,云计算越来越趋于标准化对其自身发展非常有利。云上大量的开发技术体系日趋⼀致,这意味着大量云计算开发者熟悉这套体系后更容易把⾃⼰的应⽤变成云的⼀部分。

开源有助于阿⾥云打破⾃有技术体系,在充分尊重⽤户原有使⽤习惯基础上,形成标准、开放、公共的技术体系。单靠⼀家公司去制定标准⾮常难。

阿里云对于开源意味着什么?贾扬清提到以下三点:

组织来看,去年阿⾥巴巴集团成⽴开源技术委员会,从集团层⾯统⼀梳理和推进阿⾥巴巴开源技术战略的执行。

参与度来看,阿⾥巴巴集团⼀开始就广泛采用开源技术构建⾃⼰的技术体系。以阿⾥云计算平台事业部⼤数据产品为例,比如实时计算 Flink都在⼤量使⽤Hadoop/K8S⽣态的技术;机器学习PAI同样使⽤TensorFlow等开源深度学习框架。

贡献度来看,阿⾥巴巴集团持续为开源社区贡献力量。以Flink技术社区为例,仅去年⼀年阿⾥云就贡献百万行代码给Apache Flink社区。当前,集团开源项⽬数已超过1000个,覆盖⼤数据、AI、云原生、数据库、中间件、硬件等多个领域,全世界有70多万开发者为阿里点亮GitHub Star,成千上万的爱好者参与到项⽬贡献之中。

拥抱“融合”是大数据演进的新方向

贾扬清表示,云的三⼤发展趋势主要是IT基础设施的云化、核⼼技术的互联⽹化、应⽤的数据化和智能化,这也是云的核⼼价值所在。

企业在IT上云和业务互联⽹化之后,其应⽤必将从流程驱动变为数据智能驱动,实现数据化和智能化。云计算、底层IaaS技术在比拼基础设施的成熟度、稳定性和价格,而上层PaaS技术要⽐的是数据能力、智能能⼒。

⽬前包括数据库、IOT等泛⼤数据仍然处于⼤数据最基础的使⽤⽅式,需要整合更多⼤数据和AI能⼒。

image.png

所以,拥抱“融合”是大数据演进的新方向,⼤数据+⼈⼯智能⼀体化是⼤数据发展的必然⽅向,而人工智能是⼤数据业务发展的终极出⼝ 。

只有AI化,⼤数据才能发挥真正的业务价值。阿⾥云⼤数据之所以有核⼼竞争⼒,就是因为⼤数据是结合AI能⼒的⼤数据,是智能化升级的⼤数据。比如Flink+Alink,Flink不仅能够提供流批⼀体的处理能⼒,还能借助已开源的Alink机器学习算法库,实现Flink的⼤数据+⼈⼯智能⼀体化。

未来,社会经济将与互联⽹更加融合,企业机构的业务也将全⾯转变为互联⽹业务。一个企业仅仅有IT基础设施并不够,企业应⽤也将实现从流程驱动变为数据智能驱动,阿⾥云计算平台将输出全栈⼤数据技术能⼒,并提供全球顶尖的AI技术,一起实现数据化和智能化。

活动推荐:

仅需99元即可体验阿里云基于 Apache Flink 构建的企业级产品-实时计算 Flink 版!点击下方链接了解活动详情:https://www.aliyun.com/product/bigdata/sc?utm_content=g_1000250506

image.png

相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
相关文章
|
11月前
|
存储 分布式计算 大数据
【赵渝强老师】阿里云大数据存储计算服务:MaxCompute
阿里云MaxCompute是快速、全托管的TB/PB级数据仓库解决方案,提供海量数据存储与计算服务。支持多种计算模型,适用于大规模离线数据分析,具备高安全性、低成本、易用性强等特点,助力企业高效处理大数据。
554 0
|
9月前
|
数据采集 传感器 人工智能
没有大数据,哪来人工智能?——聊聊“大数据喂养下的AI进化史”
没有大数据,哪来人工智能?——聊聊“大数据喂养下的AI进化史”
399 6
|
9月前
|
人工智能 分布式计算 DataWorks
阿里云大数据AI产品月刊-2025年8月
阿里云大数据& AI 产品技术月刊【2025年 8 月】,涵盖 8 月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据& AI 方面最新动态。
692 2
|
9月前
|
存储 分布式计算 资源调度
【赵渝强老师】阿里云大数据MaxCompute的体系架构
阿里云MaxCompute是快速、全托管的EB级数据仓库解决方案,适用于离线计算场景。它由计算与存储层、逻辑层、接入层和客户端四部分组成,支持多种计算任务的统一调度与管理。
823 1
|
8月前
|
消息中间件 人工智能 安全
云原生进化论:加速构建 AI 应用
本文将和大家分享过去一年在支持企业构建 AI 应用过程的一些实践和思考。
2144 83
|
9月前
|
人工智能 安全 中间件
阿里云 AI 中间件重磅发布,打通 AI 应用落地“最后一公里”
9 月 26 日,2025 云栖大会 AI 中间件:AI 时代的中间件技术演进与创新实践论坛上,阿里云智能集团资深技术专家林清山发表主题演讲《未来已来:下一代 AI 中间件重磅发布,解锁 AI 应用架构新范式》,重磅发布阿里云 AI 中间件,提供面向分布式多 Agent 架构的基座,包括:AgentScope-Java(兼容 Spring AI Alibaba 生态),AI MQ(基于Apache RocketMQ 的 AI 能力升级),AI 网关 Higress,AI 注册与配置中心 Nacos,以及覆盖模型与算力的 AI 可观测体系。
1688 89
|
8月前
|
人工智能 运维 Kubernetes
Serverless 应用引擎 SAE:为传统应用托底,为 AI 创新加速
在容器技术持续演进与 AI 全面爆发的当下,企业既要稳健托管传统业务,又要高效落地 AI 创新,如何在复杂的基础设施与频繁的版本变化中保持敏捷、稳定与低成本,成了所有技术团队的共同挑战。阿里云 Serverless 应用引擎(SAE)正是为应对这一时代挑战而生的破局者,SAE 以“免运维、强稳定、极致降本”为核心,通过一站式的应用级托管能力,同时支撑传统应用与 AI 应用,让企业把更多精力投入到业务创新。
828 30
|
8月前
|
设计模式 人工智能 自然语言处理
3个月圈粉百万,这个AI应用在海外火了
不知道大家还记不记得,我之前推荐过一个叫 Agnes 的 AI 应用,也是当时在 WAIC 了解到的。
851 2