阿里云贾扬清:大数据和人工智能一体化是必然趋势

本文涉及的产品
实时计算 Flink 版,5000CU*H 3个月
简介: 拥抱“融合”是大数据演进的新方向,⼤数据+⼈⼯智能⼀体化是⼤数据发展的必然⽅向,而人工智能是⼤数据业务发展的终极出⼝ 。

image.png

12月13日,阿里云计算平台负责人贾扬清在Flink Forward Asia 2020 峰会上指出,拥抱“融合”是大数据演进的新方向,大数据和人工智能一体化是必然趋势,而人工智能是大数据业务发展的终极出口。同时,他从不同角度讨论了Flink的开源技术,以及云时代下开源技术的发展和未来思考。

Flink开源社区 “渐入佳境”

从一个普通开源技术爱好者视角,贾扬清将2020年Flink发展定义为“渐入佳境”,主要体现在三大方面:

技术。今年Flink在技术方面取得两大新突破:一是Flink流批一体技术在阿里双11核心数据业务场景规模化成功应用;二是Flink实时计算峰值首次突破40亿条/秒。同比去年,不增加集群规模情况下提升了一倍的计算性能。

应用。Flink不再是一个居庙堂之高的技术,而是成为开源流式处理的事实标准,飞入“寻常百姓家”。比如中国信通院使用了Flink作为技术蓝本设计流式处理标准,云计算公司包括阿里云等均使用Flink作为流式处理的底层引擎。

社群。Flink开源社区高速增长,登顶Apache最活跃的邮件列表;Flink项目是Github提交次数最多的Apache顶级项目之一。去年Flink Forward Asia 参会⼈数达2000⼈,Flink 极客挑战赛吸引了4000+开发者参与;今年大会切换到线上、线下同时举办,Flink 极客挑战赛的颁奖更让大家看到了越来越多开发者对于开源技术的热情以及勇于挑战的精神。

开源让云更标准化

贾扬清认为:开源让云更标准化。他提到,云计算越来越趋于标准化对其自身发展非常有利。云上大量的开发技术体系日趋⼀致,这意味着大量云计算开发者熟悉这套体系后更容易把⾃⼰的应⽤变成云的⼀部分。

开源有助于阿⾥云打破⾃有技术体系,在充分尊重⽤户原有使⽤习惯基础上,形成标准、开放、公共的技术体系。单靠⼀家公司去制定标准⾮常难。

阿里云对于开源意味着什么?贾扬清提到以下三点:

组织来看,去年阿⾥巴巴集团成⽴开源技术委员会,从集团层⾯统⼀梳理和推进阿⾥巴巴开源技术战略的执行。

参与度来看,阿⾥巴巴集团⼀开始就广泛采用开源技术构建⾃⼰的技术体系。以阿⾥云计算平台事业部⼤数据产品为例,比如实时计算 Flink都在⼤量使⽤Hadoop/K8S⽣态的技术;机器学习PAI同样使⽤TensorFlow等开源深度学习框架。

贡献度来看,阿⾥巴巴集团持续为开源社区贡献力量。以Flink技术社区为例,仅去年⼀年阿⾥云就贡献百万行代码给Apache Flink社区。当前,集团开源项⽬数已超过1000个,覆盖⼤数据、AI、云原生、数据库、中间件、硬件等多个领域,全世界有70多万开发者为阿里点亮GitHub Star,成千上万的爱好者参与到项⽬贡献之中。

拥抱“融合”是大数据演进的新方向

贾扬清表示,云的三⼤发展趋势主要是IT基础设施的云化、核⼼技术的互联⽹化、应⽤的数据化和智能化,这也是云的核⼼价值所在。

企业在IT上云和业务互联⽹化之后,其应⽤必将从流程驱动变为数据智能驱动,实现数据化和智能化。云计算、底层IaaS技术在比拼基础设施的成熟度、稳定性和价格,而上层PaaS技术要⽐的是数据能力、智能能⼒。

⽬前包括数据库、IOT等泛⼤数据仍然处于⼤数据最基础的使⽤⽅式,需要整合更多⼤数据和AI能⼒。

image.png

所以,拥抱“融合”是大数据演进的新方向,⼤数据+⼈⼯智能⼀体化是⼤数据发展的必然⽅向,而人工智能是⼤数据业务发展的终极出⼝ 。

只有AI化,⼤数据才能发挥真正的业务价值。阿⾥云⼤数据之所以有核⼼竞争⼒,就是因为⼤数据是结合AI能⼒的⼤数据,是智能化升级的⼤数据。比如Flink+Alink,Flink不仅能够提供流批⼀体的处理能⼒,还能借助已开源的Alink机器学习算法库,实现Flink的⼤数据+⼈⼯智能⼀体化。

未来,社会经济将与互联⽹更加融合,企业机构的业务也将全⾯转变为互联⽹业务。一个企业仅仅有IT基础设施并不够,企业应⽤也将实现从流程驱动变为数据智能驱动,阿⾥云计算平台将输出全栈⼤数据技术能⼒,并提供全球顶尖的AI技术,一起实现数据化和智能化。

活动推荐:

仅需99元即可体验阿里云基于 Apache Flink 构建的企业级产品-实时计算 Flink 版!点击下方链接了解活动详情:https://www.aliyun.com/product/bigdata/sc?utm_content=g_1000250506

image.png

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
1月前
|
机器学习/深度学习 人工智能 分布式计算
我的阿里云社区年度总结报告:Python、人工智能与大数据领域的探索之旅
我的阿里云社区年度总结报告:Python、人工智能与大数据领域的探索之旅
117 35
|
23天前
|
机器学习/深度学习 人工智能 弹性计算
阿里云AI服务器价格表_GPU服务器租赁费用_AI人工智能高性能计算推理
阿里云AI服务器提供多种配置,包括CPU+GPU、FPGA等,适用于人工智能、机器学习和深度学习等计算密集型任务。本文整理了阿里云GPU服务器的优惠价格,涵盖NVIDIA A10、V100、T4等型号,提供1个月、1年和1小时的收费明细。具体规格如A10卡GN7i、V100-16G卡GN6v等,适用于不同业务场景,详情见官方页面。
118 11
|
1月前
|
数据采集 人工智能 分布式计算
MaxFrame:链接大数据与AI的高效分布式计算框架深度评测与实践!
阿里云推出的MaxFrame是链接大数据与AI的分布式Python计算框架,提供类似Pandas的操作接口和分布式处理能力。本文从部署、功能验证到实际场景全面评测MaxFrame,涵盖分布式Pandas操作、大语言模型数据预处理及企业级应用。结果显示,MaxFrame在处理大规模数据时性能显著提升,代码兼容性强,适合从数据清洗到训练数据生成的全链路场景...
96 5
MaxFrame:链接大数据与AI的高效分布式计算框架深度评测与实践!
|
1月前
|
人工智能 分布式计算 DataWorks
大数据& AI 产品月刊【2024年12月】
大数据& AI 产品技术月刊【2024年12月】,涵盖本月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据& AI 方面最新动态。
|
1月前
|
人工智能 分布式计算 大数据
MaxFrame 产品评测:大数据与AI融合的Python分布式计算框架
MaxFrame是阿里云MaxCompute推出的自研Python分布式计算框架,支持大规模数据处理与AI应用。它提供类似Pandas的API,简化开发流程,并兼容多种机器学习库,加速模型训练前的数据准备。MaxFrame融合大数据和AI,提升效率、促进协作、增强创新能力。尽管初次配置稍显复杂,但其强大的功能集、性能优化及开放性使其成为现代企业与研究机构的理想选择。未来有望进一步简化使用门槛并加强社区建设。
80 7
|
2月前
|
人工智能 JSON 算法
魔搭支持在阿里云人工智能平台PAI上进行模型训练、部署了!
现在,魔搭上的众多模型支持在阿里云人工智能平台PAI-Model Gallery上使用阿里云算力资源进行模型训练和部署啦!
|
10天前
|
存储 人工智能 算法
阿里云人工智能通识教学合作
阿里云人工智能通识教学合作为高校提供全面支持,包括视频理论课、动手实践课、AI实践平台、教学管理平台、专属算力资源及线下workshop。
59 0
|
1月前
|
机器学习/深度学习 人工智能 算法
阿里云人工智能平台图像视频特征提取
本文介绍了图像与视频特征提取技术在人工智能和计算机视觉中的应用,涵盖图像质量评分、人脸属性分析、年龄分析、图像多标签打标、图文视频动态分类打标、视频质量评分及视频分类打标。通过深度学习模型如CNN和RNN,这些技术能从海量数据中挖掘有价值信息,为图像分类、目标检测、视频推荐等场景提供支持,提升分析精度与效率。
124 9
|
1月前
|
存储 人工智能 数据管理
媒体声音|专访阿里云数据库周文超博士:AI就绪的智能数据平台设计思路
在生成式AI的浪潮中,数据的重要性日益凸显。大模型在实际业务场景的落地过程中,必须有海量数据的支撑:经过训练、推理和分析等一系列复杂的数据处理过程,才能最终产生业务价值。事实上,大模型本身就是数据处理后的产物,以数据驱动的决策与创新需要通过更智能的平台解决数据多模处理、实时分析等问题,这正是以阿里云为代表的企业推动 “Data+AI”融合战略的核心动因。
|
人工智能 大数据 Apache
大数据&AI的16种可能,2020阿里云客户最佳实践合集下载
2020年9月18日下午13:00云栖大会正式发布 《大数据&AI的16种可能,2020阿里云客户最佳实践合集》
73221 4
大数据&AI的16种可能,2020阿里云客户最佳实践合集下载