阿里云何川:云计算,为数据基础设施的建设提速|数据对话

简介: 中国信通院工业互联网与物联网研究所特别策划“数据对话”专题,旨在通过专家的深度分析和独特视角,回答社会关切话题,探讨前沿技术和应用趋势。

【阅读原文】戳:阿里云何川:云计算,为数据基础设施的建设提速|数据对话

数据逐步融入生产生活和社会治理,成为推动数字经济发展的关键生产要素。党中央对推动释放数据要素价值高度重视,党的二十届三中全会审议通过的《中共中央关于进一步全面深化改革、推进中国式现代化的决定》对完善数据要素市场制度规则等作出了部署,提出“建设和运营国家数据基础设施,促进数据共享”。

基于此,中国信通院工业互联网与物联网研究所特别策划“数据对话”专题,旨在通过专家的深度分析和独特视角,回答社会关切话题,探讨前沿技术和应用趋势。本期,我们邀请到阿里云弹性计算产品运营与生态合作负责人何川,围绕云计算如何加速数据基础设施建设及其未来发展趋势展开探讨。

 

 

2024年7月22日,在国务院新闻办公室举行的“推动高质量发展”系列主题新闻发布会上,国家数据局刘烈宏局长提出,要加快完善数据基础制度体系、加快推动数据基础设施布局、着力提升数据资源开发利用水平。随着“建设和运营国家数据基础设施,促进数据共享”指导思想的提出,我国正推进国家数据基础设施(NDI)建设,力图构建一个协同联动、规模流通、高效利用、规范可信的数据基础设施服务体系。

云计算作为新一代的IT基础设施,对于释放数据要素价值、提升数据流通和利用效能、推进数字经济高质量发展都具有重要价值与意义。




01. 云计算的本质是在线化

云计算和传统数据中心的最大区别,在于任何人,无论学生、开发者、中小企业,还是大型公司,都可以无差别地通过网络随时随地获取先进、易用、普惠和完整的技术服务。大规模弹性,连续服务、易于集成和扩展、自助获取、不需要人工干预等特点,构成了云计算最核心的本质,那就是在线化。

 

 

在线化,可以提升数据的流通效率和利用效率

 

得益于我国在互联网应用创新和产业数字化转型上的积累,我们拥有极其丰富的数据资产。但当数据在一个个的孤岛中,并不能发挥其应有的价值。只有被用起来,被用好,数据才能真正产生价值。在线化的云计算,可以把离线的数据在线化,成为数据高效流通的天然载体。云计算提供的敏捷性,可以大幅提升数据的流通效率和利用效率。而随着云计算的成熟,云上也已经构建了一整套从硬件到软件的安全方案,来保障数据存储和流通过程中的安全性。

 

 

在线化,可以提升成本收益和服务的可靠性

云计算的运营,可以高度概括为资源的运营,包括计算资源、存储资源、网络资源等。但云计算绝不仅仅是一台台服务器的堆砌。一朵超大规模的云,是一个非常大的系统工程。不同用户、不同业务、不同时段对于资源、对于性能的要求不一样,只有通过科学的装箱和调度,在保留云计算弹性资源池的前提下,最大化资源利用率,才能达到成本收益的最大化。虚拟化技术、容器化技术和Serverless化技术的目的,在于不断降低用户的综合算力获取成本和资源运维成本。

云计算的稳定性对于业务的连续性至关重要。以x86服务器为例,业界标准是每天万分之三的宕机率。这意味着每一百万台服务器,每天都会有300台物理服务器出现宕机,数千个用户的业务会受到影响。在超大规模尺度下,再小概率的错误也会变成大问题。云计算的技术难度,在于通过专门优化的硬件、故障预测算法和热迁移系统,降低受影响的用户规模、减少用户被影响的程度和加快故障恢复的速度。




在线化,可以提升业务的创新和产业的发展

由于云计算全栈性的特点,用户可以一站式便捷地获取所需的技术,提升技术创新的敏捷性。而技术的创新,最终会带来产业的发展和突破。近年来,中国汽车产业快速发展,这得益于新能源产业政策的扶持,也来自智能驾驶等技术领域的创新。今天,中国70%的汽车企业在使用阿里云,云计算成熟的技术栈和即开即用的服务,为车企的业务创新提供了完善的技术能力支撑。

自2009年成立以来,阿里云经历了个人开发者的创新创业,消费互联网公司的蓬勃发展和千行百业的云上数字化转型。超过80%的科技型企业今天在使用阿里云。云计算不仅是技术型初创公司的孵化器,也成为了各类企业创新的引擎。

 


 

02. 云计算的价值在于连接

先进的技术并不稀缺,稀缺的是如何让更多人、以更低门槛和更低成本获取技术。只有将边际成本降得足够低,技术才能够有效扩散,创造更大的价值。云计算是一个服务化的技术平台,能够让技术开箱即用,更容易获取,让每个人都能够连接最先进的技术。

 

 


▌数据与算力的连接

当人们提到云计算和大数据,往往把它们当作两个独立的词。实际上,云计算和大数据密不可分。过去几年,云计算的技术演进都是朝着超大规模数据处理的方向在优化。未来的IT基础设施不仅需要提供强劲的算力和大规模数据处理能力,还需要满足算力和数据之间更频繁、更快速的交互。


在刚刚过去的云栖大会上,阿里云发布了云基础设施处理器(Cloud Infrastructure Processing Unit)2.0版本的升级,几乎所有的升级都对数据密集型业务进行了优化,带宽从2*100Gbps提升到2*200Gbps,IO吞吐从100万IOPS提升到360万IOPS。智能计算灵骏能够支持20TB/s的超高吞吐的并行存储,GPU集群在万卡规模下的带宽利用率达到99%以上。




▌技术与业务的连接

技术只有服务业务,才能产生价值。云计算的普惠性,让技术不仅是大型公司的专属,同样可以惠及数以万计的中小企业。

阿里云2021年推出的计算巢,能够将一个传统软件以近乎零改造的方式变成SaaS服务。某款面向中小企业ERP软件,年新增客户超4000家。原本每个项目的交付成本是两周,通过软件云化,可以实现完全自动化交付。软件云化所产生的收益,不仅每年可以节省最多8000人周,160人年的重复工作,也可以实实在在降低中小企业数字化转型的成本和获取门槛。




▌现在与未来的连接

自ChatGPT发布以来,人工智能的热度持续高涨。人工智能并非是全新的话题。语音助手、人脸识别、搜索推荐这些人工智能成果,早已深深地改变了我们的生活。而随着大语言模型技术的应用,如代码助手、内容生成等,也开始成为日常的生产力工具。随着大模型和基于大模型的应用生态不断成熟,生成式AI对人们生产生活的影响会更加显现。


在互联网时代,所有的公司都在思考,如何利用数据创造价值。而现在,越来越多的公司开始思考如何利用人工智能创造价值,从思考数据驱动变成探索数据+人工智能驱动。2022年,阿里云提出模型即服务(Model as a Service),通过云计算让大模型以服务化的形式被调用,降低智能化创新的门槛,让未来更快地到来。


Scaling Law(规模定律)是描述系统性能随着系统规模变化而变化的规律性数学表达。OpenAI在2020年发表的《Scaling Laws for Neural Language Models》论文中首次提出了大模型的Scaling Law。之后,仿佛Scaling Law变成了LLM的专属名词。


然而,无论是在互联网浪潮、数字化浪潮,还是人工智能浪潮,云计算既是Scaling Law的体现,也是Scaling Law的实践者。随着云计算的采用度越来越高,其规模效应也越来越明显。规模化的云计算不仅让技术获取的边际成本降低到近乎为零,也让更多的创新开始在云上涌现。



专家介绍

 

何川

 

阿里云弹性计算产品运营与生态合作负责人。负责通用计算、加速计算、容器计算等产品线的商业化运营和生态建设。自2017年加入阿里云以来,负责了云服务器ECS、Alibaba Cloud Linux、服务器迁移中心、计算巢服务等产品的设计和商业化。涉及IaaS、PaaS、操作系统和SaaS软件生态。产品服务于数百万客户、支撑数千家企业上云和数百家ISV软件云化。

关于“中国信息通信研究院”

 

中国信息通信研究院是工业和信息化部直属科研事业单位,作为“国家高端专业智库 产业创新发展平台”,中国信通院的科研布局从信息通信业向赋能千行百业拓展,演进形成大通信、大数字化、大安全和新型工业化“三大一新”的研究体系,同步构建了产业全生命周期服务能力,在行业发展的重大战略、规划、政策、标准和检测认证等方面发挥了有力支撑作用。中国信通院是国内信息通信技术领域唯一打通战略与政策、新技术研究、标准研制、试验验证到产业推进的全链条创新平台。中国信通院积极推动数据技术产业落地,围绕数据基础设施、数据流通关键技术、公共数据开发利用、企业数据可信流通等布局数据要素市场建设,支撑国家战略规划与政策编制,积极开展领域内专题研究,紧密围绕数据核心技术,构建标准化体系,联合产业各方成立行业组织,推动数据行业交流共享。




我们是阿里巴巴云计算和大数据技术幕后的核心技术输出者。

欢迎关注 “阿里云基础设施”同名微信微博知乎

获取关于我们的更多信息~

相关文章
|
2天前
|
存储 缓存 关系型数据库
MySQL事务日志-Redo Log工作原理分析
事务的隔离性和原子性分别通过锁和事务日志实现,而持久性则依赖于事务日志中的`Redo Log`。在MySQL中,`Redo Log`确保已提交事务的数据能持久保存,即使系统崩溃也能通过重做日志恢复数据。其工作原理是记录数据在内存中的更改,待事务提交时写入磁盘。此外,`Redo Log`采用简单的物理日志格式和高效的顺序IO,确保快速提交。通过不同的落盘策略,可在性能和安全性之间做出权衡。
1517 4
|
29天前
|
弹性计算 人工智能 架构师
阿里云携手Altair共拓云上工业仿真新机遇
2024年9月12日,「2024 Altair 技术大会杭州站」成功召开,阿里云弹性计算产品运营与生态负责人何川,与Altair中国技术总监赵阳在会上联合发布了最新的“云上CAE一体机”。
阿里云携手Altair共拓云上工业仿真新机遇
|
5天前
|
人工智能 Rust Java
10月更文挑战赛火热启动,坚持热爱坚持创作!
开发者社区10月更文挑战,寻找热爱技术内容创作的你,欢迎来创作!
501 19
|
2天前
|
存储 SQL 关系型数据库
彻底搞懂InnoDB的MVCC多版本并发控制
本文详细介绍了InnoDB存储引擎中的两种并发控制方法:MVCC(多版本并发控制)和LBCC(基于锁的并发控制)。MVCC通过记录版本信息和使用快照读取机制,实现了高并发下的读写操作,而LBCC则通过加锁机制控制并发访问。文章深入探讨了MVCC的工作原理,包括插入、删除、修改流程及查询过程中的快照读取机制。通过多个案例演示了不同隔离级别下MVCC的具体表现,并解释了事务ID的分配和管理方式。最后,对比了四种隔离级别的性能特点,帮助读者理解如何根据具体需求选择合适的隔离级别以优化数据库性能。
179 1
|
8天前
|
JSON 自然语言处理 数据管理
阿里云百炼产品月刊【2024年9月】
阿里云百炼产品月刊【2024年9月】,涵盖本月产品和功能发布、活动,应用实践等内容,帮助您快速了解阿里云百炼产品的最新动态。
阿里云百炼产品月刊【2024年9月】
|
21天前
|
存储 关系型数据库 分布式数据库
GraphRAG:基于PolarDB+通义千问+LangChain的知识图谱+大模型最佳实践
本文介绍了如何使用PolarDB、通义千问和LangChain搭建GraphRAG系统,结合知识图谱和向量检索提升问答质量。通过实例展示了单独使用向量检索和图检索的局限性,并通过图+向量联合搜索增强了问答准确性。PolarDB支持AGE图引擎和pgvector插件,实现图数据和向量数据的统一存储与检索,提升了RAG系统的性能和效果。
|
9天前
|
Linux 虚拟化 开发者
一键将CentOs的yum源更换为国内阿里yum源
一键将CentOs的yum源更换为国内阿里yum源
451 5
|
7天前
|
存储 人工智能 搜索推荐
数据治理,是时候打破刻板印象了
瓴羊智能数据建设与治理产品Datapin全面升级,可演进扩展的数据架构体系为企业数据治理预留发展空间,推出敏捷版用以解决企业数据量不大但需构建数据的场景问题,基于大模型打造的DataAgent更是为企业用好数据资产提供了便利。
314 2
|
23天前
|
人工智能 IDE 程序员
期盼已久!通义灵码 AI 程序员开启邀测,全流程开发仅用几分钟
在云栖大会上,阿里云云原生应用平台负责人丁宇宣布,「通义灵码」完成全面升级,并正式发布 AI 程序员。
|
25天前
|
机器学习/深度学习 算法 大数据
【BetterBench博士】2024 “华为杯”第二十一届中国研究生数学建模竞赛 选题分析
2024“华为杯”数学建模竞赛,对ABCDEF每个题进行详细的分析,涵盖风电场功率优化、WLAN网络吞吐量、磁性元件损耗建模、地理环境问题、高速公路应急车道启用和X射线脉冲星建模等多领域问题,解析了问题类型、专业和技能的需要。
2608 22
【BetterBench博士】2024 “华为杯”第二十一届中国研究生数学建模竞赛 选题分析