【阅读原文】戳:阿里云何川:云计算,为数据基础设施的建设提速|数据对话
数据逐步融入生产生活和社会治理,成为推动数字经济发展的关键生产要素。党中央对推动释放数据要素价值高度重视,党的二十届三中全会审议通过的《中共中央关于进一步全面深化改革、推进中国式现代化的决定》对完善数据要素市场制度规则等作出了部署,提出“建设和运营国家数据基础设施,促进数据共享”。
基于此,中国信通院工业互联网与物联网研究所特别策划“数据对话”专题,旨在通过专家的深度分析和独特视角,回答社会关切话题,探讨前沿技术和应用趋势。本期,我们邀请到阿里云弹性计算产品运营与生态合作负责人何川,围绕云计算如何加速数据基础设施建设及其未来发展趋势展开探讨。
2024年7月22日,在国务院新闻办公室举行的“推动高质量发展”系列主题新闻发布会上,国家数据局刘烈宏局长提出,要加快完善数据基础制度体系、加快推动数据基础设施布局、着力提升数据资源开发利用水平。随着“建设和运营国家数据基础设施,促进数据共享”指导思想的提出,我国正推进国家数据基础设施(NDI)建设,力图构建一个协同联动、规模流通、高效利用、规范可信的数据基础设施服务体系。
云计算作为新一代的IT基础设施,对于释放数据要素价值、提升数据流通和利用效能、推进数字经济高质量发展都具有重要价值与意义。
01. 云计算的本质是在线化
云计算和传统数据中心的最大区别,在于任何人,无论学生、开发者、中小企业,还是大型公司,都可以无差别地通过网络随时随地获取先进、易用、普惠和完整的技术服务。大规模弹性,连续服务、易于集成和扩展、自助获取、不需要人工干预等特点,构成了云计算最核心的本质,那就是在线化。
▌在线化,可以提升数据的流通效率和利用效率
得益于我国在互联网应用创新和产业数字化转型上的积累,我们拥有极其丰富的数据资产。但当数据在一个个的孤岛中,并不能发挥其应有的价值。只有被用起来,被用好,数据才能真正产生价值。在线化的云计算,可以把离线的数据在线化,成为数据高效流通的天然载体。云计算提供的敏捷性,可以大幅提升数据的流通效率和利用效率。而随着云计算的成熟,云上也已经构建了一整套从硬件到软件的安全方案,来保障数据存储和流通过程中的安全性。
▌在线化,可以提升成本收益和服务的可靠性
云计算的运营,可以高度概括为资源的运营,包括计算资源、存储资源、网络资源等。但云计算绝不仅仅是一台台服务器的堆砌。一朵超大规模的云,是一个非常大的系统工程。不同用户、不同业务、不同时段对于资源、对于性能的要求不一样,只有通过科学的装箱和调度,在保留云计算弹性资源池的前提下,最大化资源利用率,才能达到成本收益的最大化。虚拟化技术、容器化技术和Serverless化技术的目的,在于不断降低用户的综合算力获取成本和资源运维成本。
云计算的稳定性对于业务的连续性至关重要。以x86服务器为例,业界标准是每天万分之三的宕机率。这意味着每一百万台服务器,每天都会有300台物理服务器出现宕机,数千个用户的业务会受到影响。在超大规模尺度下,再小概率的错误也会变成大问题。云计算的技术难度,在于通过专门优化的硬件、故障预测算法和热迁移系统,降低受影响的用户规模、减少用户被影响的程度和加快故障恢复的速度。
▌在线化,可以提升业务的创新和产业的发展
由于云计算全栈性的特点,用户可以一站式便捷地获取所需的技术,提升技术创新的敏捷性。而技术的创新,最终会带来产业的发展和突破。近年来,中国汽车产业快速发展,这得益于新能源产业政策的扶持,也来自智能驾驶等技术领域的创新。今天,中国70%的汽车企业在使用阿里云,云计算成熟的技术栈和即开即用的服务,为车企的业务创新提供了完善的技术能力支撑。
自2009年成立以来,阿里云经历了个人开发者的创新创业,消费互联网公司的蓬勃发展和千行百业的云上数字化转型。超过80%的科技型企业今天在使用阿里云。云计算不仅是技术型初创公司的孵化器,也成为了各类企业创新的引擎。
02. 云计算的价值在于连接
先进的技术并不稀缺,稀缺的是如何让更多人、以更低门槛和更低成本获取技术。只有将边际成本降得足够低,技术才能够有效扩散,创造更大的价值。云计算是一个服务化的技术平台,能够让技术开箱即用,更容易获取,让每个人都能够连接最先进的技术。
▌数据与算力的连接
当人们提到云计算和大数据,往往把它们当作两个独立的词。实际上,云计算和大数据密不可分。过去几年,云计算的技术演进都是朝着超大规模数据处理的方向在优化。未来的IT基础设施不仅需要提供强劲的算力和大规模数据处理能力,还需要满足算力和数据之间更频繁、更快速的交互。
在刚刚过去的云栖大会上,阿里云发布了云基础设施处理器(Cloud Infrastructure Processing Unit)2.0版本的升级,几乎所有的升级都对数据密集型业务进行了优化,带宽从2*100Gbps提升到2*200Gbps,IO吞吐从100万IOPS提升到360万IOPS。智能计算灵骏能够支持20TB/s的超高吞吐的并行存储,GPU集群在万卡规模下的带宽利用率达到99%以上。
▌技术与业务的连接
技术只有服务业务,才能产生价值。云计算的普惠性,让技术不仅是大型公司的专属,同样可以惠及数以万计的中小企业。
阿里云2021年推出的计算巢,能够将一个传统软件以近乎零改造的方式变成SaaS服务。某款面向中小企业ERP软件,年新增客户超4000家。原本每个项目的交付成本是两周,通过软件云化,可以实现完全自动化交付。软件云化所产生的收益,不仅每年可以节省最多8000人周,160人年的重复工作,也可以实实在在降低中小企业数字化转型的成本和获取门槛。
▌现在与未来的连接
自ChatGPT发布以来,人工智能的热度持续高涨。人工智能并非是全新的话题。语音助手、人脸识别、搜索推荐这些人工智能成果,早已深深地改变了我们的生活。而随着大语言模型技术的应用,如代码助手、内容生成等,也开始成为日常的生产力工具。随着大模型和基于大模型的应用生态不断成熟,生成式AI对人们生产生活的影响会更加显现。
在互联网时代,所有的公司都在思考,如何利用数据创造价值。而现在,越来越多的公司开始思考如何利用人工智能创造价值,从思考数据驱动变成探索数据+人工智能驱动。2022年,阿里云提出模型即服务(Model as a Service),通过云计算让大模型以服务化的形式被调用,降低智能化创新的门槛,让未来更快地到来。
Scaling Law(规模定律)是描述系统性能随着系统规模变化而变化的规律性数学表达。OpenAI在2020年发表的《Scaling Laws for Neural Language Models》论文中首次提出了大模型的Scaling Law。之后,仿佛Scaling Law变成了LLM的专属名词。
然而,无论是在互联网浪潮、数字化浪潮,还是人工智能浪潮,云计算既是Scaling Law的体现,也是Scaling Law的实践者。随着云计算的采用度越来越高,其规模效应也越来越明显。规模化的云计算不仅让技术获取的边际成本降低到近乎为零,也让更多的创新开始在云上涌现。
专家介绍
何川
阿里云弹性计算产品运营与生态合作负责人。负责通用计算、加速计算、容器计算等产品线的商业化运营和生态建设。自2017年加入阿里云以来,负责了云服务器ECS、Alibaba Cloud Linux、服务器迁移中心、计算巢服务等产品的设计和商业化。涉及IaaS、PaaS、操作系统和SaaS软件生态。产品服务于数百万客户、支撑数千家企业上云和数百家ISV软件云化。
关于“中国信息通信研究院”
中国信息通信研究院是工业和信息化部直属科研事业单位,作为“国家高端专业智库 产业创新发展平台”,中国信通院的科研布局从信息通信业向赋能千行百业拓展,演进形成大通信、大数字化、大安全和新型工业化“三大一新”的研究体系,同步构建了产业全生命周期服务能力,在行业发展的重大战略、规划、政策、标准和检测认证等方面发挥了有力支撑作用。中国信通院是国内信息通信技术领域唯一打通战略与政策、新技术研究、标准研制、试验验证到产业推进的全链条创新平台。中国信通院积极推动数据技术产业落地,围绕数据基础设施、数据流通关键技术、公共数据开发利用、企业数据可信流通等布局数据要素市场建设,支撑国家战略规划与政策编制,积极开展领域内专题研究,紧密围绕数据核心技术,构建标准化体系,联合产业各方成立行业组织,推动数据行业交流共享。
我们是阿里巴巴云计算和大数据技术幕后的核心技术输出者。
获取关于我们的更多信息~