自研CPU实现大规模应用!张建锋:新型计算体系正在到来

本文涉及的产品
函数计算FC,每月15万CU 3个月
无影云电脑个人版,1个月黄金款+200核时
无影云电脑企业版,4核8GB 120小时 1个月
简介: 自研CPU实现大规模应用!张建锋:新型计算体系正在到来


今天,2022杭州·云栖大会正式开幕。


大会上,阿里巴巴宣布自研CPU倚天710已大规模应用,阿里云未来两年20%的新增算力将使用自研CPU。


目前,倚天710已在阿里云数据中心大规模部署,并以云的形式服务阿里巴巴和多家互联网科技公司,算力性价比提升超30%,单位算力功耗降低60%,这是中国首个云上大规模应用的自研CPU。


阿里云智能总裁张建锋认为,新一轮的科技变革深入发展,一个全新的计算体系正在到来,它将对IT硬件体系、软件研发范式和终端世界带来深刻变革。



张建锋认为,以云计算为核心的新型计算体系,正在带来三大变革:


首先,云重构了整个IT硬件体系,数据中心、芯片、服务器等产业链发生深刻变化;


其次,软件研发范式发生深刻变革,Serverless、低代码、AI大模型开源等趋势,大幅提升软件生产效率;


最后,云和端加速融合,算力从端转移上云,未来万物皆是计算机。



01 重构整个IT硬件体系


张建锋回顾云计算演进历程,过去十多年,云的创新主要集中在软件领域,首先出现了分布式虚拟化,而后实现了资源池化,形成了广泛的应用规模。


现在,云计算已经从软件创新,走向软硬件协同创新,用云来定义整个IT硬件体系。


CIPU带来新型计算架构

今年,阿里云发布了一款云数据中心专用处理器CIPU,替代CPU来管理和加速计算、存储和网络资源。这是一种全新的架构方式,代表着云计算深入到数据中心内部做体系化创新。


CIPU实现了全面专用硬件加速的高性能,包括高带宽、高吞吐和弹性RDMA的能力。“飞天+CIPU”的组合性能表现普遍优于业内同类产品,性能可提升20%以上。


在此基础上,阿里云基础设施已经广泛基于CIPU架构进行建设,并且构建了全栈自研的基础设施,例如自研CPU芯片倚天710、磐久服务器、EIC高性能网卡、磐久交换机、磐久液冷一体机、磐久液冷集装箱等自研硬件。



倚天710实现大规模应用

去年,阿里巴巴发布了首款“为云而生”的芯片倚天710。目前,倚天710已在阿里云数据中心大规模部署,并以云的形式服务阿里巴巴和多家互联网科技公司,算力性价比提升超30%,单位算力功耗降低60%,这是中国首个云上大规模应用的自研CPU。


在2021年双11期间,天猫双11核心交易系统平滑迁移至倚天710实例。中国一些知名的科学计算、智能手机行业和互联网等领域的企业在迁移至倚天710实例后,性价比均得到了显著提升。


张建锋表示,未来阿里云还将继续扩大自研CPU的部署规模,预计未来两年内20%新增算力将使用自研CPU芯片倚天710。


他认为,过去十多年,飞天为阿里云打下了扎实的技术基础,让云实现了第一次飞跃。自研CPU芯片倚天710、下一代云计算体系架构CIPU将为阿里云构建第二技术曲线,是云面向下一代技术构建的核心竞争力。




02 软件研发范式发生深刻变革


计算体系的变革不仅将发生在IT硬件世界,软件研发范式也将发生颠覆性变化。张建锋认为,软件研发范式的变革有三个层次:


第一是新兴的软件开发方式崛起,软件架构全面Serverless化;


第二是软件开发不再是程序员的专利,低代码让未来80%应用能够由业务人员直接开发;


第三是未来所有软件都是AI化的,大模型开源将加速AI真正普及。



软件架构全面Serverless化

Serverless将让云计算从一种资源真正变成一种能力。


张建锋表示,过去云计算用云服务器替代了物理服务器,但客户依旧按“几核几G服务器”的模式来购买云资源,未来云计算将全面Serverless化,更加接近“电网”模式,按计算的调用次数付费。



这将带来软件开发方式的深刻变化,软件架构从原来的主机架构迁移到Serverless架构,客户只需要开发业务逻辑,不再需要关心运维问题。


此外,Serverless架构可以降低软件开发门槛,提供更多的预制模块,大幅提高软件生产效率。例如,一家烟草公司只需要两个开发人员就可以做出整套物流系统。


对互联网新兴应用而言,Serverless架构让应用轻松抗住流量高峰。以南瓜电影为例,Serverless架构让这个视频APP无人值守就能应对百万级流量,并且总成本较此前下降40%。


低代码将进一步降低应用开发门槛

张建锋认为,未来80%的应用将由业务人员开发,不懂低代码就和20年前不会用word一样。


数据显示,钉钉上,两年新增了500多万个低代码应用,聚集了380余万低代码开发者



在广西柳钢:冷轧厂退火车间工人张亮用十分钟就在钉钉上开发了一个危险区域管理应用,只有作业任务或设备点修人员才能扫脸后进入。


在一汽大众:全员低代码开发已成常态。一汽大众有9000多位低代码开发者,其中90%都是一线业务人员。


在四川省古蔺县皇华中学:乡村数学老师彭龙在钉钉上用低代码开发出了43款软件,最快1小时就能搭建一个应用,以极低的成本搭建起一所数字化校园。


软件AI化

最后,越来越多的软件将AI化,大模型开源将推动AI真正普及。


张建锋表示,开源是软件进步的核心推动力量,过去开源推动了软件架构的进步,未来开源还将推动AI应用的进步和普及。


目前,达摩院在新型AI模型社区魔搭ModelScope上,开源了超过300个优质模型,可以帮助开发者利用基础模型快速开发AI应用。



03 云端加速融合,万物皆是计算机


今天,云计算正在创造越来越多的终端形态。几十年前,手机只能用来打电话,现在手机是一个手里的计算机。过去,汽车从只讲究“马力”,现在汽车需要比拼“算力”,成为一个“四轮计算机”。


张建锋认为,云端加速融合,算力正在不断从终端转移上云,这让终端突破了物理限制,不仅手机、电脑、汽车、音箱会变成计算机,未来万物皆是计算机。



例如,Rokid在推出的AR眼镜中接入阿里云无影架构,利用云上算力,用户打开仅有85克重量的眼镜,就能在眼前的虚拟现实画面中,与人聊天、办公,并且还能做3D渲染、大数据编程等复杂工作。


Rokid Air+Station

无影魔方

无影笔记本

谷东科技工业AR头盔

MAXHUB智能显示器

中国联通5G卡片

在PC电脑端,未来阿里云继续将RISC-V芯片和无影架构结合,让创新终端具有更高性能、更低能耗,并实现全栈自研。


目前,阿里巴巴已经成为全球RISC-V技术与生态发展的引领者,并且已经完成了和云操作系统的适配,迈出了端边云一体的重要一步。




相关实践学习
【文生图】一键部署Stable Diffusion基于函数计算
本实验教你如何在函数计算FC上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。函数计算提供一定的免费额度供用户使用。本实验答疑钉钉群:29290019867
建立 Serverless 思维
本课程包括: Serverless 应用引擎的概念, 为开发者带来的实际价值, 以及让您了解常见的 Serverless 架构模式
目录
相关文章
|
2月前
|
消息中间件 Java 应用服务中间件
我是如何通过火焰图分析让应用CPU占用下降近20%的
分享作者在使用Arthas火焰图工具进行Java应用性能分析和优化的经验。
|
2月前
|
监控 并行计算 数据处理
构建高效Python应用:并发与异步编程的实战秘籍,IO与CPU密集型任务一网打尽!
在Python编程的征途中,面对日益增长的性能需求,如何构建高效的应用成为了每位开发者必须面对的课题。并发与异步编程作为提升程序性能的两大法宝,在处理IO密集型与CPU密集型任务时展现出了巨大的潜力。今天,我们将深入探讨这些技术的最佳实践,助你打造高效Python应用。
46 0
|
14天前
|
人工智能 缓存 并行计算
转载:【AI系统】CPU 计算本质
本文深入探讨了CPU计算性能,分析了算力敏感度及技术趋势对CPU性能的影响。文章通过具体数据和实例,讲解了CPU算力的计算方法、算力与数据加载之间的平衡,以及如何通过算力敏感度分析优化计算系统性能。同时,文章还考察了服务器、GPU和超级计算机等平台的性能发展,揭示了这些变化如何塑造我们对CPU性能的理解和期待。
转载:【AI系统】CPU 计算本质
|
4月前
|
C++
C++ 根据程序运行的时间和cpu频率来计算在另外的cpu上运行所花的时间
C++ 根据程序运行的时间和cpu频率来计算在另外的cpu上运行所花的时间
53 0
|
22天前
|
开发框架 .NET PHP
网站应用项目如何选择阿里云服务器实例规格+内存+CPU+带宽+操作系统等配置
对于使用阿里云服务器的搭建网站的用户来说,面对众多可选的实例规格和配置选项,我们应该如何做出最佳选择,以最大化业务效益并控制成本,成为大家比较关注的问题,如果实例、内存、CPU、带宽等配置选择不合适,可能会影响到自己业务在云服务器上的计算性能及后期运营状况,本文将详细解析企业在搭建网站应用项目时选购阿里云服务器应考虑的一些因素,以供参考。
|
29天前
|
人工智能 缓存 并行计算
【AI系统】CPU 计算本质
本文深入探讨了CPU计算性能,分析了算力敏感度及技术趋势对CPU性能的影响。文章通过具体数据和实例,解释了算力计算方法、数据加载与计算的平衡点,以及如何通过算力敏感度分析优化性能瓶颈。同时,文章还讨论了服务器、GPU和超级计算机等不同计算平台的性能发展趋势,强调了优化数据传输速率和加载策略的重要性。
57 4
|
1月前
|
传感器 算法 机器人
定点 CPU 在哪些领域有应用
定点CPU主要应用于对成本和功耗敏感的嵌入式系统中,如消费电子、汽车电子、工业控制和物联网设备等,因其结构简单、效率高而受到青睐。
|
29天前
|
缓存 人工智能 算法
【AI系统】CPU 计算时延
CPU(中央处理器)是计算机系统的核心,其计算时延(从指令发出到完成所需时间)对系统性能至关重要。本文探讨了CPU计算时延的组成,包括指令提取、解码、执行、存储器访问及写回时延,以及影响时延的因素,如时钟频率、流水线技术、并行处理、缓存命中率和内存带宽。通过优化这些方面,可以有效降低计算时延,提升系统性能。文中还通过具体示例解析了时延产生的原因,强调了内存时延对计算速度的关键影响。
44 0
|
2月前
|
运维 JavaScript Linux
容器内的Nodejs应用如何获取宿主机的基础信息-系统、内存、cpu、启动时间,以及一个df -h的坑
本文介绍了如何在Docker容器内的Node.js应用中获取宿主机的基础信息,包括系统信息、内存使用情况、磁盘空间和启动时间等。核心思路是将宿主机的根目录挂载到容器,但需注意权限和安全问题。文章还提到了使用`df -P`替代`df -h`以获得一致性输出,避免解析错误。
|
3月前
|
KVM 虚拟化
计算虚拟化之CPU——qemu解析
【9月更文挑战10天】本文介绍了QEMU命令行参数的解析过程及其在KVM虚拟化中的应用。展示了QEMU通过多个`qemu_add_opts`函数调用处理不同类型设备和配置选项的方式,并附上了OpenStack生成的一个复杂KVM参数实例。