自研CPU实现大规模应用,新型计算体系正在到来

本文涉及的产品
函数计算FC,每月15万CU 3个月
简介: 阿里巴巴宣布自研CPU倚天710已大规模应用,阿里云未来两年20%的新增算力将使用自研CPU。目前,倚天710已在阿里云数据中心大规模部署,并以云的形式服务阿里巴巴和多家互联网科技公司,算力性价比提升超30%,单位算力功耗降低60%,这是中国首个云上大规模应用的自研CPU。

今天,2022杭州·云栖大会正式开幕。

大会上,阿里巴巴宣布自研CPU倚天710已大规模应用,阿里云未来两年20%的新增算力将使用自研CPU。

目前,倚天710已在阿里云数据中心大规模部署,并以云的形式服务阿里巴巴和多家互联网科技公司,算力性价比提升超30%,单位算力功耗降低60%,这是中国首个云上大规模应用的自研CPU。

阿里云认为,新一轮的科技变革深入发展,一个全新的计算体系正在到来,它将对IT硬件体系、软件研发范式和终端世界带来深刻变革。

配图3.png

以云计算为核心的新型计算体系,正在带来三大变革:

  • 首先,云重构了整个IT硬件体系,数据中心、芯片、服务器等产业链发生深刻变化;
  • 其次,软件研发范式发生深刻变革,Serverless、低代码、AI大模型开源等趋势,大幅提升软件生产效率;
  • 最后,云和端加速融合,算力从端转移上云,未来万物皆是计算机。

01 重构整个IT硬件体系

回顾云计算演进历程,过去十多年,云的创新主要集中在软件领域,首先出现了分布式虚拟化,而后实现了资源池化,形成了广泛的应用规模。

现在,云计算已经从软件创新,走向软硬件协同创新,用云来定义整个IT硬件体系。

CIPU带来新型计算架构

今年,阿里云发布了一款云数据中心专用处理器CIPU,替代CPU来管理和加速计算、存储和网络资源。这是一种全新的架构方式,代表着云计算深入到数据中心内部做体系化创新。

CIPU实现了全面专用硬件加速的高性能,包括高带宽、高吞吐和弹性RDMA的能力。“飞天+CIPU”的组合性能表现普遍优于业内同类产品,性能可提升20%以上。

在此基础上,阿里云基础设施已经广泛基于CIPU架构进行建设,并且构建了全栈自研的基础设施,例如自研CPU芯片倚天710、磐久服务器、EIC高性能网卡、磐久交换机、磐久液冷一体机、磐久液冷集装箱等自研硬件。

倚天710实现大规模应用

去年,阿里巴巴发布了首款“为云而生”的芯片倚天710。目前,倚天710已在阿里云数据中心大规模部署,并以云的形式服务阿里巴巴和多家互联网科技公司,算力性价比提升超30%,单位算力功耗降低60%,这是中国首个云上大规模应用的自研CPU。

在2021年双11期间,天猫双11核心交易系统平滑迁移至倚天710实例。中国一些知名的科学计算、智能手机行业和互联网等领域的企业在迁移至倚天710实例后,性价比均得到了显著提升。

阿里云还将继续扩大自研CPU的部署规模,预计未来两年内20%新增算力将使用自研CPU芯片倚天710。

过去十多年,飞天为阿里云打下了扎实的技术基础,让云实现了第一次飞跃。自研CPU芯片倚天710、下一代云计算体系架构CIPU将为阿里云构建第二技术曲线,是云面向下一代技术构建的核心竞争力。

配图4.png

02 软件研发范式发生深刻变革

计算体系的变革不仅将发生在IT硬件世界,软件研发范式也将发生颠覆性变化。软件研发范式的变革有三个层次:

  • 第一是新兴的软件开发方式崛起,软件架构全面Serverless化;
  • 第二是软件开发不再是程序员的专利,低代码让未来80%应用能够由业务人员直接开发;
  • 第三是未来所有软件都是AI化的,大模型开源将加速AI真正普及。

配图5.png

软件架构全面Serverless化

Serverless将让云计算从一种资源真正变成一种能力。

过去云计算用云服务器替代了物理服务器,但客户依旧按“几核几G服务器”的模式来购买云资源,未来云计算将全面Serverless化,更加接近“电网”模式,按计算的调用次数付费。

这将带来软件开发方式的深刻变化,软件架构从原来的主机架构迁移到Serverless架构,客户只需要开发业务逻辑,不再需要关心运维问题。

此外,Serverless架构可以降低软件开发门槛,提供更多的预制模块,大幅提高软件生产效率。例如,一家烟草公司只需要两个开发人员就可以做出整套物流系统。

对互联网新兴应用而言,Serverless架构让应用轻松抗住流量高峰。以南瓜电影为例,Serverless架构让这个视频APP无人值守就能应对百万级流量,并且总成本较此前下降40%。

低代码将进一步降低应用开发门槛

未来80%的应用将由业务人员开发,不懂低代码就和20年前不会用word一样。

数据显示,钉钉上,两年新增了500多万个低代码应用,聚集了380余万低代码开发者。

  • 在广西柳钢:冷轧厂退火车间工人张亮用十分钟就在钉钉上开发了一个危险区域管理应用,只有作业任务或设备点修人员才能扫脸后进入。
  • 在一汽大众:全员低代码开发已成常态。一汽大众有9000多位低代码开发者,其中90%都是一线业务人员。
  • 在四川省古蔺县皇华中学:乡村数学老师彭龙在钉钉上用低代码开发出了43款软件,最快1小时就能搭建一个应用,以极低的成本搭建起一所数字化校园。

软件AI化

最后,越来越多的软件将AI化,大模型开源将推动AI真正普及。

开源是软件进步的核心推动力量,过去开源推动了软件架构的进步,未来开源还将推动AI应用的进步和普及。

目前,达摩院在新型AI模型社区魔搭ModelScope上,开源了超过300个优质模型,可以帮助开发者利用基础模型快速开发AI应用。

03 云端加速融合,万物皆是计算机

今天,云计算正在创造越来越多的终端形态。几十年前,手机只能用来打电话,现在手机是一个手里的计算机。过去,汽车从只讲究“马力”,现在汽车需要比拼“算力”,成为一个“四轮计算机”。

云端加速融合,算力正在不断从终端转移上云,这让终端突破了物理限制,不仅手机、电脑、汽车、音箱会变成计算机,未来万物皆是计算机。

image.png

例如,Rokid在推出的AR眼镜中接入阿里云无影架构,利用云上算力,用户打开仅有85克重量的眼镜,就能在眼前的虚拟现实画面中,与人聊天、办公,并且还能做3D渲染、大数据编程等复杂工作。

在PC电脑端,未来阿里云继续将RISC-V芯片和无影架构结合,让创新终端具有更高性能、更低能耗,并实现全栈自研。

目前,阿里巴巴已经成为全球RISC-V技术与生态发展的引领者,并且已经完成了和云操作系统的适配,迈出了端边云一体的重要一步。

3.png

文章转自阿里云公众号2022年11月3日发布的《自研CPU实现大规模应用!新型计算体系正在到来》

相关实践学习
【文生图】一键部署Stable Diffusion基于函数计算
本实验教你如何在函数计算FC上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。函数计算提供一定的免费额度供用户使用。本实验答疑钉钉群:29290019867
建立 Serverless 思维
本课程包括: Serverless 应用引擎的概念, 为开发者带来的实际价值, 以及让您了解常见的 Serverless 架构模式
相关文章
|
7月前
|
人工智能 并行计算 PyTorch
【PyTorch&TensorBoard实战】GPU与CPU的计算速度对比(附代码)
【PyTorch&TensorBoard实战】GPU与CPU的计算速度对比(附代码)
354 0
|
2月前
|
消息中间件 Java 应用服务中间件
我是如何通过火焰图分析让应用CPU占用下降近20%的
分享作者在使用Arthas火焰图工具进行Java应用性能分析和优化的经验。
|
2月前
|
监控 并行计算 数据处理
构建高效Python应用:并发与异步编程的实战秘籍,IO与CPU密集型任务一网打尽!
在Python编程的征途中,面对日益增长的性能需求,如何构建高效的应用成为了每位开发者必须面对的课题。并发与异步编程作为提升程序性能的两大法宝,在处理IO密集型与CPU密集型任务时展现出了巨大的潜力。今天,我们将深入探讨这些技术的最佳实践,助你打造高效Python应用。
38 0
|
4月前
|
C++
C++ 根据程序运行的时间和cpu频率来计算在另外的cpu上运行所花的时间
C++ 根据程序运行的时间和cpu频率来计算在另外的cpu上运行所花的时间
47 0
|
6月前
|
缓存 C语言 计算机视觉
程序与技术分享:CPU0处理器的架构及应用
程序与技术分享:CPU0处理器的架构及应用
|
2月前
|
运维 JavaScript Linux
容器内的Nodejs应用如何获取宿主机的基础信息-系统、内存、cpu、启动时间,以及一个df -h的坑
本文介绍了如何在Docker容器内的Node.js应用中获取宿主机的基础信息,包括系统信息、内存使用情况、磁盘空间和启动时间等。核心思路是将宿主机的根目录挂载到容器,但需注意权限和安全问题。文章还提到了使用`df -P`替代`df -h`以获得一致性输出,避免解析错误。
|
3月前
|
KVM 虚拟化
计算虚拟化之CPU——qemu解析
【9月更文挑战10天】本文介绍了QEMU命令行参数的解析过程及其在KVM虚拟化中的应用。展示了QEMU通过多个`qemu_add_opts`函数调用处理不同类型设备和配置选项的方式,并附上了OpenStack生成的一个复杂KVM参数实例。
|
3月前
|
算法 C++
如何精确计算出一个算法的CPU运行时间?
如何精确计算出一个算法的CPU运行时间?
|
4月前
|
算法 Windows
CAE如何基于CPU最佳核数和token等计算成本
【8月更文挑战第26天】在使用CAE(计算机辅助工程)进行分析计算时,需综合考虑CPU核数和token对成本的影响。CPU核数越多,虽能加速计算,但过多核数会因通信开销和内存带宽限制导致性能提升放缓。成本计算需考虑硬件租赁或购买费用及云服务收费标准。Token作为软件许可,需分摊到每次计算中。通过测试优化找到性能与成本的平衡点,实现最低成本下的高效计算。
|
5月前
|
并行计算 监控 数据处理
构建高效Python应用:并发与异步编程的实战秘籍,IO与CPU密集型任务一网打尽!
【7月更文挑战第16天】Python并发异步提升性能:使用`asyncio`处理IO密集型任务,如网络请求,借助事件循环实现非阻塞;`multiprocessing`模块用于CPU密集型任务,绕过GIL进行并行计算。通过任务类型识别、任务分割、避免共享状态、利用现代库和性能调优,实现高效编程。示例代码展示异步HTTP请求和多进程数据处理。
58 8