今天分享的内容来自阿里云智能解决方案架构师冯英飞的“芯片竞争格局及最佳匹配场景”。本文主要从ARM芯片市场竞争与生态分析、倚天竞争力分析以及优势业务场景介绍这三个内容进行讲解。
一、ARM芯片市场竞争与生态分析
1. 芯片商业竞争格局:商业驱动市场平衡与再分配
高通的加入,英伟达、AMD的摩拳擦掌,让原本不温不火的PC市场竞争更加白热化。不同架构的选择所带来的性能、功耗、生态还只是第一步,真正的战场是AI。
比如高通发布的骁龙X Elite支持在终端侧运行超过130亿参数的生成式AI模型,在终端侧已经是极大的突破,目前手机端的参数规模在10-70亿左右。但网络端的大模型有几百亿乃至上千亿的参数量。
因此二者不是替代关系,而是互补关系。智能终端厂商希望的是,在PC端、手机端都能实现和在云端一样的操作,二者协同,称为“混合AI”。微软高管注意到了苹果基于ARM 架构的芯片在 AI 处理等方面的高效,希望由此获得类似的性能。这也可视为微软对在 PC 市场中占比越来越大的苹果的一次反击。
2. ARM 服务器CPU发展历程
第一波浪潮(2008-2013),ARM开始考虑做服务器芯片最早可以追溯到2008年从投资startup calxeda公司开始,当时还是ARM V7架构,32位处理器。后面ARM发布v8架构,在手机移动处理器上所向披靡,但相比于服务器上的多核高性能,ARM在服务器领域因为性能不足没有什么竞争力,所以很快就落下帷幕,基本上没有开始就结束了。
第二波浪潮(2011-2018)有三个标志性的时间点。第一个是2016年Broadcom,Vulcan说要开始做服务器芯片,这也是ARM联合一些合作厂商做出的一个尝试。第二个是2018年底发布了ARM SBSA,它是服务器的一个标准的加工模板,相当于给ARM服务器打了一个很好的基础。
第三个是2018年AWS Graviton2 发布。在此之前CPU厂商、芯片厂商做ARM的芯片基本都已经宣告失败了,直到2018年AWS Graviton2 发布,开启了ARM处理器在服务器领域成功的先河,它给ARM芯片在服务器领域成功指明了道路。云厂商基于ARM架构会有一定的优势,它可以通过自身iaas和paas这些云的标准服务,给用户提供的是一套ARM的解决方案,而不是一个单纯的芯片。因为如果只是ARM芯片,它在生态和软件上会导致用户的使用成本比较高。
第三波浪潮(2019~至今),2019年阿里巴巴开始自研ARM服务器芯片。此外,Google、Microsoft也都是陆续宣布要开始自研服务器芯片的开发。2021年,倚天710经过两年的研发终于进行了量产,目前已经在阿里巴巴集团、阿里云都实现了规模化使用。
二、倚天竞争力分析
1. 算力分析:V9架构ARM算力的分水岭
倚天710采用业界已上市产品中先进的5nm工艺,基于最新的ARMv9架构,SPECint 2017领先业界标杆20%,对比上一代X86平台领先40% 。
接下来介绍一下倚天710这款芯片的主要规格。
- 双 DIE结构,每个DIE 360 毫米2。
- 两个DIE 600 亿晶体管。
- 业界首次使用ARM V9架构和CPU 核– Perseus。
- 主频:3GHz。
- 8 Channel DDR5 x4800。
- 96 Lane PCIe 5.0。
- Max Power: 300 W。
2. 倚天性价比分析:云上最优性价比ECS实例
- 1U2机型,CIPU实现整机核的高密度,可达256core,
- 极限功耗300w,实际应用中功耗大约在100w~150w之间,功耗优势明显
- 性能领先x86 六,七代30%~60%,成本低10%~30%,与AMD热那亚打平,成本低30%+;
三、优势业务场景介绍
1. 大数据场景:倚天技术收益高,资源规模大,ROI高
大数据是我们非常重要的一个领域,因为它是一个重负载的计算场景,对于倚天这种高性能的CPU来说是非常适合的场景。在集团业务方面,倚天ECS实例已经有效支持阿里618、99大促以及双十一压测等多个活动,涉及电商、数据库、存储蚂蚁支付多个业务场景。其中电商核心交易系统相比于X86竞对产品有20%-30%的成本优势。
2. 音视频编解码:高负载,高算力,场景适配简单
在阿里云外部客户方面,X短视频客户,基于自身业务测试视频编解码场景,性能收益高达30%以上,性价比收益高达80%+。Y游戏客户,基于自身游戏对于计算和网络的高要求,倚天c8y在客户实测中跑分是X86架构同级的120%,综合性价比近乎200%。目前基于倚天710的ECS实例已经成为了外部客户降本增效的利器。
3. redis/nginx场景:重定义业务安全水位
- 业务场景简单,适配工作量小
- Redis 5不支持IO-thread 多线程配置,建议提高部署密度,结合zstd压缩。
- Nginx场景,带宽优势+ gzip压缩优势。
- Nginx与redis场景,cpu负载控制在30%~40%,预留20%负载,否则RT劣化,使用倚天服务器,日常可保持50%水位,70%为安全水位,可节省40%资源;
4. NLP:集团语音ASR,机器翻译场景已落地,收益明显
- AI场景综合性价比由计算算力、内存子系统带宽、算法效率(优化)等方面决定 。
- 倚天710计算算力-内存带宽平衡,性价比出众,是语音NLP、识别分类、推荐系统等推理应用的理想负载。
好啦!小弹的分享到此为止。我们更欢迎您分享您对阿里云产品的设想、对功能的建议或者各种吐槽,请扫描提交问卷并获得社区积分或精美礼品一份。https://survey.aliyun.com/apps/zhiliao/P4y44bm_8
【扫码填写上方调研问卷】
欢迎每位来到弹性计算的开发者们来反馈问题哦~