与时间赛跑:芯片研发设计场景算力解决方案

本文涉及的产品
云服务器 ECS,每月免费额度200元 3个月
云服务器ECS,u1 2核4GB 1个月
简介: MMCloud通过提供本地和公有云资源的统一管理,为使用Synopsys、Cadence、Mentor等主流EDA软件的芯片研发设计企业提供全面的算力管理服务。

分享一个故事。

有一家名为“未来芯(名字来源于AI虚拟,如有雷同,纯属巧合)”的芯片研发公司,作为该公司的研发总监,Peter的芯片设计团队,由一群充满激情的工程师组成,他们每天都在与摩尔定律赛跑,试图在硅片上雕刻出智能的未来。

让我们一起来看一下Peter团队的故事:

我们使用的是业内先进的EDA工具,它们在本地HPC集群上运行,负责从RTL(寄存器传输级)设计到GDSII(图形数据系统II)输出的全过程。

在芯片设计的初期,我们进行架构规划和功能定义,这个阶段对算力的需求相对较低,本地HPC集群足以应对

但随着设计的深入,尤其是进入RTL编码和仿真阶段,算力需求激增。我们的工程师们开始在本地集群上进行大规模的逻辑综合、时序分析和功耗优化,这时,集群的算力开始显得捉襟见肘。

在后端设计阶段,当我们开始进行物理设计,包括布局、布线和版图验证时,算力需求达到了顶峰。这时,我们的本地HPC集群几乎全天候运转,但仍然无法满足日益增长的计算需求。仿真周期的延长直接影响了产品的上市时间,这对于竞争激烈的芯片市场来说,无疑是致命的。

面对这一挑战,我们开始探索新的解决方案。我们考虑过扩大本地集群,但高昂的硬件成本和维护费用让我们望而却步。这时,我们想到了云计算,通过将部分计算任务迁移到云端,我们可以实现算力的弹性扩展,同时降低硬件投资。

然而,我们团队的工程师已经是满负荷状态,迁移上云需要团队花时间对云端算力进行更深入的分析、研究、测试,才能找到性能和成本的最佳平衡点。我们需要的不仅仅是云计算资源,更需要的是一套能够无缝整合本地和云端资源的混合云算力调度解决方案。

这个时候,MMCloud进入了我们的视野。MMCloud提供的不仅仅是云计算资源,更是一种全新的算力管理理念。

我们被MMCloud的“按需使用”模式所吸引。在业务闲时,云资源成本可以降至零,这大大降低了我们的运营成本。而且,MMCloud的自动化管理功能,可以在高并发大算力需求时自动将计算任务溢出到公有云上,任务结束后自动回收资源,这极大地提高了我们的工作效率。

我们决定采用MMCloud,将其作为我们混合云算力调度的解决方案。在MMCloud的帮助下,我们成功地将本地HPC集群与云端算力相结合,实现了算力资源的最优配置。我们的芯片设计流程变得更加高效,仿真周期缩短,设计质量得到提升,产品上市时间也得到了保障。

Peter团队的算力困境终于得到了解决,在芯片设计场景下,好的算力支持就是芯片企业和时间赛跑的最优助力。

芯片研发设计场景下面临的算力挑战

  • 成本问题:芯片研发设计过程中,无论是依赖本地集群还是云端算力,都不可避免地面临高昂的IT成本。此外,资源的大量浪费进一步加剧了这一问题。
  • 算力波动:在芯片设计的各个阶段,对算力的需求呈现出显著的波动性,这要求解决方案能够灵活应对不同阶段的算力需求。
  • 管理复杂性:随着混合云架构的普及,算力资源的管理变得更加复杂。企业需要精通本地和云端的IT架构,以确保资源的有效利用。

MMCloud芯片研发设计混合云算力解决方案

MMCloud通过提供本地和公有云资源的统一管理,为使用Synopsys、Cadence、Mentor等主流EDA软件的芯片研发设计企业提供全面的算力管理服务。我们的服务涵盖大规模弹性算力的供给、分发、调度、智能匹配以及资源回收等全生命周期管理。

图片 1.png

  • 按需弹性:用户可以根据实际需求申请公有云资源,并实现计算需求的实时弹性伸缩。在业务闲时,云资源成本可降至零。
  • 自动化管理:在高并发大算力需求时,MMCloud能够自动将计算任务溢出到公有云上;任务完成后,资源自动回收,无需人工干预。
  • 智能调度:MMCloud采用应用级智能调度策略,根据作业运行时的负载情况,自动适配不同规格的云主机实例,以实现成本与性能的最佳平衡。
  • 零学习成本:所有这些功能都是平台后台的自动化能力,对用户完全透明,无需额外学习成本。

通过MMCloud,芯片研发设计企业可以更加专注于创新,而将研发效率提升、算力管理的复杂性交给我们。

目录
相关文章
|
芯片 算法 异构计算
如何打破边缘端芯片算力有限的困局?阿里 AILabs 这么做!
在自研硬件上,和芯片厂商深度合作针对中低端芯片做出了特例优化,落地了手势识别、宠物检测和笔尖检测等业务。
3020 0
|
12月前
|
存储 监控 安全
时刻为创新提速|阿里云多款核心产品能力全面升级
5月17日上午,主题为“智在江苏,为创新提速”的2023阿里云峰会在常州市召开。
314 0
时刻为创新提速|阿里云多款核心产品能力全面升级
|
12月前
|
机器学习/深度学习 人工智能 定位技术
几个GPU工作数天≈10人团队工作大半年,英伟达用AI高效设计芯片
几个GPU工作数天≈10人团队工作大半年,英伟达用AI高效设计芯片
|
存储 编解码 人工智能
|
机器学习/深度学习 人工智能 弹性计算
软硬件协同优化,平头哥玄铁斩获MLPerf四项第一
在4月7日发布的全球权威AI基准测试榜单MLPerf Tiny中,基于平头哥玄铁RISC-V C906处理器的软硬件联合优化方案,取得了全部4个指标的第一。
395 0
软硬件协同优化,平头哥玄铁斩获MLPerf四项第一
|
存储 机器学习/深度学习 人工智能
CPU将进入新时代:押注计算芯片的极限协同设计
我们现在进入了一个时代,那就是IT行业的计算引擎将需要比以往任何时候都更需要更低的价格,更好的性能以及更好的散热特性。这将需要一种在更大范围的工作负载和设备上进行协同设计系统(co-designing systems )的进化方法。
|
芯片 开发者 人工智能
开放下载 | 《云端设计 与时间赛跑》芯片上云白皮书
随着人工智能、5G、超级计算、自动驾驶等新一代信息技术成为半导体发展的重要驱动力,中国集成电路产业正迎来发展的黄金时期。然而,芯片的复杂度提高,工艺升级,成本压力增大等原因都给芯片开发者带来全新的挑战。这份白皮书旨在帮助IC设计企业了解国内外IC上云的现状、发展趋势以及相关解决方案与最佳实践,推动中国IC设计产业拥抱新技术并促成新的协作模式。
17715 0
开放下载 | 《云端设计 与时间赛跑》芯片上云白皮书
|
安全 vr&ar
智能电厂:迄今为止第一个完全技术国产化的方案
中机的生态智慧能源技术面向中国市场全面启动,现已与参与培训的百余家电厂展开合作,相信中国的电力行业一定会在中机智慧能源技术的带领下走向环保,走进未来,迈向智能电力新时代!
1886 0
|
数据采集 人工智能 算法
头一回见!提升10倍效率,阿里给业务校验平台插上了AI的翅膀
实时业务校验平台作为阿里集团老牌的业务审计系统,覆盖了集团绝大部分的业务对账场景,在线上问题及时发现以及减少集团资损上发挥着巨大作用,保障了各个系统的业务稳定性。本文主要介绍实时业务校验平台(以下简称BCP: Business Check Platform)在智能化方面的创新和实践。
16933 2