与时间赛跑:芯片研发设计场景算力解决方案

简介: MMCloud通过提供本地和公有云资源的统一管理,为使用Synopsys、Cadence、Mentor等主流EDA软件的芯片研发设计企业提供全面的算力管理服务。

分享一个故事。

有一家名为“未来芯(名字来源于AI虚拟,如有雷同,纯属巧合)”的芯片研发公司,作为该公司的研发总监,Peter的芯片设计团队,由一群充满激情的工程师组成,他们每天都在与摩尔定律赛跑,试图在硅片上雕刻出智能的未来。

让我们一起来看一下Peter团队的故事:

我们使用的是业内先进的EDA工具,它们在本地HPC集群上运行,负责从RTL(寄存器传输级)设计到GDSII(图形数据系统II)输出的全过程。

在芯片设计的初期,我们进行架构规划和功能定义,这个阶段对算力的需求相对较低,本地HPC集群足以应对

但随着设计的深入,尤其是进入RTL编码和仿真阶段,算力需求激增。我们的工程师们开始在本地集群上进行大规模的逻辑综合、时序分析和功耗优化,这时,集群的算力开始显得捉襟见肘。

在后端设计阶段,当我们开始进行物理设计,包括布局、布线和版图验证时,算力需求达到了顶峰。这时,我们的本地HPC集群几乎全天候运转,但仍然无法满足日益增长的计算需求。仿真周期的延长直接影响了产品的上市时间,这对于竞争激烈的芯片市场来说,无疑是致命的。

面对这一挑战,我们开始探索新的解决方案。我们考虑过扩大本地集群,但高昂的硬件成本和维护费用让我们望而却步。这时,我们想到了云计算,通过将部分计算任务迁移到云端,我们可以实现算力的弹性扩展,同时降低硬件投资。

然而,我们团队的工程师已经是满负荷状态,迁移上云需要团队花时间对云端算力进行更深入的分析、研究、测试,才能找到性能和成本的最佳平衡点。我们需要的不仅仅是云计算资源,更需要的是一套能够无缝整合本地和云端资源的混合云算力调度解决方案。

这个时候,MMCloud进入了我们的视野。MMCloud提供的不仅仅是云计算资源,更是一种全新的算力管理理念。

我们被MMCloud的“按需使用”模式所吸引。在业务闲时,云资源成本可以降至零,这大大降低了我们的运营成本。而且,MMCloud的自动化管理功能,可以在高并发大算力需求时自动将计算任务溢出到公有云上,任务结束后自动回收资源,这极大地提高了我们的工作效率。

我们决定采用MMCloud,将其作为我们混合云算力调度的解决方案。在MMCloud的帮助下,我们成功地将本地HPC集群与云端算力相结合,实现了算力资源的最优配置。我们的芯片设计流程变得更加高效,仿真周期缩短,设计质量得到提升,产品上市时间也得到了保障。

Peter团队的算力困境终于得到了解决,在芯片设计场景下,好的算力支持就是芯片企业和时间赛跑的最优助力。

芯片研发设计场景下面临的算力挑战

  • 成本问题:芯片研发设计过程中,无论是依赖本地集群还是云端算力,都不可避免地面临高昂的IT成本。此外,资源的大量浪费进一步加剧了这一问题。
  • 算力波动:在芯片设计的各个阶段,对算力的需求呈现出显著的波动性,这要求解决方案能够灵活应对不同阶段的算力需求。
  • 管理复杂性:随着混合云架构的普及,算力资源的管理变得更加复杂。企业需要精通本地和云端的IT架构,以确保资源的有效利用。

MMCloud芯片研发设计混合云算力解决方案

MMCloud通过提供本地和公有云资源的统一管理,为使用Synopsys、Cadence、Mentor等主流EDA软件的芯片研发设计企业提供全面的算力管理服务。我们的服务涵盖大规模弹性算力的供给、分发、调度、智能匹配以及资源回收等全生命周期管理。

图片 1.png

  • 按需弹性:用户可以根据实际需求申请公有云资源,并实现计算需求的实时弹性伸缩。在业务闲时,云资源成本可降至零。
  • 自动化管理:在高并发大算力需求时,MMCloud能够自动将计算任务溢出到公有云上;任务完成后,资源自动回收,无需人工干预。
  • 智能调度:MMCloud采用应用级智能调度策略,根据作业运行时的负载情况,自动适配不同规格的云主机实例,以实现成本与性能的最佳平衡。
  • 零学习成本:所有这些功能都是平台后台的自动化能力,对用户完全透明,无需额外学习成本。

通过MMCloud,芯片研发设计企业可以更加专注于创新,而将研发效率提升、算力管理的复杂性交给我们。

目录
相关文章
|
芯片 算法 异构计算
如何打破边缘端芯片算力有限的困局?阿里 AILabs 这么做!
在自研硬件上,和芯片厂商深度合作针对中低端芯片做出了特例优化,落地了手势识别、宠物检测和笔尖检测等业务。
3286 0
|
4月前
|
人工智能 异构计算 安全
《百炼成金-大金融模型新篇章》––03.问题1:“有限算力+持续进化的算力”,双重制约下的算力资源
百炼必定成金,新质生产力会催生新质劳动力,谨以此文抛砖引玉,希望与业内的各位朋友一同探讨如何积极拥抱并运用大模型技术,以应对和驾驭不断变化的市场环境,实现科技金融持续稳定的提质增效和创新发展,携手开启金融大模型未来新篇章。
|
5月前
|
弹性计算 算法 测试技术
芯片研发设计单月算力成本降了50%怎么做到的?
面对芯片设计中日益严峻的算力挑战,S半导体经历了从自建HPC集群到结合公有云的尝试,导致成本上升。后来,采用MMCloud解决方案,首月即实现50%的算力成本降低。MMCloud通过大规模集群管理、算力碎片整理和机型动态调整实现精细化调度,帮助S半导体提升了研发效率并降低成本,展示了在行业寒冬中的降本增效策略。
95 5
|
存储 监控 安全
时刻为创新提速|阿里云多款核心产品能力全面升级
5月17日上午,主题为“智在江苏,为创新提速”的2023阿里云峰会在常州市召开。
371 0
时刻为创新提速|阿里云多款核心产品能力全面升级
|
机器学习/深度学习 人工智能 定位技术
几个GPU工作数天≈10人团队工作大半年,英伟达用AI高效设计芯片
几个GPU工作数天≈10人团队工作大半年,英伟达用AI高效设计芯片
131 0
|
机器学习/深度学习 数据采集 移动开发
阿里云E2能耗:阿里云双碳整体产品介绍|学习笔记(二)
快速学习阿里云E2能耗:阿里云双碳整体产品介绍。
531 0
阿里云E2能耗:阿里云双碳整体产品介绍|学习笔记(二)
|
传感器 运维 监控
阿里云E2能耗:阿里云双碳整体产品介绍|学习笔记(一)
快速学习阿里云E2能耗:阿里云双碳整体产品介绍。
1109 0
阿里云E2能耗:阿里云双碳整体产品介绍|学习笔记(一)
|
机器学习/深度学习 人工智能 弹性计算
软硬件协同优化,平头哥玄铁斩获MLPerf四项第一
在4月7日发布的全球权威AI基准测试榜单MLPerf Tiny中,基于平头哥玄铁RISC-V C906处理器的软硬件联合优化方案,取得了全部4个指标的第一。
450 0
软硬件协同优化,平头哥玄铁斩获MLPerf四项第一
下一篇
无影云桌面