与时间赛跑:芯片研发设计场景算力解决方案

简介: MMCloud通过提供本地和公有云资源的统一管理,为使用Synopsys、Cadence、Mentor等主流EDA软件的芯片研发设计企业提供全面的算力管理服务。

分享一个故事。

有一家名为“未来芯(名字来源于AI虚拟,如有雷同,纯属巧合)”的芯片研发公司,作为该公司的研发总监,Peter的芯片设计团队,由一群充满激情的工程师组成,他们每天都在与摩尔定律赛跑,试图在硅片上雕刻出智能的未来。

让我们一起来看一下Peter团队的故事:

我们使用的是业内先进的EDA工具,它们在本地HPC集群上运行,负责从RTL(寄存器传输级)设计到GDSII(图形数据系统II)输出的全过程。

在芯片设计的初期,我们进行架构规划和功能定义,这个阶段对算力的需求相对较低,本地HPC集群足以应对

但随着设计的深入,尤其是进入RTL编码和仿真阶段,算力需求激增。我们的工程师们开始在本地集群上进行大规模的逻辑综合、时序分析和功耗优化,这时,集群的算力开始显得捉襟见肘。

在后端设计阶段,当我们开始进行物理设计,包括布局、布线和版图验证时,算力需求达到了顶峰。这时,我们的本地HPC集群几乎全天候运转,但仍然无法满足日益增长的计算需求。仿真周期的延长直接影响了产品的上市时间,这对于竞争激烈的芯片市场来说,无疑是致命的。

面对这一挑战,我们开始探索新的解决方案。我们考虑过扩大本地集群,但高昂的硬件成本和维护费用让我们望而却步。这时,我们想到了云计算,通过将部分计算任务迁移到云端,我们可以实现算力的弹性扩展,同时降低硬件投资。

然而,我们团队的工程师已经是满负荷状态,迁移上云需要团队花时间对云端算力进行更深入的分析、研究、测试,才能找到性能和成本的最佳平衡点。我们需要的不仅仅是云计算资源,更需要的是一套能够无缝整合本地和云端资源的混合云算力调度解决方案。

这个时候,MMCloud进入了我们的视野。MMCloud提供的不仅仅是云计算资源,更是一种全新的算力管理理念。

我们被MMCloud的“按需使用”模式所吸引。在业务闲时,云资源成本可以降至零,这大大降低了我们的运营成本。而且,MMCloud的自动化管理功能,可以在高并发大算力需求时自动将计算任务溢出到公有云上,任务结束后自动回收资源,这极大地提高了我们的工作效率。

我们决定采用MMCloud,将其作为我们混合云算力调度的解决方案。在MMCloud的帮助下,我们成功地将本地HPC集群与云端算力相结合,实现了算力资源的最优配置。我们的芯片设计流程变得更加高效,仿真周期缩短,设计质量得到提升,产品上市时间也得到了保障。

Peter团队的算力困境终于得到了解决,在芯片设计场景下,好的算力支持就是芯片企业和时间赛跑的最优助力。

芯片研发设计场景下面临的算力挑战

  • 成本问题:芯片研发设计过程中,无论是依赖本地集群还是云端算力,都不可避免地面临高昂的IT成本。此外,资源的大量浪费进一步加剧了这一问题。
  • 算力波动:在芯片设计的各个阶段,对算力的需求呈现出显著的波动性,这要求解决方案能够灵活应对不同阶段的算力需求。
  • 管理复杂性:随着混合云架构的普及,算力资源的管理变得更加复杂。企业需要精通本地和云端的IT架构,以确保资源的有效利用。

MMCloud芯片研发设计混合云算力解决方案

MMCloud通过提供本地和公有云资源的统一管理,为使用Synopsys、Cadence、Mentor等主流EDA软件的芯片研发设计企业提供全面的算力管理服务。我们的服务涵盖大规模弹性算力的供给、分发、调度、智能匹配以及资源回收等全生命周期管理。

图片 1.png

  • 按需弹性:用户可以根据实际需求申请公有云资源,并实现计算需求的实时弹性伸缩。在业务闲时,云资源成本可降至零。
  • 自动化管理:在高并发大算力需求时,MMCloud能够自动将计算任务溢出到公有云上;任务完成后,资源自动回收,无需人工干预。
  • 智能调度:MMCloud采用应用级智能调度策略,根据作业运行时的负载情况,自动适配不同规格的云主机实例,以实现成本与性能的最佳平衡。
  • 零学习成本:所有这些功能都是平台后台的自动化能力,对用户完全透明,无需额外学习成本。

通过MMCloud,芯片研发设计企业可以更加专注于创新,而将研发效率提升、算力管理的复杂性交给我们。

目录
相关文章
|
芯片 算法 异构计算
如何打破边缘端芯片算力有限的困局?阿里 AILabs 这么做!
在自研硬件上,和芯片厂商深度合作针对中低端芯片做出了特例优化,落地了手势识别、宠物检测和笔尖检测等业务。
3307 0
|
6月前
|
弹性计算 算法 测试技术
芯片研发设计单月算力成本降了50%怎么做到的?
面对芯片设计中日益严峻的算力挑战,S半导体经历了从自建HPC集群到结合公有云的尝试,导致成本上升。后来,采用MMCloud解决方案,首月即实现50%的算力成本降低。MMCloud通过大规模集群管理、算力碎片整理和机型动态调整实现精细化调度,帮助S半导体提升了研发效率并降低成本,展示了在行业寒冬中的降本增效策略。
107 5
|
存储 监控 安全
时刻为创新提速|阿里云多款核心产品能力全面升级
5月17日上午,主题为“智在江苏,为创新提速”的2023阿里云峰会在常州市召开。
383 0
时刻为创新提速|阿里云多款核心产品能力全面升级
|
传感器 数据采集 安全
4大技术亮点支撑应用优势 全新一代旗舰型行业无人机千巡翼X4发布
随着无人机与数字成像技术的发展,无人机航测成为了重要的地理信息采集手段,也越来越受重视。据相关研报数据统计,预计2025年我国实景三维在自然资源领域的,以数据采集、处理为主的直接市场规模预计将达40亿元,推测2025年关联市场规模将达400亿元左右。在这样的产业趋势之下,无人机航测平台也在不断发展,2023年2月28日,千寻位置发布了全新一代旗舰型行业无人机平台——千巡翼X4。通过对前沿技术的深度融合,千巡翼X4具备强大的功能,并在体现出更多的应用优势。
4大技术亮点支撑应用优势 全新一代旗舰型行业无人机千巡翼X4发布
|
人工智能 并行计算 安全
AIGC持续火爆大模型争相推出,庞大市场造就算力供应模式演变
黄仁勋说AI发展迎来iPhone时刻,从NVIDIA GTC23最新动向来看,庞大的市场需求正在造就算力供应模式演变。
111 0
|
机器学习/深度学习 人工智能 定位技术
几个GPU工作数天≈10人团队工作大半年,英伟达用AI高效设计芯片
几个GPU工作数天≈10人团队工作大半年,英伟达用AI高效设计芯片
133 0
|
并行计算 安全 调度
提速360倍!助力南方电网实现“仿真自由”
近日,为满足新型电力系统建设和运行面临的海量仿真需求,南方电网电力调度控制中心率先将电力仿真软件上云。在基于与阿里云共建的南网调度云平台上,仿真计算提速360倍,有效解决了传统硬件上电力仿真软件“跑不动”的问题,进一步保障电网安全稳定运行。
558 0
提速360倍!助力南方电网实现“仿真自由”
|
传感器 安全 自动驾驶
摆脱「黑盒子」后,理想汽车的自研进展达到预期了吗?
摆脱「黑盒子」后,理想汽车的自研进展达到预期了吗?
217 0
摆脱「黑盒子」后,理想汽车的自研进展达到预期了吗?
|
机器学习/深度学习 存储 人工智能
阿里发布首颗量产AI「超大芯片」:高出兄弟公司新品四倍,上云就能用
「这是互联网公司的首颗『大芯片』」,达摩院院长张建锋为其写下注脚。所谓「大芯片」,是指单靠一颗含光 800 NPU,能够在一秒内处理 7.8 万张图片。
1413 0
阿里发布首颗量产AI「超大芯片」:高出兄弟公司新品四倍,上云就能用
|
数据采集 人工智能 算法
头一回见!提升10倍效率,阿里给业务校验平台插上了AI的翅膀
实时业务校验平台作为阿里集团老牌的业务审计系统,覆盖了集团绝大部分的业务对账场景,在线上问题及时发现以及减少集团资损上发挥着巨大作用,保障了各个系统的业务稳定性。本文主要介绍实时业务校验平台(以下简称BCP: Business Check Platform)在智能化方面的创新和实践。
17362 6

热门文章

最新文章