在我国科技创新的浪潮中,存算一体初创企业如雨后春笋般蓬勃涌现,投融资进入活跃期,为大算力布局和新技术应用注入了活力。然而,这场科技革命并非是一潭死水,而是一个庞大的生态系统,其中每一家企业都在积淀着独特的技术实力、优势资源和独特目标场景。正是在这个多元化的背景下,存算一体方案呈现出令人瞩目的差异化,主要体现在三大关键领域:技术路径、存储介质以及采用的模拟与数字技术。这三大差异成为了初创企业发展过程中的精彩篇章,塑造了各家企业独具特色的存算一体未来愿景。让我们深入探究这些差异,揭示背后的创新力量和科技探索。
1.近存or存内
近存计算,本质上保持了存算分离架构的核心思想,区别在于计算模块通常紧邻存储阵列(memory cell array)安放,使得数据更靠近计算单元,有效缩小了数据移动的延迟和功耗。这种设计在概念上保留了冯·诺依曼架构的数据处理特点,其中存储阵列通常无需进行改动,仍然专注于提供数据的访存功能。
典型的近存计算代表包括AMD Zen系列CPU、特斯拉Dojo、阿里达摩院使用混合键合3D堆叠技术实现的存算一体芯片等。此外,一些国外的创业公司如Graphcore和由芯片大师Jim Keller加入的Tenstorrent等,也推出了符合近存计算范畴的存算一体芯片。这一趋势表明近存计算正在成为存算一体设计的主流方向,充分发挥了其在数据处理效率和能效方面的优势。
特斯拉Dojo
存内计算设计中,存储器件参与计算操作,这意味着存储阵列需要进行改动以支持计算。在狭义上,存内计算才真正实现了存算一体,即基于器件层面打破了存算分离架构的壁垒。在这一设计中,存储单元和计算单元完全融合,没有独立的计算单元,而是直接在存储器芯片内部的存储单元完成计算操作。
相比之下,初创企业由于成立时间短、技术选择上不存在路径依赖和历史包袱,更容易另辟蹊径。一些国内初创公司,如知存科技、九天睿芯、千芯科技、后摩智能等,选择存内计算路线,希望实现更大的突破,同时降低对先进制程和先进封装的依赖。他们的选择是朝着更高性能、更通用的算力场景迈进的一次积极尝试。
知存科技WTM2101
2.储存介质
存算一体的发展中,依托的存储介质呈现多样化,包括易失性存储器(如SRAM、DRAM)和非易失性存储器(如Flash)。尽管各种存储介质都有优势和短板,当前多数存算一体厂商更倾向于使用技术成熟的SRAM设计。这主要基于四个原因:首先,SRAM的设计技术成熟,随着工艺的发展,其性能有显著提升。其次,相较于新型非易失性存储器,SRAM的工艺和技术更加稳定。第三,SRAM兼容先进CMOS工艺,具备更快的操作速度和更强的耐久性,为大算力提供关键支持。第四,SRAM的实现途径可以达到与传统数字计算一致的运算精度,无需复杂的重训练过程,提高了AI模型的适用度。
然而,SRAM也存在固有瓶颈,如较大的单元面积可能导致CMOS扩展难度增大。因此,一些企业采用多元化战略,投入研发新兴存储介质(如MRAM、RRAM),以在未来取得更大竞争优势。
不同储存介质介绍
3.数字vs模拟
存算一体计算可分为数字存算和模拟存算两种电路技术路径,它们各自具有一系列优缺点。
数字存算保留了传统数字电路的高抗噪性和鲁棒性,适用于大规模高计算精度芯片。而模拟存算在计算精度相对较低的条件下,能够获得更高的能量效率。其次,数字存算要求存储单元内容必须以数字信号形式呈现,而模拟存算可以实现不同模拟域的运算,具有更大的灵活性。与此同时,模拟存算在面积开销上有一定优势,减少了大量乘法器和加法器的占用,同时不同的低功耗模拟计算电路的探索有望进一步提升其能量效率。
数字存算与模拟存算在能效和计算灵活度上的比较
4.存算一体技术开创新局面:2023年关键突破与产业合作全景"
在科技的浪潮中,存算一体技术于2023年迎来了显著的突破和实质性的发展。然而,随着技术的不断演进,存算一体技术仍需面对架构设计和软件编译器等方面的挑战,以进一步赋能未来智能计算应用。在这个充满创新和挑战的时代,存算一体技术以其前所未有的潜力,将引领着新一轮科技革命的浪潮。
存算一体赛道企业(20230226)
·在小算力领域,知存科技成功量产了全球首颗基于模拟Flash存算一体的芯片WTM2101。该芯片以极低功耗完成大规模深度学习运算,广泛应用于可穿戴设备中的智能语音和智能健康服务等场景。今年,WTM2101的出货量已经达到了kk级别。
·在落地和产业合作方面,知存科技与中国移动研究院联手完成了基于NOR Flash存算一体芯片的视频超分技术验证。这为存算一体芯片在算力机顶盒、AR/VR终端、边缘视频解码器等场景的高效视觉AI应用奠定了基础,为进一步落地广泛终端和边缘场景提供了支持。
·在大算力方面,后摩智能发布了首款存算一体智驾芯片后摩鸿途H30,其物理算力达到了256TOPS,成为国内首家成功落地存算一体大算力AI芯片的公司。H30已开始送测给Alpha客户,而第二代H50正在研发中,计划于2024年推出,为支持2025年的量产车型做好准备。
据公开资料整理(2023.10.24)
然而,存算一体技术在未来的广泛应用中仍面临两大核心挑战。首先,在存算一体AI核和SoC的架构设计上,存内计算IP虽提供高效的并行计算模式,但在支持运算类型的多样性方面仍面临难度和复杂度的挑战。其次,在存算一体软件编译器的快速部署和实现上,需要应对模型切分、算子融合、调度等方面的挑战,以提高计算和访存效率,同时提升芯片的利用率和应用的开发效率。
总结
我国存算一体市场规模估算
在算力逐渐成为“紧俏货”的今天,存算一体技术作为破解芯片性能瓶颈的主流方向备受关注。国产存算一体芯片正积极应对不同存储介质和技术路线的竞争,努力实现产业大发展。短期竞争集中在存储介质和技术路线,而长期发展则侧重于设计方法论、测试、量产、软件和场景选择等全方位竞争。创业公司需全面掌握技术能力,同时构建强大的生态体系。存算一体技术若能融合新技术,将有望实现更大算力、更高能效比,构筑国产AI芯片的发展阶梯。在这个充满机遇和挑战的时代,存算一体技术将继续引领我国在人工智能领域的创新与发展。
首个存内计算开发者社区-CSDN存内计算
全球首个存内计算社区创立,涵盖最丰富的存内计算内容,以存内计算技术为核心,绝无仅有存内技术开源内容,囊括云/边/端侧商业化应用解析以及新技术趋势洞察等, 邀请业内大咖定期举办线下存内workshop,实战演练体验前沿架构;从理论到实践,做为最佳窗口,存内计算让你触手可及。