存算一体新兴力量:解析我国企业在存储创新、技术路径上的多元化探索

本文涉及的产品
全局流量管理 GTM,标准版 1个月
云解析 DNS,旗舰版 1个月
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
简介: 存算一体新兴力量:解析我国企业在存储创新、技术路径上的多元化探索

   在我国科技创新的浪潮中,存算一体初创企业如雨后春笋般蓬勃涌现,投融资进入活跃期,为大算力布局和新技术应用注入了活力。然而,这场科技革命并非是一潭死水,而是一个庞大的生态系统,其中每一家企业都在积淀着独特的技术实力、优势资源和独特目标场景。正是在这个多元化的背景下,存算一体方案呈现出令人瞩目的差异化,主要体现在三大关键领域:技术路径、存储介质以及采用的模拟与数字技术。这三大差异成为了初创企业发展过程中的精彩篇章,塑造了各家企业独具特色的存算一体未来愿景。让我们深入探究这些差异,揭示背后的创新力量和科技探索。

1.近存or存内

      近存计算,本质上保持了存算分离架构的核心思想,区别在于计算模块通常紧邻存储阵列(memory cell array)安放,使得数据更靠近计算单元,有效缩小了数据移动的延迟和功耗。这种设计在概念上保留了冯·诺依曼架构的数据处理特点,其中存储阵列通常无需进行改动,仍然专注于提供数据的访存功能。

      典型的近存计算代表包括AMD Zen系列CPU、特斯拉Dojo、阿里达摩院使用混合键合3D堆叠技术实现的存算一体芯片等。此外,一些国外的创业公司如Graphcore和由芯片大师Jim Keller加入的Tenstorrent等,也推出了符合近存计算范畴的存算一体芯片。这一趋势表明近存计算正在成为存算一体设计的主流方向,充分发挥了其在数据处理效率和能效方面的优势。

特斯拉Dojo

     存内计算设计中,存储器件参与计算操作,这意味着存储阵列需要进行改动以支持计算。在狭义上,存内计算才真正实现了存算一体,即基于器件层面打破了存算分离架构的壁垒。在这一设计中,存储单元和计算单元完全融合,没有独立的计算单元,而是直接在存储器芯片内部的存储单元完成计算操作。

     相比之下,初创企业由于成立时间短、技术选择上不存在路径依赖和历史包袱,更容易另辟蹊径。一些国内初创公司,如知存科技、九天睿芯、千芯科技、后摩智能等,选择存内计算路线,希望实现更大的突破,同时降低对先进制程和先进封装的依赖。他们的选择是朝着更高性能、更通用的算力场景迈进的一次积极尝试。

知存科技WTM2101

2.储存介质

     存算一体的发展中,依托的存储介质呈现多样化,包括易失性存储器(如SRAM、DRAM)和非易失性存储器(如Flash)。尽管各种存储介质都有优势和短板,当前多数存算一体厂商更倾向于使用技术成熟的SRAM设计。这主要基于四个原因:首先,SRAM的设计技术成熟,随着工艺的发展,其性能有显著提升。其次,相较于新型非易失性存储器,SRAM的工艺和技术更加稳定。第三,SRAM兼容先进CMOS工艺,具备更快的操作速度和更强的耐久性,为大算力提供关键支持。第四,SRAM的实现途径可以达到与传统数字计算一致的运算精度,无需复杂的重训练过程,提高了AI模型的适用度。

     然而,SRAM也存在固有瓶颈,如较大的单元面积可能导致CMOS扩展难度增大。因此,一些企业采用多元化战略,投入研发新兴存储介质(如MRAM、RRAM),以在未来取得更大竞争优势。

不同储存介质介绍

3.数字vs模拟

     存算一体计算可分为数字存算和模拟存算两种电路技术路径,它们各自具有一系列优缺点。

     数字存算保留了传统数字电路的高抗噪性和鲁棒性,适用于大规模高计算精度芯片。而模拟存算在计算精度相对较低的条件下,能够获得更高的能量效率。其次,数字存算要求存储单元内容必须以数字信号形式呈现,而模拟存算可以实现不同模拟域的运算,具有更大的灵活性。与此同时,模拟存算在面积开销上有一定优势,减少了大量乘法器和加法器的占用,同时不同的低功耗模拟计算电路的探索有望进一步提升其能量效率。

数字存算与模拟存算在能效和计算灵活度上的比较

4.存算一体技术开创新局面:2023年关键突破与产业合作全景"

     在科技的浪潮中,存算一体技术于2023年迎来了显著的突破和实质性的发展。然而,随着技术的不断演进,存算一体技术仍需面对架构设计和软件编译器等方面的挑战,以进一步赋能未来智能计算应用。在这个充满创新和挑战的时代,存算一体技术以其前所未有的潜力,将引领着新一轮科技革命的浪潮。

存算一体赛道企业(20230226)

     ·在小算力领域,知存科技成功量产了全球首颗基于模拟Flash存算一体的芯片WTM2101。该芯片以极低功耗完成大规模深度学习运算,广泛应用于可穿戴设备中的智能语音和智能健康服务等场景。今年,WTM2101的出货量已经达到了kk级别。

     ·在落地和产业合作方面,知存科技与中国移动研究院联手完成了基于NOR Flash存算一体芯片的视频超分技术验证。这为存算一体芯片在算力机顶盒、AR/VR终端、边缘视频解码器等场景的高效视觉AI应用奠定了基础,为进一步落地广泛终端和边缘场景提供了支持。

     ·在大算力方面,后摩智能发布了首款存算一体智驾芯片后摩鸿途H30,其物理算力达到了256TOPS,成为国内首家成功落地存算一体大算力AI芯片的公司。H30已开始送测给Alpha客户,而第二代H50正在研发中,计划于2024年推出,为支持2025年的量产车型做好准备。

据公开资料整理(2023.10.24)

      然而,存算一体技术在未来的广泛应用中仍面临两大核心挑战。首先,在存算一体AI核和SoC的架构设计上,存内计算IP虽提供高效的并行计算模式,但在支持运算类型的多样性方面仍面临难度和复杂度的挑战。其次,在存算一体软件编译器的快速部署和实现上,需要应对模型切分、算子融合、调度等方面的挑战,以提高计算和访存效率,同时提升芯片的利用率和应用的开发效率。

总结

我国存算一体市场规模估算

     在算力逐渐成为“紧俏货”的今天,存算一体技术作为破解芯片性能瓶颈的主流方向备受关注。国产存算一体芯片正积极应对不同存储介质和技术路线的竞争,努力实现产业大发展。短期竞争集中在存储介质和技术路线,而长期发展则侧重于设计方法论、测试、量产、软件和场景选择等全方位竞争。创业公司需全面掌握技术能力,同时构建强大的生态体系。存算一体技术若能融合新技术,将有望实现更大算力、更高能效比,构筑国产AI芯片的发展阶梯。在这个充满机遇和挑战的时代,存算一体技术将继续引领我国在人工智能领域的创新与发展。


首个存内计算开发者社区-CSDN存内计算

全球首个存内计算社区创立,涵盖最丰富的存内计算内容,以存内计算技术为核心,绝无仅有存内技术开源内容,囊括云/边/端侧商业化应用解析以及新技术趋势洞察等, 邀请业内大咖定期举办线下存内workshop,实战演练体验前沿架构;从理论到实践,做为最佳窗口,存内计算让你触手可及。

相关文章
|
12天前
|
域名解析 存储 网络协议
深入解析网络通信关键要素:IP 协议、DNS 及相关技术
本文详细介绍了IP协议报头结构及其各字段的功能,包括版本、首部长度、服务类型、总长度、标识、片偏移、标志、生存时间(TTL)、协议、首部检验和等内容。此外,还探讨了IP地址的网段划分、特殊IP地址的应用场景,以及路由选择的大致流程。最后,文章简要介绍了DNS协议的作用及其发展历史,解释了域名解析系统的工作原理。
48 5
深入解析网络通信关键要素:IP 协议、DNS 及相关技术
|
17天前
|
负载均衡 5G 网络性能优化
深入解析LTE(长期演进技术)的基本架构及其关键组件
深入解析LTE(长期演进技术)的基本架构及其关键组件
83 2
|
14天前
|
Linux iOS开发 Docker
Docker:容器化技术的领航者 —— 从基础到实践的全面解析
在云计算与微服务架构日益盛行的今天,Docker作为容器化技术的佼佼者,正引领着一场软件开发与部署的革命。它不仅极大地提升了应用部署的灵活性与效率,还为持续集成/持续部署(CI/CD)提供了强有力的支撑。
192 69
|
18天前
|
机器学习/深度学习 算法
概率分布深度解析:PMF、PDF和CDF的技术指南
本文将深入探讨概率分布,详细阐述概率质量函数(PMF)、概率密度函数(PDF)和累积分布函数(CDF)这些核心概念,并通过实际示例进行说明。
55 15
概率分布深度解析:PMF、PDF和CDF的技术指南
|
6天前
|
移动开发 Android开发 数据安全/隐私保护
移动应用与系统的技术演进:从开发到操作系统的全景解析随着智能手机和平板电脑的普及,移动应用(App)已成为人们日常生活中不可或缺的一部分。无论是社交、娱乐、购物还是办公,移动应用都扮演着重要的角色。而支撑这些应用运行的,正是功能强大且复杂的移动操作系统。本文将深入探讨移动应用的开发过程及其背后的操作系统机制,揭示这一领域的技术演进。
本文旨在提供关于移动应用与系统技术的全面概述,涵盖移动应用的开发生命周期、主要移动操作系统的特点以及它们之间的竞争关系。我们将探讨如何高效地开发移动应用,并分析iOS和Android两大主流操作系统的技术优势与局限。同时,本文还将讨论跨平台解决方案的兴起及其对移动开发领域的影响。通过这篇技术性文章,读者将获得对移动应用开发及操作系统深层理解的钥匙。
|
25天前
|
机器学习/深度学习 人工智能 编解码
深入探索AI文生语音技术的奥秘:从文本输入到逼真语音输出的全链条语音合成过程解析
【9月更文挑战第2天】深入探索AI文生语音技术的奥秘:从文本输入到逼真语音输出的全链条语音合成过程解析
 深入探索AI文生语音技术的奥秘:从文本输入到逼真语音输出的全链条语音合成过程解析
|
13天前
|
缓存 API 网络架构
Nuxt Kit API :路径解析工具
【9月更文挑战第20天】在 Nuxt Kit API 中,路径解析工具如 `resolvePath()`、`joinPaths()` 和 `relativePath()` 帮助开发者高效处理应用路径,确保资源准确加载,并支持动态路由与组件导入。这些工具提升了应用的灵活性和可扩展性,同时需注意路径准确性、跨平台兼容性和性能优化,以提升用户体验。
26 12
|
5天前
|
存储 关系型数据库 MySQL
深入解析MySQL数据存储机制:从表结构到物理存储
深入解析MySQL数据存储机制:从表结构到物理存储
14 1
|
11天前
|
数据采集 存储 JavaScript
构建您的第一个Python网络爬虫:抓取、解析与存储数据
【9月更文挑战第24天】在数字时代,数据是新的金矿。本文将引导您使用Python编写一个简单的网络爬虫,从互联网上自动抓取信息。我们将介绍如何使用requests库获取网页内容,BeautifulSoup进行HTML解析,以及如何将数据存储到文件或数据库中。无论您是数据分析师、研究人员还是对编程感兴趣的新手,这篇文章都将为您提供一个实用的入门指南。拿起键盘,让我们开始挖掘互联网的宝藏吧!
|
8天前
|
存储 缓存 Java
在Spring Boot中使用缓存的技术解析
通过利用Spring Boot中的缓存支持,开发者可以轻松地实现高效和可扩展的缓存策略,进而提升应用的性能和用户体验。Spring Boot的声明式缓存抽象和对多种缓存技术的支持,使得集成和使用缓存变得前所未有的简单。无论是在开发新应用还是优化现有应用,合理地使用缓存都是提高性能的有效手段。
15 1

热门文章

最新文章

推荐镜像

更多
下一篇
无影云桌面