存算一体新兴力量:解析我国企业在存储创新、技术路径上的多元化探索

本文涉及的产品
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
全局流量管理 GTM,标准版 1个月
云解析 DNS,旗舰版 1个月
简介: 存算一体新兴力量:解析我国企业在存储创新、技术路径上的多元化探索

   在我国科技创新的浪潮中,存算一体初创企业如雨后春笋般蓬勃涌现,投融资进入活跃期,为大算力布局和新技术应用注入了活力。然而,这场科技革命并非是一潭死水,而是一个庞大的生态系统,其中每一家企业都在积淀着独特的技术实力、优势资源和独特目标场景。正是在这个多元化的背景下,存算一体方案呈现出令人瞩目的差异化,主要体现在三大关键领域:技术路径、存储介质以及采用的模拟与数字技术。这三大差异成为了初创企业发展过程中的精彩篇章,塑造了各家企业独具特色的存算一体未来愿景。让我们深入探究这些差异,揭示背后的创新力量和科技探索。

1.近存or存内

      近存计算,本质上保持了存算分离架构的核心思想,区别在于计算模块通常紧邻存储阵列(memory cell array)安放,使得数据更靠近计算单元,有效缩小了数据移动的延迟和功耗。这种设计在概念上保留了冯·诺依曼架构的数据处理特点,其中存储阵列通常无需进行改动,仍然专注于提供数据的访存功能。

      典型的近存计算代表包括AMD Zen系列CPU、特斯拉Dojo、阿里达摩院使用混合键合3D堆叠技术实现的存算一体芯片等。此外,一些国外的创业公司如Graphcore和由芯片大师Jim Keller加入的Tenstorrent等,也推出了符合近存计算范畴的存算一体芯片。这一趋势表明近存计算正在成为存算一体设计的主流方向,充分发挥了其在数据处理效率和能效方面的优势。

特斯拉Dojo

     存内计算设计中,存储器件参与计算操作,这意味着存储阵列需要进行改动以支持计算。在狭义上,存内计算才真正实现了存算一体,即基于器件层面打破了存算分离架构的壁垒。在这一设计中,存储单元和计算单元完全融合,没有独立的计算单元,而是直接在存储器芯片内部的存储单元完成计算操作。

     相比之下,初创企业由于成立时间短、技术选择上不存在路径依赖和历史包袱,更容易另辟蹊径。一些国内初创公司,如知存科技、九天睿芯、千芯科技、后摩智能等,选择存内计算路线,希望实现更大的突破,同时降低对先进制程和先进封装的依赖。他们的选择是朝着更高性能、更通用的算力场景迈进的一次积极尝试。

知存科技WTM2101

2.储存介质

     存算一体的发展中,依托的存储介质呈现多样化,包括易失性存储器(如SRAM、DRAM)和非易失性存储器(如Flash)。尽管各种存储介质都有优势和短板,当前多数存算一体厂商更倾向于使用技术成熟的SRAM设计。这主要基于四个原因:首先,SRAM的设计技术成熟,随着工艺的发展,其性能有显著提升。其次,相较于新型非易失性存储器,SRAM的工艺和技术更加稳定。第三,SRAM兼容先进CMOS工艺,具备更快的操作速度和更强的耐久性,为大算力提供关键支持。第四,SRAM的实现途径可以达到与传统数字计算一致的运算精度,无需复杂的重训练过程,提高了AI模型的适用度。

     然而,SRAM也存在固有瓶颈,如较大的单元面积可能导致CMOS扩展难度增大。因此,一些企业采用多元化战略,投入研发新兴存储介质(如MRAM、RRAM),以在未来取得更大竞争优势。

不同储存介质介绍

3.数字vs模拟

     存算一体计算可分为数字存算和模拟存算两种电路技术路径,它们各自具有一系列优缺点。

     数字存算保留了传统数字电路的高抗噪性和鲁棒性,适用于大规模高计算精度芯片。而模拟存算在计算精度相对较低的条件下,能够获得更高的能量效率。其次,数字存算要求存储单元内容必须以数字信号形式呈现,而模拟存算可以实现不同模拟域的运算,具有更大的灵活性。与此同时,模拟存算在面积开销上有一定优势,减少了大量乘法器和加法器的占用,同时不同的低功耗模拟计算电路的探索有望进一步提升其能量效率。

数字存算与模拟存算在能效和计算灵活度上的比较

4.存算一体技术开创新局面:2023年关键突破与产业合作全景"

     在科技的浪潮中,存算一体技术于2023年迎来了显著的突破和实质性的发展。然而,随着技术的不断演进,存算一体技术仍需面对架构设计和软件编译器等方面的挑战,以进一步赋能未来智能计算应用。在这个充满创新和挑战的时代,存算一体技术以其前所未有的潜力,将引领着新一轮科技革命的浪潮。

存算一体赛道企业(20230226)

     ·在小算力领域,知存科技成功量产了全球首颗基于模拟Flash存算一体的芯片WTM2101。该芯片以极低功耗完成大规模深度学习运算,广泛应用于可穿戴设备中的智能语音和智能健康服务等场景。今年,WTM2101的出货量已经达到了kk级别。

     ·在落地和产业合作方面,知存科技与中国移动研究院联手完成了基于NOR Flash存算一体芯片的视频超分技术验证。这为存算一体芯片在算力机顶盒、AR/VR终端、边缘视频解码器等场景的高效视觉AI应用奠定了基础,为进一步落地广泛终端和边缘场景提供了支持。

     ·在大算力方面,后摩智能发布了首款存算一体智驾芯片后摩鸿途H30,其物理算力达到了256TOPS,成为国内首家成功落地存算一体大算力AI芯片的公司。H30已开始送测给Alpha客户,而第二代H50正在研发中,计划于2024年推出,为支持2025年的量产车型做好准备。

据公开资料整理(2023.10.24)

      然而,存算一体技术在未来的广泛应用中仍面临两大核心挑战。首先,在存算一体AI核和SoC的架构设计上,存内计算IP虽提供高效的并行计算模式,但在支持运算类型的多样性方面仍面临难度和复杂度的挑战。其次,在存算一体软件编译器的快速部署和实现上,需要应对模型切分、算子融合、调度等方面的挑战,以提高计算和访存效率,同时提升芯片的利用率和应用的开发效率。

总结

我国存算一体市场规模估算

     在算力逐渐成为“紧俏货”的今天,存算一体技术作为破解芯片性能瓶颈的主流方向备受关注。国产存算一体芯片正积极应对不同存储介质和技术路线的竞争,努力实现产业大发展。短期竞争集中在存储介质和技术路线,而长期发展则侧重于设计方法论、测试、量产、软件和场景选择等全方位竞争。创业公司需全面掌握技术能力,同时构建强大的生态体系。存算一体技术若能融合新技术,将有望实现更大算力、更高能效比,构筑国产AI芯片的发展阶梯。在这个充满机遇和挑战的时代,存算一体技术将继续引领我国在人工智能领域的创新与发展。


首个存内计算开发者社区-CSDN存内计算

全球首个存内计算社区创立,涵盖最丰富的存内计算内容,以存内计算技术为核心,绝无仅有存内技术开源内容,囊括云/边/端侧商业化应用解析以及新技术趋势洞察等, 邀请业内大咖定期举办线下存内workshop,实战演练体验前沿架构;从理论到实践,做为最佳窗口,存内计算让你触手可及。

相关文章
|
1月前
|
Web App开发 数据采集 开发者
某查”平台请求头反爬技术解析与应对
某查”平台请求头反爬技术解析与应对
|
2天前
|
传感器 人工智能 物联网
穿戴科技新风尚:智能服装设计与技术全解析
穿戴科技新风尚:智能服装设计与技术全解析
109 85
|
2天前
|
人工智能 API 语音技术
HarmonyOS Next~鸿蒙AI功能开发:Core Speech Kit与Core Vision Kit的技术解析与实践
本文深入解析鸿蒙操作系统(HarmonyOS)中的Core Speech Kit与Core Vision Kit,探讨其在AI功能开发中的核心能力与实践方法。Core Speech Kit聚焦语音交互,提供语音识别、合成等功能,支持多场景应用;Core Vision Kit专注视觉处理,涵盖人脸检测、OCR等技术。文章还分析了两者的协同应用及生态发展趋势,展望未来AI技术与鸿蒙系统结合带来的智能交互新阶段。
51 31
|
23天前
|
机器学习/深度学习 缓存 自然语言处理
深入解析Tiktokenizer:大语言模型中核心分词技术的原理与架构
Tiktokenizer 是一款现代分词工具,旨在高效、智能地将文本转换为机器可处理的离散单元(token)。它不仅超越了传统的空格分割和正则表达式匹配方法,还结合了上下文感知能力,适应复杂语言结构。Tiktokenizer 的核心特性包括自适应 token 分割、高效编码能力和出色的可扩展性,使其适用于从聊天机器人到大规模文本分析等多种应用场景。通过模块化设计,Tiktokenizer 确保了代码的可重用性和维护性,并在分词精度、处理效率和灵活性方面表现出色。此外,它支持多语言处理、表情符号识别和领域特定文本处理,能够应对各种复杂的文本输入需求。
60 6
深入解析Tiktokenizer:大语言模型中核心分词技术的原理与架构
|
2天前
|
编解码 监控 网络协议
RTSP协议规范与SmartMediaKit播放器技术解析
RTSP协议是实时流媒体传输的重要规范,大牛直播SDK的rtsp播放器基于此构建,具备跨平台支持、超低延迟(100-300ms)、多实例播放、高效资源利用、音视频同步等优势。它广泛应用于安防监控、远程教学等领域,提供实时录像、快照等功能,优化网络传输与解码效率,并通过事件回调机制保障稳定性。作为高性能解决方案,它推动了实时流媒体技术的发展。
|
3天前
|
数据采集 机器学习/深度学习 存储
可穿戴设备如何重塑医疗健康:技术解析与应用实战
可穿戴设备如何重塑医疗健康:技术解析与应用实战
32 4
|
9天前
|
机器学习/深度学习 人工智能 自然语言处理
AI技术如何重塑客服系统?解析合力亿捷AI智能客服系统实践案例
本文探讨了人工智能技术在客服系统中的应用,涵盖技术架构、关键技术和优化策略。通过感知层、认知层、决策层和执行层的协同工作,结合自然语言处理、知识库构建和多模态交互技术,合力亿捷客服系统实现了智能化服务。文章还提出了用户体验优化、服务质量提升和系统性能改进的方法,并展望了未来发展方向,强调其在客户服务领域的核心价值与潜力。
49 6
|
13天前
|
监控 负载均衡 安全
静态IP代理与动态IP代理:提升速度与保障隐私的技术解析
本文探讨了静态IP代理和动态IP代理的特性和应用场景。静态IP代理通过高质量服务提供商、网络设置优化、定期更换IP与负载均衡及性能监控提升网络访问速度;动态IP代理则通过隐藏真实IP、增强安全性、绕过封锁和提供独立IP保障用户隐私。结合实际案例与代码示例,展示了两者在不同场景下的优势,帮助用户根据需求选择合适的代理服务以实现高效、安全的网络访问。
38 1
|
20天前
|
编解码 人工智能 并行计算
基于 Megatron 的多模态大模型训练加速技术解析
Pai-Megatron-Patch 是一款由阿里云人工智能平台PAI 研发的围绕英伟达 Megatron 的大模型训练配套工具,旨在帮助开发者快速上手大模型,打通大模型相关的高效分布式训练、有监督指令微调、下游任务评估等大模型开发链路。本文以 Qwen2-VL 为例,从易用性和训练性能优化两个方面介绍基于 Megatron 构建的 Pai-Megatron-Patch 多模态大模型训练的关键技术
|
23天前
|
移动开发 前端开发 JavaScript
从入门到精通:H5游戏源码开发技术全解析与未来趋势洞察
H5游戏凭借其跨平台、易传播和开发成本低的优势,近年来发展迅猛。接下来,让我们深入了解 H5 游戏源码开发的技术教程以及未来的发展趋势。

热门文章

最新文章

推荐镜像

更多