清华微电子所团队提出AI芯片的存储优化新方法

简介:

af876514570a6153d931b5334dea194daa8a75ca

清华微电子所博士生涂锋斌报告现场

ISCA是计算机体系结构领域的顶级会议。本次大会共收到378篇投稿,收录64篇论文,录用率仅为16.9%。本文是今年中国唯一被收录的署名第一完成单位的论文。尹首一副教授为本文通讯作者,论文合作者还包括清华大学微电子所魏少军教授和刘雷波教授等。

随着人工智能应用中神经网络规模的不断增大,计算芯片的大量片外访存会造成巨大的系统能耗,因此存储优化是人工智能计算芯片设计中必须解决的一个核心问题。可重构研究团队提出一种面向神经网络的新型加速框架:数据生存时间感知的神经网络加速框架(RANA)。RANA框架采用了三个层次的优化技术:数据生存时间感知的训练方法,混合计算模式和支持刷新优化的eDRAM存储器,分别从训练、调度和架构三个层面优化整体系统能耗。实验结果显示,RANA框架可以消除99.7%的eDRAM刷新能耗开销,而性能和精度损失可以忽略不计。相比于传统的采用SRAM的人工智能计算芯片,使用RANA框架的基于eDRAM的计算芯片在面积开销相同的情况下可以减少41.7%的片外访存和66.2%的系统能耗,使人工智能系统的能量效率获得大幅提高。

8d1b0b8d8bef0550ce6ec27111006c6db20def77

数据生存时间感知的神经网络加速框架(RANA)

可重构计算团队近年来基于可重构架构设计了Thinker系列人工智能计算芯片(Thinker I,Thinker II,Thinker S),受到学术界和工业界的广泛关注。可重构计算团队此次研究成果,从存储优化和软硬件协同设计的角度大幅提升了芯片能量效率, 为人工智能计算芯片的架构演进开拓了新方向。



原文发布时间为:2018-06-7

本文来自云栖社区合作伙伴“半导体行业观察”,了解相关信息可以关注“半导体行业观察”。

相关文章
|
4月前
|
人工智能 文字识别 监控
|
4月前
|
人工智能 安全 架构师
不只是聊天:从提示词工程看AI助手的优化策略
不只是聊天:从提示词工程看AI助手的优化策略
371 119
|
4月前
|
人工智能 自然语言处理 物联网
GEO优化方法有哪些?2025企业抢占AI流量必看指南
AI的不断重塑传统的信息入口之际,用户的搜索行为也从单一的百度、抖音的简单的查找答案的模式,逐渐转向了对DeepSeek、豆包、文心一言等一系列的AI对话平台的更加深入的探索和体验。DeepSeek的不断迭代优化同时,目前其月活跃的用户已破1.6亿,全网的AI用户规模也已超过6亿,这无疑为其下一阶段的迅猛发展提供了坚实的基础和广泛的市场空间。
|
4月前
|
人工智能 缓存 并行计算
用数学重构 AI的设想:流形注意力 + 自然梯度优化的最小可行落地
本文提出两个数学驱动的AI模块:流形感知注意力(D-Attention)与自然梯度优化器(NGD-Opt)。前者基于热核偏置,在局部邻域引入流形结构,降低计算开销;后者在黎曼流形上进行二阶优化,仅对线性层低频更新前置条件。二者均提供可复现代码与验证路径,兼顾性能与工程可行性,助力几何感知的模型设计与训练。
363 1
|
人工智能 搜索推荐 JavaScript
【Geo专家于磊】深度解析:Geo优化中的Schema标签,如何让你的内容在AI时代脱颖而出?
微笑老师详解Geo优化中Schema标签的写法,揭示如何通过结构化数据提升AI时代下的内容可见性。从选择类型、填写关键属性到JSON-LD格式应用与测试验证,全面掌握Geo优化核心技巧,助力本地商家在搜索结果中脱颖而出。(238字)
443 0
|
4月前
|
人工智能 自然语言处理 算法
AISEO咋做?2025年用AI优化SEO和GEO 的步骤
AISEO是AI与SEO结合的优化技术,通过人工智能生成关键词、标题、内容等,提升网站排名。它支持多语言、自动化创作,并利用高权重平台发布内容,让AI搜索更易抓取引用,实现品牌曝光与流量增长。
|
4月前
|
数据采集 人工智能 程序员
PHP 程序员如何为 AI 浏览器(如 ChatGPT Atlas)优化网站
OpenAI推出ChatGPT Atlas,标志AI浏览器新方向。虽未颠覆现有格局,但为开发者带来新机遇。PHP建站者需关注AI爬虫抓取特性,优化技术结构(如SSR、Schema标记)、提升内容可读性与语义清晰度,并考虑未来agent调用能力。通过robots.txt授权、结构化数据、内容集群与性能优化,提升网站在AI搜索中的可见性与引用机会,提前布局AI驱动的流量新格局。
220 8