「北京开芯院」成立,中科院包云岗团队开源RISC-V处理器「香山」有了新归属

简介: 「北京开芯院」成立,中科院包云岗团队开源RISC-V处理器「香山」有了新归属

从「一生一芯」到高性能RISC-V处理器「香山」,再到北京开源芯片研究院,国内的开源RISC-V中长期先进技术研究和人才培养之路正在不断深入。


在 CPU 架构领域,Arm 和 X86 分别在移动端和桌面端占据了绝大部分市场份额。但是,这两个巨头对指令集的授权管控极为严格,这意味着大多数芯片企业只能购买其半成品或接近成品的技术,在其基础上进行相对边缘化的研发,没有机会掌握真正核心、底层的技术。少数实力雄厚的企业能取得授权,也要付出数千万甚至上亿美元的授权费代价。这使得越来越多的芯片研发企业转向了开源的 RISC-V。

加州大学伯克利分校教授、RISC-V 发明人 David Patterson 曾大胆预言:「在五到十年内,RISC-V 可能成为世界上最重要的指令集」。

对于中国半导体产业来说,RISC-V的意义显得更加重大。在去年12月的第十六届「中国芯」集成电路产业促进大会上,中国工程院院士倪光南指出,目前CPU市场主要被x86和Arm架构所垄断,而中国想要打破这个局面,实现自主可控,开源的RISC-V架构将是一大机遇和发展方向。


在此背景下,在国内开展RISC-V中长期先进技术研究和人才培养变得愈发迫切。这也是中国科学院计算技术研究所研究员、中国开放指令生态(RISC-V)联盟秘书长包云岗等人一直在做的事情。在过去的几年里,他们先后开展了「一生一芯」人才培养计划和开源高性能RISC-V处理器「香山」的开发工作,并取得了一定的成果。

最近,他们又将这些工作推向了一个新的阶段。

4月9日,包云岗宣布,由一批行业龙头企业和国内顶尖科研单位共同牵头发起成立的创新联合体——北京开源芯片研究院(开芯院),已于2021年12月正式成立。


研究院以构建开源芯片技术体系、加速开源芯片生态发展为宗旨,致力于研发RISC-V领域关键共性技术、建设关键支撑平台、优化生态治理、推动重点行业规模商用,加速RISC-V生态完善成熟,打造全球领先的RISC-V产业生态。研究院将围绕「香山」开源高性能RISC-V处理器核与「一生一芯」人才培养计划开展工作。

包云岗透露,经过四个月的筹建,研究院已经开始启动第一批围绕「香山」的新项目,后续也将陆续启动其他开源芯片项目。相关的招聘工作也已经陆续展开,目前开始招聘的职位包括CPU架构设计工程师、CPU高端设计高级工程师、CPU前端设计工程师、CPU多核一致性设计工程师等(参见:https://ch5.818ps.com/h/fee58b39328d39e2)。

开芯院缘起:「一生一芯」和「香山」


2020年7月,一个名为「一生一芯」的项目在网络上走红,也让包云岗团队的工作开始为大众所熟知。这一年,五位来自中国科学院大学的 2016 级本科生,带着自己设计的处理器芯片「果壳」正式毕业。


「果壳」是一款 64 位 RISC-V 处理器 SoC 芯片,这些学生参与设计了该芯片并成功流片,实现在芯片上成功运行 Linux 操作系统以及学生自己编写的国科大教学操作系统 UCAS-Core。

国科大计算机科学与技术学院院长、中科院计算所所长孙凝晖院士表示:「处理器芯片被公认为芯片产业皇冠上的明珠,设计复杂度高、难度大。我国处理器芯片设计人才严重紧缺,如何加快此类人才的培养规模与培养速度,是我国迫在眉睫的难题。」「果壳」的成功流片是国内高校、科研机构在RISC-V芯片设计人才培养方向上的一次成功探索。

后续的发展证明,这只是一个开始。

2021年6月,包云岗又在第一届 RISC-V 中国峰会上介绍了他们团队开发的一款开源高性能 RISC-V 处理器——香山。当时,「香山」团队给自己定下的小目标是「要建立一个像Linux那样的开源RISC-V核主线,既能被工业界广泛应用,又能支持学术界试验创新想法。最关键的是,一定要让它像Linux那样至少存活30年。」


当时,包云岗透露,「香山」共有两版微架构,第一版叫「雁栖湖」,第二版叫「南湖」。「雁栖湖」是一个11级流水、6发射、4个访存部件的乱序处理器核,频率可以达到 1.3GHz@28nm,性能预计可以达到 7 分 / GHz(SPEC CPU 2006)。相比之下,「南湖」的设计目标要更高:频率期望达到 2GHz@14nm,性能期望达到 10 分 / GHz(SPEC CPU 2006 )。

「雁栖湖」架构概览。

上个月,香山团队后端专家何志恒在一篇文章中透露,「雁栖湖」已于2021年7月在28nm工艺节点完成流片,在2022年1月回片,经过了一系列跨春节的调试攻关,目前的调试目标已达成。「雁栖湖」性能优化后,在CPU 1GHz+DDR4-1600配置下:SPECint 2006 7.02分,SPECfp 2006 6.94分,与预期性能评估高度一致。

雁栖湖的RTL-sim、FPGA、AISC实测及南湖RTL-sim的性能评估对比。图源:何志恒知乎账号@恒芯荣耀。

此外,他还透露,「南湖」将在14nm工艺节点完成流片。初步性能评估结果显示,南湖能够在2GHz主频下达到SPECint 2006 18分,SPECfp 2006 20分的成绩。

本着代码开源、流程开放、文档公开的原则,「香山」团队还陆续公开了「雁栖湖」和「南湖」的文档(参见:https://github.com/OpenXiangShan/XiangShan-doc)。

为了让大众客观地认识香山的真实情况,香山团队还专门开辟了一个辟谣文档,澄清了以下事实:

如果你想进一步了解「香山」,可以参考包云岗老师亲自撰写的香山处理器相关介绍(https://www.zhihu.com/question/466393646/answer/1955410750)。

参考链接:https://www.zhihu.com/people/bao-yun-gang
https://mp.weixin.qq.com/s/avWzbSOefzTSGiw9szKoXA
https://zhuanlan.zhihu.com/p/482312961

相关文章
|
缓存 编译器
BOLT 二进制反馈优化技术
大型应用的代码往往达到数十甚至上百MB,这导致在程序执行时缓存机制无法充分利用,导致大量时间花费在CPU和内存链路上。通过对热点函数的布局进行优化,我们可以更好地利用CPU cache,从而获得较为可观的性能提升。针对这一问题,在编译技术上有PGO和Bolt两种解决办法,两者都是一种通过收集程序在运行时如跳转,调用关系,函数热度等执行信息,这些收集到的程序运行情况数据(profile data),可以更好地指导一些程序优化的策略,如是否对函数进行内联,以及对基本块和函数布局的排布来提高特定场景下的程序性能。
2386 2
BOLT 二进制反馈优化技术
|
C语言 芯片
【嵌入式系统】存储器映射与寄存器映射原理
【嵌入式系统】存储器映射与寄存器映射原理
601 0
【嵌入式系统】存储器映射与寄存器映射原理
|
8月前
|
运维 Linux 数据安全/隐私保护
统信-龙蜥技术认证培训专场
在2024龙蜥大会中,本次分享的主题是龙蜥技术认证培训的相关内容。 1.课前准备 2.课程介绍 3.服务器操作系统 4.蜥基础课程讲解 5.现场考试
192 14
|
10月前
|
人工智能 安全 Linux
|
存储 机器学习/深度学习 自然语言处理
LLM微调方法(Efficient-Tuning)六大主流方法:思路讲解&优缺点对比[P-tuning、Lora、Prefix tuing等]
LLM微调方法(Efficient-Tuning)六大主流方法:思路讲解&优缺点对比[P-tuning、Lora、Prefix tuing等]
LLM微调方法(Efficient-Tuning)六大主流方法:思路讲解&优缺点对比[P-tuning、Lora、Prefix tuing等]
|
Linux API 开发工具
使用PySimpleGUI库打造一款轻量级计算器
使用PySimpleGUI创建简单计算器的教程。PySimpleGUI是Python的GUI库,适合新手快速构建GUI应用。文中通过实例介绍PySimpleGUI的基本操作,包括组件、事件处理和布局管理。首先讲解PySimpleGUI的特性与安装,接着展示计算器界面的代码,定义布局和窗口。然后实现计算器功能,包括数字和运算符的回调函数处理。最后,总结了如何使用PySimpleGUI创建GUI应用,并鼓励读者进一步探索其更多功能。
335 1
|
存储 缓存 算法
深入剖析 Qt QHash :原理、应用与技巧
深入剖析 Qt QHash :原理、应用与技巧
731 0
|
监控 安全 调度
【虚拟化】系统虚拟化的主要功能和分类
【虚拟化】系统虚拟化的主要功能和分类
814 0
|
存储 Java Maven
Java中文字转拼音工具类
有时,我们需要将中文汉字转为拼音存储,例如用于检索时,直接输入拼音或者首字母也能检索出我们想要的结果,这时我们便需要将汉字转拼音
444 0
|
存储 Dart 前端开发
为什么说 Compose 的声明式代码最简洁 ?Compose/React/Flutter/SwiftUI 语法对比
为什么说 Compose 的声明式代码最简洁 ?Compose/React/Flutter/SwiftUI 语法对比
426 1