暂无个人介绍
前言 这几天,GTC2020上,Nvidia发布了最新的Ampere架构。Ampere架构的改进重心,大部分放在AI上的改动,包括第三代的Tensor Core,以及相关的调度性能,以及互联等。它展示了在加强算力,特别是TC (TC == Tensor Core,下同)算力的情况下,整个系统的改进。 整体上,可以看到NV的GPU向向AI方向快速发展,看起来跟随市场的必然选择。转去吃AI芯片的蛋
前言 NeurlPS 2019 大会刚结束,看了看相关的内容,绝大部分是各种前沿理论的文章。这些和我工作的内容还有比较长的距离:不论是知识领域空间上的距离,还是相关理论转为工业界实践的时间上的距离。但有两篇还是吸引了我的注意。一篇是用于普及的教程:“Efficient Processing of Deep Neural Networks: from Algorithms to Har
前言 本章节介绍基于HanGuangAI软件运行时(RunTime)的开发。这些运行时编程接口既可以整合到框架中,也可以用来实现推理引擎,或者直接被AI应用程序使用。现阶段,他们是运行时控制使用含光NPU的唯一编程接口。 当前AI计算芯片的架构各异,表现在软件接口上,就是没有一套标准的编程接口。Nvidia的领头羊地位,由其通用计算拓展到AI计算领域,但由于芯片架构之间差别太大,它的编程接口并
古往今来,中外各国,兵器种类繁多。中国有“十八般兵器“,还有不少奇门兵器。这是因为兵器有长短,利钝,刚柔,等各种特点,各有利弊,没有一把兵器能集齐所有优势。所谓“剑走偏锋锋芒露”,是指剑身细长轻盈,所以剑法要以快为主,以攻为主,用剑者讲求身法灵动,招式精奇,以求出奇
前言 笔者从GPU行业转行,加入AI芯片软件团队正好一年时间。参与了Alibaba NPU(含光800)的架构,软件建模,芯片驱动,框架等多方面的工作。在一年到来之际,特别想针对自己过去一年的工作和学习写一些“思想总结”。正好我们在准备云栖大会的材料,学习了竞争对手的相关文档,萌生了利用一些夜深人静的晚上,写写一些体会。因为相关工作学习时间短,写的这些东西大都很浅显,对内