• 地平线谭洪贺:AI芯片怎么降功耗?从ISSCC2017说起

    14.5中,根据算法或应用需要,可以动态配置乘法器,为一个16bit乘法,或者是2个8bit乘法,或是4个4bit乘法。这就是DVAFS和DVAS的区别了。有心的人可能早就发现了,14.2中基于LUT的可配置乘法器也是可以当做4个4bit乘...
    文章 2017-05-17 1448浏览量
  • 《从问题到程序:用Python学编程和计算》——第2章 ...

    浮点数字面量、溢出和截断CPython(也就是说,Python软件基金会发布的官方的语言解释)直接使用计算机硬件支持的标准浮点数。常见硬件都采用IEEE754浮点数标准,标准浮点数具有16~17位十进制精度,表示范围大致为...
    文章 2017-05-02 1207浏览量
  • 《从问题到程序:用Python学编程和计算》——第2章 ...

    CPython(也就是说,Python软件基金会发布的官方的语言解释)直接使用计算机硬件支持的标准浮点数。常见硬件都采用IEEE754浮点数标准,标准浮点数具有16~17位十进制精度,表示范围大致为,绝对值太小的实数将归结...
    文章 2017-07-03 1829浏览量
  • JS魔法堂:彻底理解0.1+0.2=0.30000000000000004的...

    到这里我们都理解只要采取IEEE 754 FP的浮点数编码的语言均会出现上述问题,只是它们的标准类库已经为我们提供了解决方案而已。而JS呢?显然没有。坏处自然是掉坑了,而好处恰恰也是掉坑了:) 针对不同的应用需求,...
    文章 2017-01-06 1061浏览量
  • 从奔腾I的VCD播放到AI区块链播放——程序优化的魔法

    面对这种情况就可以用最简单的算法,一个非零点做一次乘法,8个点做8个乘法就可以解决。这比IDCT快速算法又快了很多,两个非零点的情况也是类似的。如果说两个以上系数不为0用快速算法就可以解决,因为用一个点算...
    文章 2018-04-23 1044浏览量
  • OpenBLAS项目与矩阵乘法优化|AI 研习社

    下一步需要解决的是这个cache的问题问题是没有做大的分块,超过cache大小之后性能就会下滑,要解决这个问题的话,需要在更上一层做Blocking。转换成代码的话,在这一层做一个K的切分,下面一层做一个m的切分,至于...
    文章 2017-08-02 1573浏览量
  • 开源背后|面对端侧推理引擎的挑战,阿里工程师如何...

    MNN 是一个轻量级的深度学习端侧推理引擎,核心解决深度神经网络模型在端侧推理运行问题,涵盖深度神经网络模型的优化、转换和推理。目前,MNN已经在手淘、手猫、优酷、聚划算、UC、飞猪、千牛等 20 多个 App 中使用...
    文章 2019-07-02 3942浏览量
  • 重学计算机组成原理(二)-制定学习路线,攀登“性能...

    存储其实很多时候又扮演了输入输出设备的角色,所以你需要进一步了解,CPU和这些存储之间是如何进行通信的,以及我们最重视的性能问题怎么一回事;理解什么是IO_WAIT,如何通过DMA来提升程序性能。对于存储...
    文章 2019-08-10 1931浏览量
  • 十年磨一剑,WebAssembly 是如何诞生的?

    大名鼎鼎的ES6中,厉害的特性很多,其中有2个特性相信大家没怎么听过:Math.imul(x,y)和Math.fround(x),前者用于32位整数的乘法,后者用于将64位双精度浮点数转换为32位单精度浮点数。JavaScript的Number本身就是64...
    文章 2021-08-17 47浏览量
  • 低配硬件就不能运行深度神经网络了?...

    那么问题来了,如果你想你想用树莓派来做一个目标跟踪,为你看家守院,这可以实现吗?换句话说,如果你需要在不带加速的ARM CPU上运行卷积神经网络了怎么办?雷锋网(公众号:雷锋网)想,大概就会像下图这位小哥...
    文章 2017-08-01 2368浏览量
  • 英特尔买下了 Nervana,然而 DPU 的魔力何在?

    这些新公司将一起解决英特尔仍在形成的难题:捕捉未来深度学习领域——这块预估达到数万亿美元的蛋糕。而这个艰巨的任务,都将通过 Intel 自己的 Knights Mill 在机器学习代码和工具方面的成果,加上软件优化的工作...
    文章 2017-07-03 980浏览量
  • ARM_Instruction_Set_Encoding_hacking(ARM指令集编码...

    协处理指令或软中断,包括浮点指令和先进SIMD数据传输 1111 如果cond字段为0b1111,只能无条件地执行指令 表格中的op1、op字段中的x、-表示可以是0,也可以是1 3、本文后续部分只对Instruction classes(指令分类)...
    文章 2015-03-30 813浏览量
  • 【新智元专访】Nervana CEO|英特尔英伟达AI芯片霸主...

    (注:此前接受 The Next Platform 记者采访时,Rao 表示 flexpoint 利用了神经网络的特点,不需要进行完整的浮点运算,这是一个基于张量的架构,不适合进行普通的乘法,但却能配合普通浮点运算芯片,让电路搭建得...
    文章 2017-08-01 891浏览量
  • Web 高级着色语言(WHLSL)-为WebGPU设计的Web图形...

    当编译看到上面的代码时,它知道乘法运算符要求参数类型相同,第一个参数显然是浮点数。所以,当编译看到 float(a)5 时,它说“好吧,我知道第一个参数是一个浮点数,这意味着我必须使用(浮点数,浮点数)重载...
    文章 2019-08-06 1471浏览量
  • 揭开神经网络加速的神秘面纱之DianNao

    最后,硬件只是整个神经网络加速系统中最简单的一个环境,算法和软件才是最复杂的,所以也欢迎在这个领域有想法的兄弟部门一起来合作,我们提高底层FPGA和FPGA上的实现能力,算法大神们提供算法解决方案,软件大神...
    文章 2017-07-03 6329浏览量
  • 浅谈端上智能之计算优化

    在这种架构下,每次执行乘法运算时,结果会被直接传递给后面的乘法器,并进行求和。在整个过程中,无需访问内存。去除这些访存开销,还会有额外好处,即功耗的降低。我们知道与计算相比,访存才是功耗大户。通过这种...
    文章 2019-11-05 1871浏览量
  • 自学习芯片、实时3D表情捕捉渲染,百倍DNN模型无损...

    在我们的量化里我们的输出是4bit,2的幂次方,所有的运算都不存在浮点乘法运算。在这样的情况下,跟原始浮点的网络精度比起来,我们的网络精度依然比它高,有分类的准确率还是要高一点。跟ICLR的方法比,我们应该...
    文章 2017-12-01 1890浏览量
  • 一个简单的Julia教程

    具体关于OO技术的好处可以参看这篇博客:浅谈OO编程中必不可少的手段:Multimethod,关于类似于Cpp这种面向对象编程的弊端可以参见这个知乎问题:面向对象编程的弊端是什么 Julia中总共提供了四种类型,它们的关键字...
    文章 2018-05-15 2339浏览量
  • 深度学习芯片大战愈演愈烈,英特尔为何斥巨资收购创业...

    这意味着其并不非常适合一般的乘法&xff0c;但其电路可以比使用通用浮点的芯片做得更致密Nervana 芯片的真正亮眼之处是互连&xff08;interconnect&xff09;xff0c;但可以想象&xff0c;该公司一直对其细节讳莫如深。这就是该...
    文章 2021-11-27 13浏览量
  • 【干货】蒋步星:关系代数的问题及尝试

    用计算机解决问题的过程是类似的,拿到一个问题,想出解法,然后还要把解法翻译成计算机能理解能执行的动作才能完成。那么代码为什么难写呢?其中很大一部分原因是用来记录解法的形式语言和人的自然思维相差很远,它...
    文章 2017-04-03 1103浏览量
  • 【深度学习框架大PK】褚晓文教授:五大深度学习框架三...

    为了解决这个问题,当然有很多的解决方案,GPU用了非常复杂的内存架构,是一个金字塔型的架构,最顶层是非常快的寄存,它下面还有L1级的Cache,还有L2级的Cache,还有Shared Memory。CPU的Cache对程序员是不透明的...
    文章 2017-09-20 2217浏览量
  • 《高性能科学与工程计算》——第2章 串行代码基本优化...

    解决这个问题的有效途径是使用硬件性能计数,可提供当前系统使用的所有处理信息,并提供芯片和系统内资源使用情况的深入分析。2.1.2节对此会有详细讨论。应该指出,在很多情况下,我们对串行代码的性能提升...
    文章 2017-07-03 871浏览量
  • 《从问题到程序:用Python学编程和计算》——3.2 ...

    人们已经发现了许多非常重要的实际计算问题,从理论上说它们是可以用计算机解决的,不难写出解决它们的程序。但是,从实际角度看这些问题并没有解决,因为对规模稍微大一点的实际情况(“规模大”对应于上面“大一点...
    文章 2017-05-02 1113浏览量
  • 《计算机科学概论(第12版)》—第1章1.8节数据与程序...

    在本节以及后续章节的程序设计补充部分,我们会看到程序设计语言是如何反映本章主要内容,以及如何让人类更容易地解决计算问题的。1.8.1 Python入门Python是一门程序设计语言,由吉多·范罗苏姆(Guido van Rossum...
    文章 2017-05-02 1694浏览量
  • Python对我下手了!学会这几个知识点可以救命!

    注意:并不是每一行代码都需要注释,只有关键的地方才需要注释,例如,新的语法点、代码重点解决问题、重要的细节、结论等。常量,顾名思义就是值不能被改变的量,比如5、10等数字或者一个字符串的文本。与常量相...
    文章 2019-06-26 1717浏览量
  • 《趣题学算法》—第1章1.1节累积计数法

    1.1 累积计数法这样的问题在实际中往往要通过几个步骤来解决,每个步骤都会产生部分数据,问题的目标是计算出所有步骤产生数据的总和。对这样的问题通常设置一个计数(变量),然后依步骤(往往可以通过循环实现...
    文章 2017-05-02 1421浏览量
  • 并行视角下的硬件习性

    大多数人根据直觉就知道&xff0c...并且必须解决诸如生产、测试、电源和散热等3D集成中的重大问题。散热问题需要用基于钻石的半导体来解决&xff0c;钻石是热的良好导体&xff0c;但却是电的绝缘体。据说生成大型单晶体钻石仍然...
    文章 2021-11-12 21浏览量
  • 第二章——静态链接

    在一个程序被分割成多个模块以后,这些模块之间最后如何组合形成一个单一的程序是需要解决问题。模块之间如何组合的问题可以归结为模块之间如何通信的问题,最常见的属于静态语言的C/C++模块之间通信的两种方式,...
    文章 2015-05-11 837浏览量
  • Tensorflow入门1-CNN网络及MNIST例子讲解

    首先我做的第一件事是分清楚一些概念,之前完全不懂得时候只觉得人工智能很厉害,能解决人力解决不了的问题,但人工智能到底是什么,完全不知道。既然要学习,首先就得分清楚人工智能,机器学习,深度学习都是些什么...
    文章 2018-05-09 6303浏览量
  • 带你读《Python网络爬虫从入门到实践(第2版)》之二...

    怎么访问列表中的值呢?可以在方括号中标明相应的位置索引进行访问,与一般认知不一样的是,索引从0开始,例如: list1[0]:Pythonlist2[1:3]:[2,3] 如何修改列表中的值呢?可以直接为列表中的相应位置赋予一个新值,...
    文章 2019-11-06 1016浏览量
1 2 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化