• 地平线谭洪贺:AI芯片怎么降功耗?从ISSCC2017说起

    有心的人可能早就发现了,14.2中基于LUT的可配置乘法器也是可以当做4个4bit乘、2个8bit乘或是1个16bit乘的。哎呦,不错哦。2.4 稀疏化 (ISSCC2017对稀疏化没有特别值得谈的亮点,本节纯属赠送) 稀疏化是Deep ...
    文章 2017-05-17 1413浏览量
  • OpenBLAS项目与矩阵乘法优化|AI 研习社

    下一步需要解决的是这个cache的问题问题是没有做大的分块,超过cache大小之后性能就会下滑,要解决这个问题的话,需要在更上一层做Blocking。转换成代码的话,在这一层做一个K的切分,下面一层做一个m的切分,至于...
    文章 2017-08-02 1472浏览量
  • 从奔腾I的VCD播放到AI区块链播放——程序优化的魔法

    面对这种情况就可以用最简单的算法,一个非零点做一次乘法,8个点做8个乘法就可以解决。这比IDCT快速算法又快了很多,两个非零点的情况也是类似的。如果说两个以上系数不为0用快速算法就可以解决,因为用一个点算...
    文章 2018-04-23 1034浏览量
  • 重学计算机组成原理(二)-制定学习路线,攀登“性能...

    存储其实很多时候又扮演了输入输出设备的角色,所以你需要进一步了解,CPU和这些存储之间是如何进行通信的,以及我们最重视的性能问题怎么一回事;理解什么是IO_WAIT,如何通过DMA来提升程序性能。对于存储...
    文章 2019-08-10 1641浏览量
  • 阿里云大数据计算平台的自动化、精细化运维之路

    这里面主要难点还是在于硬件信息收集和分析,怎么判断这块磁盘坏了,怎么判断 CPU 是有问题的。这其中需要长期的数据和经验积累。这里我可以简单介绍一下我们现在采集的信息源: 硬盘主要依赖于 kernel log/smartctl...
    文章 2017-02-28 10165浏览量
  • 浅谈端上智能之计算优化

    在这种架构下,每次执行乘法运算时,结果会被直接传递给后面的乘法器,并进行求和。在整个过程中,无需访问内存。去除这些访存开销,还会有额外好处,即功耗的降低。我们知道与计算相比,访存才是功耗大户。通过这种...
    文章 2019-11-05 1811浏览量
  • 【新智元专访】Nervana CEO|英特尔英伟达AI芯片霸主...

    Nervana的芯片技术还将与英特尔的主处理融合,这在系统层面是非常领先的——让数据进入系统,然后在系统上对这些数据进行运算,实际上是现在的难点(hard part)——两者的融合将带来非常有吸引力的(compelling)...
    文章 2017-08-01 887浏览量
  • 【深度学习框架大PK】褚晓文教授:五大深度学习框架三...

    为了解决这个问题,当然有很多的解决方案,GPU用了非常复杂的内存架构,是一个金字塔型的架构,最顶层是非常快的寄存,它下面还有L1级的Cache,还有L2级的Cache,还有Shared Memory。CPU的Cache对程序员是不透明的...
    文章 2017-09-20 2176浏览量
  • 《计算机科学概论》—第1章1.2节计算的历史

    [5]1951年后,计算机被越来越广泛地用来解决各个领域中的问题。从那时起,探索的重点不仅在于建造更快、更大的计算设备,而且在于开发能让我们更有效地使用这些设备的工具。从这时开始,计算硬件的历史基于它们所...
    文章 2017-05-02 1195浏览量
  • 《从问题到程序:用Python学编程和计算》——第2章 ...

    浮点数字面量、溢出和截断CPython(也就是说,Python软件基金会发布的官方的语言解释)直接使用计算机硬件支持的标准浮点数。常见硬件都采用IEEE754浮点数标准,标准浮点数具有16~17位十进制精度,表示范围大致为...
    文章 2017-05-02 1191浏览量
  • 《从问题到程序:用Python学编程和计算》——第2章 ...

    CPython(也就是说,Python软件基金会发布的官方的语言解释)直接使用计算机硬件支持的标准浮点数。常见硬件都采用IEEE754浮点数标准,标准浮点数具有16~17位十进制精度,表示范围大致为,绝对值太小的实数将归结...
    文章 2017-07-03 1789浏览量
  • 带你读《计算思维导论》之一:绪论

    4.计算思维是一种思想,而非人造品目前,软、硬件等人造物以物理形式呈现在我们周围,并时时刻刻影响着我们的生活,但计算思维体现的是一种我们用以解决问题、管理日常生活、与他人交流和互动的与计算有关的思想。...
    文章 2019-10-30 1547浏览量
  • Web 高级着色语言(WHLSL)-为WebGPU设计的Web图形...

    这是一个安全问题,因为它意味着着色可以访问恰好位于应用程序地址空间中的任何资源,这与 Web 的安全模型相反。从理论上讲,可以指定一个没有原始指针的 Metal Shading Language,但指针对于 C 和 C++ 语言来说是...
    文章 2019-08-06 1400浏览量
  • 一文盘点深度学习13个常见问题(附详细解答&学习资源...

    如果你想用这些网络来解决现实生活中的问题,就准备买一些高端硬件吧!Q9:我们需要大量的数据 来训练深度学习模型吗?的确,我们需要大量的数据来训练一个典型的深度学习模型。但是,我们通常可以通过使用所谓的...
    文章 2018-06-20 1753浏览量
  • 对话哈佛大学教授Lukin:量子计算将在我们有生之年...

    但是,如果我们的硬件应用了量子力学,那么不仅仅是顺序地提供一些输入和读出答案那么简单,利用态叠加原理,我们可以准备一个电脑寄存处理许多不同类型的输入信息。这意味着,如果我采用这种叠加态并使用量子力学...
    文章 2018-05-17 2928浏览量
  • 深度学习模型训练痛点及解决方法

    那么怎么解决它呢?2.1.1 设置合理的初始化权重w和偏置b 深度学习通过前向计算和反向传播,不断调整参数,来提取最优特征,以达到预测的目的。其中调整的参数就是weight和bias,简写为w和b。根据奥卡姆剃刀法则,...
    文章 2018-05-31 5590浏览量
  • 未来计算是什么样的?张晓东、丛京生等六大教授这样说

    李凯:现在已经很多根据用户要求,对不同应用设计不同的计算和存储,我们已经向这个方向走了,有可能我们以后就会根据不同的新技术出现,比如用 DNA 存储,那些技术存在了,可以解决哪一类的问题。刚才我提到现在...
    文章 2017-11-03 918浏览量
  • 《从问题到程序:用Python学编程和计算》——第1章 ...

    后者告诉我们,不需要考虑如何去设计能完成千奇百怪的具体计算的设备(例如加法机、乘法机、文字编辑机、超级玛丽游戏机等),只需要设计和制造出一种设备,其功能等价于通用图灵机,就能解决所有的计算问题了。...
    文章 2017-05-02 500浏览量
  • 《从问题到程序:用Python学编程和计算》——第1章 ...

    后者告诉我们,不需要考虑如何去设计能完成千奇百怪的具体计算的设备(例如加法机、乘法机、文字编辑机、超级玛丽游戏机等),只需要设计和制造出一种设备,其功能等价于通用图灵机,就能解决所有的计算问题了。...
    文章 2017-07-03 1753浏览量
  • 分析全球334家真正的深度学习创业公司,盘点25家AI...

    另外一点,它不仅仅使用矢量处理(vector processor),主要使用的是张量处理(tensor processor),也就是说它可以同时处理不仅仅是一维的数据,还有三维的数据,这使得计算密度非常高,可以达到万亿次乘法 ...
    文章 2017-11-20 1356浏览量
  • 怎么搞个大数据平台?

    解决问题时需要哪些技能呢?直觉和数据分析能力。当你去处理还没发生的事件,即便是很大数据量的分析,也需要一定程度的直觉。但很明显基于数据分析的决策比直觉意见更可信,因为它排除了决策人的偏好、品味和经验,...
    文章 2017-07-05 1072浏览量
  • Hadoop专业解决方案-第3章:MapReduce处理数据

    MapReduce被用于解决大规模计算问题,它经过特殊设计可以运行在普通的硬件设备上。它根据分而治之的原则——输入的数据集被切分成独立的块,同时被mapper模块处理。另外,map执行与数据是典型的本地协作(在第四章在...
    文章 2016-04-19 3713浏览量
  • Yann LeCun对于AI的最新见解|深度学习现存的各类疑问...

    如果在未来几年人工智能能够朝向这些方向取得重大发展,将会出现大量更为智能的关于对话系统,回答问题,及具有适应性的机器人控制与规划等的AI代理。设计出无监管式/预测型学习方法,这些学习方法允许大型神经...
    文章 2017-08-01 1148浏览量
  • Flink 1.12 资源管理新特性回顾

    其它模块大部分是 Flink 的框架内存,正常不需要调整,即使遇到问题也可以通过社区文档来解决。除此之外,“一个作业究竟需要多少内存才能满足实际生产需求”也是大家不得不面临的问题,比如其他指标的功能使用、...
    文章 2021-07-15 1348浏览量
  • [译]开发者眼中 iOS 11 都更新了什么?

    解决这两个问题需要写比你期望中的更多的代码,但我会带你一步一步编写代码,让它更容易些。首先,是最简单的部分:找出行被拖放到哪里。performDropWith 返回一个UITableViewDropCoordinator 类对象,该对象有...
    文章 2017-10-16 1474浏览量
  • 《Scikit-Learn与TensorFlow机器学习实用指南》第04章...

    梯度下降是一种非常通用的优化算法,它能够很好地解决一系列问题。梯度下降的整体思路是通过的迭代来逐渐调整参数使得损失函数达到最小值。假设浓雾下,你迷失在了大山中,你只能感受到自己脚下的坡度。为了最快到达...
    文章 2018-09-07 1152浏览量
  • 面向机器学习的自然语言标注.

    技术专家、软件开发者、网站设计者和商业及创新专家都使用Safari图书在线作为他们研究、解决问题以及学习和职业资格培训的首要资源。Safari图书在线为各种组织、政府机构和个人提供丰富的产品和定价程序。订购者可在...
    文章 2017-05-02 11338浏览量
  • 30分钟 Python 教程

    pypi仓库服务器本身位于海外,访问速度比较慢,为了解决这个问题,可以使用tuna,ali,163,中科大等的国内pypi镜像,具体步骤可以666,有很多相关资料,各镜像源也有相关的配置文档,这里不再赘述。本教程中,python...
    文章 2021-09-08 32浏览量
  • 数据挖掘与数据化运营实战

    在数据化运营道路上,有不少难题亟待解决。其中最棘手、最突出的就是数据质量。企业的数据化商业实践中,“数据给自己用”与“数据给别人去用”是两个完全不同难度的课题,好比在家做几道家常菜和开餐厅,后者对于...
    文章 2017-05-02 6867浏览量
  • Skinned Mesh原理解析和一个最简单的实现示例

    第三类就是骨骼蒙皮动画即Skinned Mesh了,骨骼蒙皮动画的出现解决了关节动画的裂缝问题,而且效果非常酷,发明这个算法的人一定是个天才,因为Skinned Mesh的原理简单的难以置信,而效果却那么好。骨骼动画的基本...
    文章 2016-05-19 2114浏览量

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化