• 《七周七并发模型》第一章概述

    并发和并行经常被混淆的一个原因是,传统的“线程与锁”模型并没有显式支持并行。如果要用线程与锁模型为多核进行开发,唯一的选择就是写一个并发的程序,让其并行地运行在多核上。然而,并发程序通常是确定的,它...
    文章 2017-05-23 1327浏览量
  • 《数字逻辑设计与计算机组成》一 1.4 计算机体系结构

    集群和仓库规模计算机提供了可用性(如果一台服务器崩溃,其他的服务器还能继续工作)、交互应用(例如在线购物、谷歌、Facebook、电子银行等)和大规模存储与计算(例如云计算)。电力分布和散热问题是当前超大型...
    文章 2017-09-04 1002浏览量
  • 《CUDA C编程权威指南》——3.2节理解线程束执行的...

    GPU支持传统的、C风格的、显式的控制流结构,例如,if…then…else、for和while。CPU拥有复杂的硬件以执行分支预测,也就是在每个条件检查中预测应用程序的控制流会使用哪个分支。如果预测正确,CPU中的分支只需付出...
    文章 2017-05-02 1699浏览量
  • 《CUDA C编程权威指南》——3.2 理解线程束执行的...

    GPU支持传统的、C风格的、显式的控制流结构,例如,if…then…else、for和while。CPU拥有复杂的硬件以执行分支预测,也就是在每个条件检查中预测应用程序的控制流会使用哪个分支。如果预测正确,CPU中的分支只需付出...
    文章 2017-07-03 3557浏览量
  • 《CUDA C编程权威指南》——第3章 CUDA执行模型 3.1 ...

    同一线程中的指令利用指令并行性进行流水线化,另外,在CUDA中已经介绍了线程级并行。CUDA采用单指令多线程(SIMT)架构来管理和执行线程,每32个线程为一组,被称为线程束(warp)。线程束中的所有线程同时执行...
    文章 2017-07-03 2116浏览量
  • 《CUDA C编程权威指南》——1.2 异构计算

    Tegra系列产品是专为移动和嵌入设备而设计的,如平板电脑和手机,GeForce面向图形用户,Quadro用于专业绘图设计,Tesla用于大规模的并行计算。Fermi是Tesla系列产品中的一种,用作GPU加速器,近来在高性能计算中...
    文章 2017-07-03 1982浏览量
  • 《多核与GPU编程:工具、方法及实践》-1.5 并行程序...

    当使用多核计算平台时,并行程序开启的线程或者进程数量应超过可用的硬件提供的计算内核的数目。超线程是一个特例,因为这个技术使操作系统认为处理器的计算内核数目是实际值的两倍。然而,这些逻辑计算内核并...
    文章 2017-05-02 1268浏览量
  • 《CUDA C编程权威指南》——1.2节异构计算

    TegraGeForceQuadroTeslaTegra系列产品是专为移动和嵌入设备而设计的,如平板电脑和手机,GeForce面向图形用户,Quadro用于专业绘图设计,Tesla用于大规模的并行计算。Fermi是Tesla系列产品中的一种,用作GPU加速...
    文章 2017-05-02 1625浏览量
  • 《OpenACC并行编程实战》—— 第2章 OpenACC概览 2.1 ...

    这种模型支持不同线程上操作的内存一致性,甚至,在同一个执行单元上,只有在存储操作语句之间显式地内存栏栅才能保证内存一致性。否则,如果一个线程更新一个内存地址而另一个线程读取同一个地址,或者两个操作向...
    文章 2017-05-02 1878浏览量
  • 《高性能科学与工程计算》——1.2 基于高速缓存的...

    如果指令的操作数能及时从寄存器中获得,例如存储系统太慢跟上处理器的速度,此时乱序执行则可以允许执行后续指令流中已经获得参数的指令,从而避免阻塞时间(也叫做stall)。这能提高指令吞吐量,同时使得编译...
    文章 2017-07-03 1291浏览量
  • 《高性能科学与工程计算》——1.6 向量处理器

    编译器会自动执行向量化操作(可能是源代码直接支持向量化)或者代码被重写使得可以显式地使用临时数组来保存所需的向量数据。还有另一种替代方案,使用列表向量,它是一个整型的向量数组,保存着条件为真的索引,...
    文章 2017-07-03 1783浏览量
  • ClickHouse深度揭秘

    它实现了单机多核并行、分布式计算、向量化执行与SIMD指令、代码生成等多种重要技术。多核并行 ClickHouse将数据划分为多个partition,每个partition再进一步划分为多个index granularity,然后通过多个CPU核心分别...
    文章 2020-05-22 13108浏览量
  • ClickHouse深度揭秘

    它实现了单机多核并行、分布式计算、向量化执行与SIMD指令、代码生成等多种重要技术。多核并行 ClickHouse将数据划分为多个partition,每个partition再进一步划分为多个index granularity,然后通过多个CPU核心分别...
    文章 2019-12-18 4906浏览量
  • ClickHouse深度揭秘

    它实现了单机多核并行、分布式计算、向量化执行与SIMD指令、代码生成等多种重要技术。多核并行 ClickHouse将数据划分为多个partition,每个partition再进一步划分为多个index granularity,然后通过多个CPU核心分别...
    文章 2019-12-18 4840浏览量
  • 阿里腾讯今日头条纷纷翻牌子,ClickHouse到底有什么...

    它实现了单机多核并行、分布式计算、向量化执行与SIMD指令、代码生成等多种重要技术。多核并行 ClickHouse将数据划分为多个partition,每个partition再进一步划分为多个index granularity,然后通过多个CPU核心分别...
    文章 2019-12-20 2961浏览量
  • 阿里腾讯今日头条纷纷翻牌子,ClickHouse到底有什么...

    它实现了单机多核并行、分布式计算、向量化执行与SIMD指令、代码生成等多种重要技术。多核并行 ClickHouse将数据划分为多个partition,每个partition再进一步划分为多个index granularity,然后通过多个CPU核心分别...
    文章 2020-05-22 8469浏览量
  • 阿里腾讯今日头条纷纷翻牌子,ClickHouse到底有什么...

    它实现了单机多核并行、分布式计算、向量化执行与SIMD指令、代码生成等多种重要技术。多核并行 ClickHouse将数据划分为多个partition,每个partition再进一步划分为多个index granularity,然后通过多个CPU核心分别...
    文章 2019-12-20 1097浏览量
  • 狭路相逢|ARM和X86的系统架构差异分析(篇二)

    虽然 VFP 打着向量的名头,不过这些“向量”指令的各个向量是串列方式执行(或者需要单精度搭配双精度才能实现并行执行)的,并能提供真正的 SIMD 向量并行,因此这个向量模式被拿掉了。Advanced SIMD(NEON)扩展...
    文章 2020-08-10 2404浏览量
  • 《多核与GPU编程:工具、方法及实践》-1.3 现代计算机...

    同时,它还消除了GPU编程中的主要困扰之一:显式(或者隐式,基于中间件)数据传输。AMD APU芯片实现了异构系统架构(Heterogeneous System Architecture,HSA)。HSA由HAS基金会(HSA Foundation,HSAF)开发,并...
    文章 2017-05-02 2032浏览量
  • 《多核与GPU编程:工具、方法及实践》-2.3 分解模式

    然而,这种策略能随着计算节点数很好地扩展,因为最大节点数能超过通常很有限的任务数。2.3.2 分而治之分解 很大一部分的串行算法都可以简洁地用递归来表示,即算法的解法由更小且相关联的子问题的解法组合来...
    文章 2017-05-02 1129浏览量
  • GPU计算的十大质疑——GPU计算再思考

    简单地说,一个程序中如果50%的处理都需要串行进行的话,speedup 只能提升2倍(考虑事实上有多少线程可用);如果程序的10%需要串行进行,speedup 最多能够提高近10倍。Amdahl定律同样量化了串行化的效率开销。在...
    文章 2014-06-18 2193浏览量
  • 《计算机组成原理》-1.5 存储程序的概念

    由于指令中只提供了一个操作数地址而指令却需要至少两个地址,处理器不得使用一个需要显式地址的第二操作数。也就是说,第二个操作数来自CPU内一个叫作累加器(accumulator)的寄存器。术语累加器今天已经很少...
    文章 2017-05-02 2494浏览量
  • Oracle 12C优化器的巨大变化,上生产必读(上)

    SQL计划指令是在查询表达之上创建的,而非语句级或者对象级,这样就可确保它们可被应用于多个SQL语句。在一个SQL语句上有多个SQL计划指令也是可能发生的。一个SQL语句所使用的SQL计划指令数目被显示于执行计划下方...
    文章 2017-05-02 1417浏览量
  • 《深入浅出DPDK》—第3章3.1节并行计算

    这意味着应用程序可以显式地指定线程在哪个(或哪些)处理器上运行。1.Linux内核对亲和性的支持在Linux内核中,所有的线程都有一个相关的数据结构,称为task_struct。这个结构非常重要,原因有很多;其中与亲和性...
    文章 2017-05-02 4107浏览量
  • Python并发编程:锁、信号量和条件变量

    但是在分布式系统中,接受者和发送者都必须显式编码进消息中。在程序中,使用字符串来控制调度函数的行为十分方便。在分布式系统中,消息需要经过网络发送,并且可能需要存放许多不同种类的信号作为“数据”,所以...
    文章 2017-08-01 1384浏览量
  • 《计算机组成原理》-1.3 计算机的发展

    这里需要介绍的就是超标量处理包括从存储器中读出几条指令并行执行这些指令;乱序执行则是指以不同于程序中顺序的顺序执行指令,以避免等待某条指令的执行,从而加快指令的执行速度。乱序执行允许在当前指令等待正...
    文章 2017-05-02 1862浏览量
  • 《C++并发编程实战》——1.1 什么是并发

    真正有新意的是增加计算机真正并行运行多任务的普遍性,而只是给人这种错觉。以前,大多数计算机都有一个处理器,具有单个处理单元或核心,至今许多台式机器仍是这样。这种计算机在某一时刻只可以真正执行一个任务...
    文章 2017-05-02 1302浏览量
  • 可用之1——存储a

    计算如下:iops=120*150/(1-30%)=1800/0.7=25700 也就是说,正常情况下,整个存储最大可以持证25700个iops,如果在网上涨,存储系统将可能变得能负荷。假定现在阵列接收到的iops为15000个,存储命中率为20%,计算...
    文章 2012-05-31 1108浏览量
  • Apache Spark源码走读(八)Graphx实现剖析&spark ...

    本篇讲来讲去就在强调一个问题,Spark是一个分布式并行计算框架。能能用Spark,其实大体取决于问题的数学模型本身,如果可以并行化处理,则用之,切可削足适履。另一个用张图来总结一下提到的数学知识吧。再一次...
    文章 2016-09-14 3881浏览量
  • 阿里飞天云平台架构简介

    当硬件故障或数据不可用造成数据块的副本数目不满3份时,数据块会被重新复制。为保证数据的完整性,每块数据在写入时会同时计算一个校验值,与数据同时写入磁盘。当读取数据块时,块服务器会再次计算校验值与之前...
    文章 2018-10-13 22149浏览量
1 2 3 4 6 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化