【优化技术专题】「底层架构原理系列」CPU处理器鲜为人知的那些秘密

简介: 【优化技术专题】「底层架构原理系列」CPU处理器鲜为人知的那些秘密

前提概要


所谓,知彼知己百战不殆,针对于计算机的优化技术来讲,最底层也不过是针对于CPU技术的优化了,但是如果要区优化程序,涉及到CPU的执行能力,那必须要了解CPU的原理和概念以及执行过程等概念,所以小编写了本片的目的就是针对于CPU的相关知识进行讲解,当你对CPU不在陌生的时候,也就是你超神的时候了,哈哈......




CPU相关的知识


本文介绍涉及到的知识点包含,多CPU、物理核、逻辑核、超线程、进程、线程、并发、并行,以及Linux查询CPU和核的信息的方法



易混淆概念


多处理器


认真辨别语境,通常是多CPU的意思;有时多是多逻辑处理器即多核的意思,好像老外常常把一个CPU里有多个核心当成多个CPU来描述。


逻辑处理器


就是逻辑核的意思,Windows 10的中文翻译了这个特别特别容易误解的词,我觉得就是可以理解为内核程序单位。



逻辑CPU


有人用了这个词表示逻辑核的意思,但是用法的根据我保持怀疑,很容易致使误解,由于我会认为,核就是核,CPU就是CPU,为何混为一谈,好像核就是CPU同样缓存。



CPU的一~四级缓存


CPU缓存(Cache Memory)的出现是弥补CPU和主存(主内存,即内存条的)的速度差太大,用于提升效率的,有时可能也叫高速缓存


高速缓存也分了不少层,一到四级,四级不多听但确实是有。一二级是各个核心独有的三级缓存是全部核共享的,四级缓存彷佛是为了解决CPU的集显和CPU的速度差问题(CPU内能够有显卡)。通常CPU商品中只标出了三级缓存,其余都不标注。如图所示:image.png

这里看不到L4 Cache,多是由于只有L1~L3才封装在CPU里。


一样的多个核之间的L1、L2也会有缓存一致性问题,相似多核CPU有一些协议保证多个CPU内部缓存之间一致性的协议(MESI),同一个CPU内部的多核内部的缓存的一致性问题应该也是有方案解决的


物理核、逻辑核和超线程


  • 物理核:是CPU里实实在在封装的物理硬件并发。
  • 逻辑核:利用超线程技术模拟出来的核,通常一个物理核能够虚拟出2个,就是CPU商品标出的线程数,有些资料也叫逻辑CPU数
  • 超线程:HT,Hyper-Threading,超线程技术就是让一个核模拟出两个核的技术性能
  • 物理CPU:即主板上插了多少个的CPU芯片
  • 虚拟CPU:假的、虚拟技术实现的CPU,相似VMWare虚拟机中的CPU



疑惑:


逻辑核彷佛有些时候被翻译成逻辑处理器,而处理器一般被我理解为CPU,因此逻辑核,就是逻辑CPU吗? 但这种翻译真的会有点模糊不清容易形成误解。image.png


线程和核的关系


  • 线程须要核执行,一个核在同一时间只能执行一条线程,这里的核指逻辑核
  • 决定同时执行线程数的是逻辑核
  • 逻辑核心多少个,就能够 “同时” 执行多少线程


总结


n个物理核,通常有2n个逻辑核,若是只能同时运行物理核数个线程(n),那超线程技术模拟出来的核有什么用? 何况不少CPU的商品也不标 “逻辑核数”,用的词是 “线程数”,意思应该就是逻辑核心多少个就能同时运行多少个线程(2n)


x核y线程(y比x大)是什么意思

CPU商品说的2核4线程,指2个物理核,4个逻辑核。4线程就是4个逻辑核的意思



进程和线程


进程是操做系统层面的概念,线程是CPU层面的东西,CPU真正执行的是线程而不是进程进程是是静态的概念,是一些资源的集合,好比进程有本身的内存而线程是动态的概念,进程能够有多个线程,这些线程共享同一份进程的资源多进程,目前多核的状况下,能够作到多个进程同时执行

  • 固然也就能够作到多个线程同时执行。可是单核的CPU没法作到 “同时”执行进程。此外进程是必定有端口号吗? 不必定,没网络暴露的就没有。但是肯定有进程号就对了


并发和并行


并发(concurrency)和并行(parallelism)
复制代码
  • 并行是说物理上的 “同时” 被执行


  • 并发是一种程序设计,可以让多个任务在逻辑上交织执行

并发设计的程序,能够启动n个线程,好比2个,而后交给2个核,这时两个线程就是并行执行的(“同时”);这两个线程也能够被1个核 “交替” 执行。

不少时候,会认为并行就是真的同时执行,而并发就是交替执行,这是通常的理解,可是并发真正含义是指设计的程序容许同时或交替执行,是一种程序设计方案




多CPU 和 单CPU多核


估计是提升计算能力的两个方案,最终选择单CPU多核方案多一点


多CPU估计也有市场,也有些服务器是多CPU的


为何单CPU多核方案更胜一筹,主要是这个方案更好?


  • 多个核心之间通讯不须要走外部的总线,只须要走CPU内部总线,会快得多另外单CPU多核也成本较多CPU低,只须要一套芯片组,一套存储,多核之间经过芯片内部总线进行通讯,共享使用内存
  • 多核CPU缓存一致性协议有MSI、MESI(Illinois Protocol)、MOSI、Synapse、Firefly及 Dragon Protocol等。


多CPU的市场:多CPU适用于大计算量,对速度(时间)不(太)敏感的任务,好比一些工程建模,或者像SATI找外星人这种极端的,跑上几千年都不着急的。



单CPU单核


单CPU单核 跑多线程效率必定下降吗?


不必定:


  • 下降:若是多线程跑的都是CPU密集型任务,有可能会下降效率,由于仅有的一个核被用满了还要被调度来调度去浪费时间
  • 提高:若是多线程跑的都是IO密集型任务,有可能会提升,由于IO比CPU运行慢得多,来回切换线程,让这个核物尽其用。其调度损耗是值得的


举个例子:我有两家店(两个任务),这两家店隔了一条街道,我招了一个工人(一个CPU核),若是打理一家店铺就很忙得不可开交,你还让他打理两家店,来回在两家店跑来跑去,这反而下降了效率。若是这两个店铺都是处理1小时事情以后闲3个小时的,显然让他来回在两家店跑能榨干他的价值,能提升效率。




单CPU多核


常常会听到CPU都普及多核了,编程应该好好利用,其实确实是存在目前的编程没有充分利用多核CPU的性能,不过多是由于多线程的编程比较复杂的缘由。


单CPU多核,对于多线程确实提高做用大。不要钱的话确定是多核比单核CPU好的呀。




Linux中查看CPU和核信息


cat /proc/cpuinfo 
复制代码

获得的信息应该是以逻辑核为单位的列表信息。每一个逻辑核的信息包括其归属的物理核ID(core id),以及其归属的物理CPU的ID(physical id)



列出物理CPU及各自的物理核数


cat /proc/cpuinfo | grep -E "physical id|cpu cores" | sed 'N;s/\n/ /' | sort | uniq
复制代码


假设输出以下,则表示有2个物理CPU,第一个CPU有4个物理核,第二个CPU也是4个:


physical id : 0 cpu cores : 4
physical id : 1 cpu cores : 4
复制代码




列出物理CPU及各自的逻辑核数


cat /proc/cpuinfo | grep "physical id" | sort | uniq -c
复制代码


假设输出以下,则表示有两个物理CPU,各自包含8个逻辑核

8 physical id : 0
8 physical id : 1
复制代码





查询CPU类型(虚拟、真实)


cat /proc/cpuinfo后查看model name,


例如:

Intel(R) Xeon(R) CPU E5-2682 v4 @ 2.50GHz 大概表示是真实CPU或者QEMU Virtual CPU version (cpu64-rhel6) 表示虚拟CPU




查询CPU是否支持超线程


  • 物理内核和物理CPU列表展示:两个物理CPU中各存在4个物理内核
physical id : 0 cpu cores : 4
physical id : 1 cpu cores : 4
复制代码
  • 逻辑内核数码,和对应的物理CPU的id
8 physical id : 0
8 physical id : 1
复制代码

能够得出第一个CPU(physical id是0)支持,由于其物理核4个逻辑核却又8个,第二个CPU(id是1)一样也支持。若是物理核和逻辑核的数量相等,不表明不支持,可能没打开超线程技术开关




top命令显示的核数是?


输入top按1能够展现出全部逻辑核,从Cpu0~CpuN,就是说有N+1个逻辑核。

是逻辑核数。


6、Java进程占用CPU超过100% top查看进程的%CPU值,为何会CPU占用率超过100%

由于该进程占用超过一个核,占满2个核就是200%了。




/proc/cpuinfo文件解释


  • model name:是CPU的型号主频一些信息


例如Intel(R) Xeon(R) CPU E5-2682 v4 @ 2.50GHz或者QEMU Virtual CPU version (cpu64-rhel6)应该能大概看得出是虚拟CPU仍是真实的CPU


  • processor:指逻辑核ID,好比0,表示第1个逻辑核,不是零个逻辑核意思
  • physical id:物理CPU的ID,0表示第一个
  • core id:物理核的ID,0表示第一个
  • cpu cores:该物理CPU有多少个物理核
  • siblings该物理CPU有多少个逻辑核跟cpu cores不同表示开启了超线程技术,不然表示不支持该技术或者未开启




指令总结(重点学习,以后可能会用的上哦!)


  • 一、物理CPU数

cat /proc/cpuinfo | grep 'physical id' | uniq |wc -l


uniq是为了去掉多个逻辑核同属于一个物理CPU


  • 二、物理核数(全部CPU)


cat /proc/cpuinfo | grep 'core id' | uniq |wc -l



uniq为了去掉多个逻辑核属于同一个物理核


上述计算方式是计算全部CPU加起来有多少核,并非计算某个CPU有多少核



  • 三、物理核数(某个CPU)

cat /proc/cpuinfo 后查看cpu cores,该值记录了对应的物理CPU(以该条目中的physical id标识)有多少个物理核。

  • 四、逻辑核数(全部CPU)



逻辑核数,有些地方会逻辑CPU数


cat /proc/cpuinfo | grep 'processor' | wc -l


  • 五、逻辑核数(某个CPU)


cat /proc/cpuinfo后查看siblings,该值记录了对应的物理CPU(以该条目中的physical id标识做分组)有多少个逻辑核。


  • 六、查看是否支持超线程


cat /proc/cpuinfo后查看siblings和cpu cores不一致,说明该physical id的CPU支持超线程,若是一致,明不支持超线程,或者超线程未打开。




相关文章
|
8天前
|
消息中间件 存储 缓存
十万订单每秒热点数据架构优化实践深度解析
【11月更文挑战第20天】随着互联网技术的飞速发展,电子商务平台在高峰时段需要处理海量订单,这对系统的性能、稳定性和扩展性提出了极高的要求。尤其是在“双十一”、“618”等大型促销活动中,每秒需要处理数万甚至数十万笔订单,这对系统的热点数据处理能力构成了严峻挑战。本文将深入探讨如何优化架构以应对每秒十万订单级别的热点数据处理,从历史背景、功能点、业务场景、底层原理以及使用Java模拟示例等多个维度进行剖析。
29 8
|
15天前
|
监控
SMoA: 基于稀疏混合架构的大语言模型协同优化框架
通过引入稀疏化和角色多样性,SMoA为大语言模型多代理系统的发展开辟了新的方向。
28 6
SMoA: 基于稀疏混合架构的大语言模型协同优化框架
|
13天前
|
存储 NoSQL 分布式数据库
微服务架构下的数据库设计与优化策略####
本文深入探讨了在微服务架构下,如何进行高效的数据库设计与优化,以确保系统的可扩展性、低延迟与高并发处理能力。不同于传统单一数据库模式,微服务架构要求更细粒度的服务划分,这对数据库设计提出了新的挑战。本文将从数据库分片、复制、事务管理及性能调优等方面阐述最佳实践,旨在为开发者提供一套系统性的解决方案框架。 ####
|
22天前
|
运维 Serverless 数据处理
Serverless架构通过提供更快的研发交付速度、降低成本、简化运维、优化资源利用、提供自动扩展能力、支持实时数据处理和快速原型开发等优势,为图像处理等计算密集型应用提供了一个高效、灵活且成本效益高的解决方案。
Serverless架构通过提供更快的研发交付速度、降低成本、简化运维、优化资源利用、提供自动扩展能力、支持实时数据处理和快速原型开发等优势,为图像处理等计算密集型应用提供了一个高效、灵活且成本效益高的解决方案。
59 1
|
1月前
|
监控 API 开发者
后端开发中的微服务架构实践与优化
【10月更文挑战第17天】 本文深入探讨了微服务架构在后端开发中的应用及其优化策略。通过分析微服务的核心理念、设计原则及实际案例,揭示了如何构建高效、可扩展的微服务系统。文章强调了微服务架构对于提升系统灵活性、降低耦合度的重要性,并提供了实用的优化建议,帮助开发者更好地应对复杂业务场景下的挑战。
22 7
|
1月前
|
运维 监控 Serverless
利用Serverless架构优化成本和可伸缩性
【10月更文挑战第13天】Serverless架构让开发者无需管理服务器即可构建和运行应用,实现成本优化与自动扩展。本文介绍其工作原理、核心优势及实施步骤,探讨在Web应用后端、数据处理等领域的应用,并分享实战技巧。
|
1月前
|
Cloud Native API 持续交付
利用云原生技术优化微服务架构
【10月更文挑战第13天】云原生技术通过容器化、动态编排、服务网格和声明式API,优化了微服务架构的可伸缩性、可靠性和灵活性。本文介绍了云原生技术的核心概念、优势及实施步骤,探讨了其在自动扩展、CI/CD、服务发现和弹性设计等方面的应用,并提供了实战技巧。
|
1月前
|
运维 Serverless 数据处理
Serverless架构通过提供更快的研发交付速度、降低成本、简化运维、优化资源利用、提供自动扩展能力、支持实时数据处理和快速原型开发等优势,为图像处理等计算密集型应用提供了一个高效、灵活且成本效益高的解决方案。
Serverless架构通过提供更快的研发交付速度、降低成本、简化运维、优化资源利用、提供自动扩展能力、支持实时数据处理和快速原型开发等优势,为图像处理等计算密集型应用提供了一个高效、灵活且成本效益高的解决方案。
59 3
|
1月前
|
存储 缓存 算法
CPU优化
【10月更文挑战第7天】
31 1
|
1月前
|
存储 Kubernetes 监控
深度解析Kubernetes在微服务架构中的应用与优化
【10月更文挑战第18天】深度解析Kubernetes在微服务架构中的应用与优化
109 0
下一篇
无影云桌面