【优化技术专题】「底层架构原理系列」CPU处理器鲜为人知的那些秘密

简介: 【优化技术专题】「底层架构原理系列」CPU处理器鲜为人知的那些秘密

前提概要


所谓,知彼知己百战不殆,针对于计算机的优化技术来讲,最底层也不过是针对于CPU技术的优化了,但是如果要区优化程序,涉及到CPU的执行能力,那必须要了解CPU的原理和概念以及执行过程等概念,所以小编写了本片的目的就是针对于CPU的相关知识进行讲解,当你对CPU不在陌生的时候,也就是你超神的时候了,哈哈......




CPU相关的知识


本文介绍涉及到的知识点包含,多CPU、物理核、逻辑核、超线程、进程、线程、并发、并行,以及Linux查询CPU和核的信息的方法



易混淆概念


多处理器


认真辨别语境,通常是多CPU的意思;有时多是多逻辑处理器即多核的意思,好像老外常常把一个CPU里有多个核心当成多个CPU来描述。


逻辑处理器


就是逻辑核的意思,Windows 10的中文翻译了这个特别特别容易误解的词,我觉得就是可以理解为内核程序单位。



逻辑CPU


有人用了这个词表示逻辑核的意思,但是用法的根据我保持怀疑,很容易致使误解,由于我会认为,核就是核,CPU就是CPU,为何混为一谈,好像核就是CPU同样缓存。



CPU的一~四级缓存


CPU缓存(Cache Memory)的出现是弥补CPU和主存(主内存,即内存条的)的速度差太大,用于提升效率的,有时可能也叫高速缓存


高速缓存也分了不少层,一到四级,四级不多听但确实是有。一二级是各个核心独有的三级缓存是全部核共享的,四级缓存彷佛是为了解决CPU的集显和CPU的速度差问题(CPU内能够有显卡)。通常CPU商品中只标出了三级缓存,其余都不标注。如图所示:image.png

这里看不到L4 Cache,多是由于只有L1~L3才封装在CPU里。


一样的多个核之间的L1、L2也会有缓存一致性问题,相似多核CPU有一些协议保证多个CPU内部缓存之间一致性的协议(MESI),同一个CPU内部的多核内部的缓存的一致性问题应该也是有方案解决的


物理核、逻辑核和超线程


  • 物理核:是CPU里实实在在封装的物理硬件并发。
  • 逻辑核:利用超线程技术模拟出来的核,通常一个物理核能够虚拟出2个,就是CPU商品标出的线程数,有些资料也叫逻辑CPU数
  • 超线程:HT,Hyper-Threading,超线程技术就是让一个核模拟出两个核的技术性能
  • 物理CPU:即主板上插了多少个的CPU芯片
  • 虚拟CPU:假的、虚拟技术实现的CPU,相似VMWare虚拟机中的CPU



疑惑:


逻辑核彷佛有些时候被翻译成逻辑处理器,而处理器一般被我理解为CPU,因此逻辑核,就是逻辑CPU吗? 但这种翻译真的会有点模糊不清容易形成误解。image.png


线程和核的关系


  • 线程须要核执行,一个核在同一时间只能执行一条线程,这里的核指逻辑核
  • 决定同时执行线程数的是逻辑核
  • 逻辑核心多少个,就能够 “同时” 执行多少线程


总结


n个物理核,通常有2n个逻辑核,若是只能同时运行物理核数个线程(n),那超线程技术模拟出来的核有什么用? 何况不少CPU的商品也不标 “逻辑核数”,用的词是 “线程数”,意思应该就是逻辑核心多少个就能同时运行多少个线程(2n)


x核y线程(y比x大)是什么意思

CPU商品说的2核4线程,指2个物理核,4个逻辑核。4线程就是4个逻辑核的意思



进程和线程


进程是操做系统层面的概念,线程是CPU层面的东西,CPU真正执行的是线程而不是进程进程是是静态的概念,是一些资源的集合,好比进程有本身的内存而线程是动态的概念,进程能够有多个线程,这些线程共享同一份进程的资源多进程,目前多核的状况下,能够作到多个进程同时执行

  • 固然也就能够作到多个线程同时执行。可是单核的CPU没法作到 “同时”执行进程。此外进程是必定有端口号吗? 不必定,没网络暴露的就没有。但是肯定有进程号就对了


并发和并行


并发(concurrency)和并行(parallelism)
复制代码
  • 并行是说物理上的 “同时” 被执行


  • 并发是一种程序设计,可以让多个任务在逻辑上交织执行

并发设计的程序,能够启动n个线程,好比2个,而后交给2个核,这时两个线程就是并行执行的(“同时”);这两个线程也能够被1个核 “交替” 执行。

不少时候,会认为并行就是真的同时执行,而并发就是交替执行,这是通常的理解,可是并发真正含义是指设计的程序容许同时或交替执行,是一种程序设计方案




多CPU 和 单CPU多核


估计是提升计算能力的两个方案,最终选择单CPU多核方案多一点


多CPU估计也有市场,也有些服务器是多CPU的


为何单CPU多核方案更胜一筹,主要是这个方案更好?


  • 多个核心之间通讯不须要走外部的总线,只须要走CPU内部总线,会快得多另外单CPU多核也成本较多CPU低,只须要一套芯片组,一套存储,多核之间经过芯片内部总线进行通讯,共享使用内存
  • 多核CPU缓存一致性协议有MSI、MESI(Illinois Protocol)、MOSI、Synapse、Firefly及 Dragon Protocol等。


多CPU的市场:多CPU适用于大计算量,对速度(时间)不(太)敏感的任务,好比一些工程建模,或者像SATI找外星人这种极端的,跑上几千年都不着急的。



单CPU单核


单CPU单核 跑多线程效率必定下降吗?


不必定:


  • 下降:若是多线程跑的都是CPU密集型任务,有可能会下降效率,由于仅有的一个核被用满了还要被调度来调度去浪费时间
  • 提高:若是多线程跑的都是IO密集型任务,有可能会提升,由于IO比CPU运行慢得多,来回切换线程,让这个核物尽其用。其调度损耗是值得的


举个例子:我有两家店(两个任务),这两家店隔了一条街道,我招了一个工人(一个CPU核),若是打理一家店铺就很忙得不可开交,你还让他打理两家店,来回在两家店跑来跑去,这反而下降了效率。若是这两个店铺都是处理1小时事情以后闲3个小时的,显然让他来回在两家店跑能榨干他的价值,能提升效率。




单CPU多核


常常会听到CPU都普及多核了,编程应该好好利用,其实确实是存在目前的编程没有充分利用多核CPU的性能,不过多是由于多线程的编程比较复杂的缘由。


单CPU多核,对于多线程确实提高做用大。不要钱的话确定是多核比单核CPU好的呀。




Linux中查看CPU和核信息


cat /proc/cpuinfo 
复制代码

获得的信息应该是以逻辑核为单位的列表信息。每一个逻辑核的信息包括其归属的物理核ID(core id),以及其归属的物理CPU的ID(physical id)



列出物理CPU及各自的物理核数


cat /proc/cpuinfo | grep -E "physical id|cpu cores" | sed 'N;s/\n/ /' | sort | uniq
复制代码


假设输出以下,则表示有2个物理CPU,第一个CPU有4个物理核,第二个CPU也是4个:


physical id : 0 cpu cores : 4
physical id : 1 cpu cores : 4
复制代码




列出物理CPU及各自的逻辑核数


cat /proc/cpuinfo | grep "physical id" | sort | uniq -c
复制代码


假设输出以下,则表示有两个物理CPU,各自包含8个逻辑核

8 physical id : 0
8 physical id : 1
复制代码





查询CPU类型(虚拟、真实)


cat /proc/cpuinfo后查看model name,


例如:

Intel(R) Xeon(R) CPU E5-2682 v4 @ 2.50GHz 大概表示是真实CPU或者QEMU Virtual CPU version (cpu64-rhel6) 表示虚拟CPU




查询CPU是否支持超线程


  • 物理内核和物理CPU列表展示:两个物理CPU中各存在4个物理内核
physical id : 0 cpu cores : 4
physical id : 1 cpu cores : 4
复制代码
  • 逻辑内核数码,和对应的物理CPU的id
8 physical id : 0
8 physical id : 1
复制代码

能够得出第一个CPU(physical id是0)支持,由于其物理核4个逻辑核却又8个,第二个CPU(id是1)一样也支持。若是物理核和逻辑核的数量相等,不表明不支持,可能没打开超线程技术开关




top命令显示的核数是?


输入top按1能够展现出全部逻辑核,从Cpu0~CpuN,就是说有N+1个逻辑核。

是逻辑核数。


6、Java进程占用CPU超过100% top查看进程的%CPU值,为何会CPU占用率超过100%

由于该进程占用超过一个核,占满2个核就是200%了。




/proc/cpuinfo文件解释


  • model name:是CPU的型号主频一些信息


例如Intel(R) Xeon(R) CPU E5-2682 v4 @ 2.50GHz或者QEMU Virtual CPU version (cpu64-rhel6)应该能大概看得出是虚拟CPU仍是真实的CPU


  • processor:指逻辑核ID,好比0,表示第1个逻辑核,不是零个逻辑核意思
  • physical id:物理CPU的ID,0表示第一个
  • core id:物理核的ID,0表示第一个
  • cpu cores:该物理CPU有多少个物理核
  • siblings该物理CPU有多少个逻辑核跟cpu cores不同表示开启了超线程技术,不然表示不支持该技术或者未开启




指令总结(重点学习,以后可能会用的上哦!)


  • 一、物理CPU数

cat /proc/cpuinfo | grep 'physical id' | uniq |wc -l


uniq是为了去掉多个逻辑核同属于一个物理CPU


  • 二、物理核数(全部CPU)


cat /proc/cpuinfo | grep 'core id' | uniq |wc -l



uniq为了去掉多个逻辑核属于同一个物理核


上述计算方式是计算全部CPU加起来有多少核,并非计算某个CPU有多少核



  • 三、物理核数(某个CPU)

cat /proc/cpuinfo 后查看cpu cores,该值记录了对应的物理CPU(以该条目中的physical id标识)有多少个物理核。

  • 四、逻辑核数(全部CPU)



逻辑核数,有些地方会逻辑CPU数


cat /proc/cpuinfo | grep 'processor' | wc -l


  • 五、逻辑核数(某个CPU)


cat /proc/cpuinfo后查看siblings,该值记录了对应的物理CPU(以该条目中的physical id标识做分组)有多少个逻辑核。


  • 六、查看是否支持超线程


cat /proc/cpuinfo后查看siblings和cpu cores不一致,说明该physical id的CPU支持超线程,若是一致,明不支持超线程,或者超线程未打开。




相关文章
|
3天前
|
存储 设计模式 架构师
编码之道:从技术细节到系统架构的升华
【5月更文挑战第9天】 在编程的世界里,每一行代码都承载着功能与美学的双重使命。本文将探讨如何从关注技术细节出发,逐步深化对系统架构的理解,并在实践中实现从代码编写者到系统设计师的转变。通过分析具体案例,我们将揭示那些看似平凡的技术感悟如何在复杂系统的构建中发挥关键作用,以及这一过程中对软件开发者的启示。
13 3
|
2天前
|
SQL canal 运维
MySQL高可用架构探秘:主从复制剖析、切换策略、延迟优化与架构选型
MySQL高可用架构探秘:主从复制剖析、切换策略、延迟优化与架构选型
|
3天前
|
负载均衡 NoSQL 关系型数据库
深入浅出Redis(六):Redis的主从架构与主从复制原理
深入浅出Redis(六):Redis的主从架构与主从复制原理
|
6天前
|
Kubernetes Cloud Native 持续交付
探索云原生架构的未来:如何优化资源管理和服务部署
【5月更文挑战第6天】 随着云计算的快速发展,云原生技术已成为企业数字化转型的关键驱动力。此篇文章深入探讨了云原生架构的核心组件及其在资源管理和服务部署方面的优化策略。通过分析容器化、微服务及自动化管理的实践案例,本文旨在为读者提供一套系统的方法论,以利用云原生技术实现更高效、灵活且可靠的IT基础设施。
25 2
|
8天前
|
负载均衡 API 数据库
构建高效微服务架构的五大关键技术
【5月更文挑战第4天】 随着云计算和容器化技术的成熟,微服务架构已成为软件开发的主流模式。本文将详细探讨实现高效微服务架构的五个关键技术点:服务拆分策略、API网关设计、服务发现与注册、熔断机制以及分布式事务管理。这些技术点是确保微服务系统可扩展性、灵活性及稳定性的基石,对于后端开发者而言,掌握它们至关重要。文章将提供具体的实施建议和最佳实践,帮助读者构建和维护高性能的微服务系统。
|
11天前
|
设计模式 Cloud Native 算法
拥抱变化:我的技术适应之旅构建未来:云原生架构在企业数字化转型中的关键角色
【4月更文挑战第30天】 在技术的浪潮中,我学会了不仅仅是编码,还有如何与时俱进。本文记录了我从一名初出茅庐的开发者成长为一个能够适应不断变化技术环境的工程师的心路历程。从最初的困惑与挑战到后来的接纳与创新,我意识到,技术能力的提升和心态的转变同样重要。
|
12天前
|
前端开发 JavaScript 安全
【TypeScript技术专栏】TypeScript在微前端架构中的应用
【4月更文挑战第30天】微前端架构通过拆分应用提升开发效率和降低维护成本,TypeScript作为静态类型语言,以其类型安全、代码智能提示和重构支持强化这一架构。在实践中,TypeScript定义公共接口确保跨微前端通信一致性,用于编写微前端以保证代码质量,且能无缝集成到构建流程中。在微前端架构中,TypeScript是保障正确性和可维护性的有力工具。
|
12天前
|
负载均衡 Java 开发者
Spring Cloud:一文读懂其原理与架构
Spring Cloud 是一套微服务解决方案,它整合了Netflix公司的多个开源框架,简化了分布式系统开发。Spring Cloud 提供了服务注册与发现、配置中心、消息总线、负载均衡、熔断机制等工具,让开发者可以快速地构建一些常见的微服务架构。
|
12天前
|
API 开发者 UED
构建高效微服务架构:后端开发的新趋势移动应用与系统:开发与优化的艺术
【4月更文挑战第30天】 随着现代软件系统对可伸缩性、灵活性和敏捷性的日益需求,传统的单体应用架构正逐渐向微服务架构转变。本文将探讨微服务架构的核心概念,分析其优势,并着重讨论如何利用最新的后端技术栈实现一个高效的微服务系统。我们将涵盖设计模式、服务划分、数据一致性、服务发现与注册、API网关以及容器化等关键技术点,为后端开发者提供一份实操指南。 【4月更文挑战第30天】 在数字化时代的浪潮中,移动应用和操作系统的紧密交织已成为日常生活和商业活动的基石。本文将深入探讨移动应用开发的关键技术、跨平台开发工具的选择以及移动操作系统的架构和性能优化策略。通过分析当前移动应用开发的挑战与机遇,我们将
|
12天前
|
存储 算法 Linux
【计算机操作系统】深入探究CPU,PCB和进程工作原理
【计算机操作系统】深入探究CPU,PCB和进程工作原理