【优化技术专题】「底层架构原理系列」CPU处理器鲜为人知的那些秘密

简介: 【优化技术专题】「底层架构原理系列」CPU处理器鲜为人知的那些秘密

前提概要


所谓,知彼知己百战不殆,针对于计算机的优化技术来讲,最底层也不过是针对于CPU技术的优化了,但是如果要区优化程序,涉及到CPU的执行能力,那必须要了解CPU的原理和概念以及执行过程等概念,所以小编写了本片的目的就是针对于CPU的相关知识进行讲解,当你对CPU不在陌生的时候,也就是你超神的时候了,哈哈......




CPU相关的知识


本文介绍涉及到的知识点包含,多CPU、物理核、逻辑核、超线程、进程、线程、并发、并行,以及Linux查询CPU和核的信息的方法



易混淆概念


多处理器


认真辨别语境,通常是多CPU的意思;有时多是多逻辑处理器即多核的意思,好像老外常常把一个CPU里有多个核心当成多个CPU来描述。


逻辑处理器


就是逻辑核的意思,Windows 10的中文翻译了这个特别特别容易误解的词,我觉得就是可以理解为内核程序单位。



逻辑CPU


有人用了这个词表示逻辑核的意思,但是用法的根据我保持怀疑,很容易致使误解,由于我会认为,核就是核,CPU就是CPU,为何混为一谈,好像核就是CPU同样缓存。



CPU的一~四级缓存


CPU缓存(Cache Memory)的出现是弥补CPU和主存(主内存,即内存条的)的速度差太大,用于提升效率的,有时可能也叫高速缓存


高速缓存也分了不少层,一到四级,四级不多听但确实是有。一二级是各个核心独有的三级缓存是全部核共享的,四级缓存彷佛是为了解决CPU的集显和CPU的速度差问题(CPU内能够有显卡)。通常CPU商品中只标出了三级缓存,其余都不标注。如图所示:image.png

这里看不到L4 Cache,多是由于只有L1~L3才封装在CPU里。


一样的多个核之间的L1、L2也会有缓存一致性问题,相似多核CPU有一些协议保证多个CPU内部缓存之间一致性的协议(MESI),同一个CPU内部的多核内部的缓存的一致性问题应该也是有方案解决的


物理核、逻辑核和超线程


  • 物理核:是CPU里实实在在封装的物理硬件并发。
  • 逻辑核:利用超线程技术模拟出来的核,通常一个物理核能够虚拟出2个,就是CPU商品标出的线程数,有些资料也叫逻辑CPU数
  • 超线程:HT,Hyper-Threading,超线程技术就是让一个核模拟出两个核的技术性能
  • 物理CPU:即主板上插了多少个的CPU芯片
  • 虚拟CPU:假的、虚拟技术实现的CPU,相似VMWare虚拟机中的CPU



疑惑:


逻辑核彷佛有些时候被翻译成逻辑处理器,而处理器一般被我理解为CPU,因此逻辑核,就是逻辑CPU吗? 但这种翻译真的会有点模糊不清容易形成误解。image.png


线程和核的关系


  • 线程须要核执行,一个核在同一时间只能执行一条线程,这里的核指逻辑核
  • 决定同时执行线程数的是逻辑核
  • 逻辑核心多少个,就能够 “同时” 执行多少线程


总结


n个物理核,通常有2n个逻辑核,若是只能同时运行物理核数个线程(n),那超线程技术模拟出来的核有什么用? 何况不少CPU的商品也不标 “逻辑核数”,用的词是 “线程数”,意思应该就是逻辑核心多少个就能同时运行多少个线程(2n)


x核y线程(y比x大)是什么意思

CPU商品说的2核4线程,指2个物理核,4个逻辑核。4线程就是4个逻辑核的意思



进程和线程


进程是操做系统层面的概念,线程是CPU层面的东西,CPU真正执行的是线程而不是进程进程是是静态的概念,是一些资源的集合,好比进程有本身的内存而线程是动态的概念,进程能够有多个线程,这些线程共享同一份进程的资源多进程,目前多核的状况下,能够作到多个进程同时执行

  • 固然也就能够作到多个线程同时执行。可是单核的CPU没法作到 “同时”执行进程。此外进程是必定有端口号吗? 不必定,没网络暴露的就没有。但是肯定有进程号就对了


并发和并行


并发(concurrency)和并行(parallelism)
复制代码
  • 并行是说物理上的 “同时” 被执行


  • 并发是一种程序设计,可以让多个任务在逻辑上交织执行

并发设计的程序,能够启动n个线程,好比2个,而后交给2个核,这时两个线程就是并行执行的(“同时”);这两个线程也能够被1个核 “交替” 执行。

不少时候,会认为并行就是真的同时执行,而并发就是交替执行,这是通常的理解,可是并发真正含义是指设计的程序容许同时或交替执行,是一种程序设计方案




多CPU 和 单CPU多核


估计是提升计算能力的两个方案,最终选择单CPU多核方案多一点


多CPU估计也有市场,也有些服务器是多CPU的


为何单CPU多核方案更胜一筹,主要是这个方案更好?


  • 多个核心之间通讯不须要走外部的总线,只须要走CPU内部总线,会快得多另外单CPU多核也成本较多CPU低,只须要一套芯片组,一套存储,多核之间经过芯片内部总线进行通讯,共享使用内存
  • 多核CPU缓存一致性协议有MSI、MESI(Illinois Protocol)、MOSI、Synapse、Firefly及 Dragon Protocol等。


多CPU的市场:多CPU适用于大计算量,对速度(时间)不(太)敏感的任务,好比一些工程建模,或者像SATI找外星人这种极端的,跑上几千年都不着急的。



单CPU单核


单CPU单核 跑多线程效率必定下降吗?


不必定:


  • 下降:若是多线程跑的都是CPU密集型任务,有可能会下降效率,由于仅有的一个核被用满了还要被调度来调度去浪费时间
  • 提高:若是多线程跑的都是IO密集型任务,有可能会提升,由于IO比CPU运行慢得多,来回切换线程,让这个核物尽其用。其调度损耗是值得的


举个例子:我有两家店(两个任务),这两家店隔了一条街道,我招了一个工人(一个CPU核),若是打理一家店铺就很忙得不可开交,你还让他打理两家店,来回在两家店跑来跑去,这反而下降了效率。若是这两个店铺都是处理1小时事情以后闲3个小时的,显然让他来回在两家店跑能榨干他的价值,能提升效率。




单CPU多核


常常会听到CPU都普及多核了,编程应该好好利用,其实确实是存在目前的编程没有充分利用多核CPU的性能,不过多是由于多线程的编程比较复杂的缘由。


单CPU多核,对于多线程确实提高做用大。不要钱的话确定是多核比单核CPU好的呀。




Linux中查看CPU和核信息


cat /proc/cpuinfo 
复制代码

获得的信息应该是以逻辑核为单位的列表信息。每一个逻辑核的信息包括其归属的物理核ID(core id),以及其归属的物理CPU的ID(physical id)



列出物理CPU及各自的物理核数


cat /proc/cpuinfo | grep -E "physical id|cpu cores" | sed 'N;s/\n/ /' | sort | uniq
复制代码


假设输出以下,则表示有2个物理CPU,第一个CPU有4个物理核,第二个CPU也是4个:


physical id : 0 cpu cores : 4
physical id : 1 cpu cores : 4
复制代码




列出物理CPU及各自的逻辑核数


cat /proc/cpuinfo | grep "physical id" | sort | uniq -c
复制代码


假设输出以下,则表示有两个物理CPU,各自包含8个逻辑核

8 physical id : 0
8 physical id : 1
复制代码





查询CPU类型(虚拟、真实)


cat /proc/cpuinfo后查看model name,


例如:

Intel(R) Xeon(R) CPU E5-2682 v4 @ 2.50GHz 大概表示是真实CPU或者QEMU Virtual CPU version (cpu64-rhel6) 表示虚拟CPU




查询CPU是否支持超线程


  • 物理内核和物理CPU列表展示:两个物理CPU中各存在4个物理内核
physical id : 0 cpu cores : 4
physical id : 1 cpu cores : 4
复制代码
  • 逻辑内核数码,和对应的物理CPU的id
8 physical id : 0
8 physical id : 1
复制代码

能够得出第一个CPU(physical id是0)支持,由于其物理核4个逻辑核却又8个,第二个CPU(id是1)一样也支持。若是物理核和逻辑核的数量相等,不表明不支持,可能没打开超线程技术开关




top命令显示的核数是?


输入top按1能够展现出全部逻辑核,从Cpu0~CpuN,就是说有N+1个逻辑核。

是逻辑核数。


6、Java进程占用CPU超过100% top查看进程的%CPU值,为何会CPU占用率超过100%

由于该进程占用超过一个核,占满2个核就是200%了。




/proc/cpuinfo文件解释


  • model name:是CPU的型号主频一些信息


例如Intel(R) Xeon(R) CPU E5-2682 v4 @ 2.50GHz或者QEMU Virtual CPU version (cpu64-rhel6)应该能大概看得出是虚拟CPU仍是真实的CPU


  • processor:指逻辑核ID,好比0,表示第1个逻辑核,不是零个逻辑核意思
  • physical id:物理CPU的ID,0表示第一个
  • core id:物理核的ID,0表示第一个
  • cpu cores:该物理CPU有多少个物理核
  • siblings该物理CPU有多少个逻辑核跟cpu cores不同表示开启了超线程技术,不然表示不支持该技术或者未开启




指令总结(重点学习,以后可能会用的上哦!)


  • 一、物理CPU数

cat /proc/cpuinfo | grep 'physical id' | uniq |wc -l


uniq是为了去掉多个逻辑核同属于一个物理CPU


  • 二、物理核数(全部CPU)


cat /proc/cpuinfo | grep 'core id' | uniq |wc -l



uniq为了去掉多个逻辑核属于同一个物理核


上述计算方式是计算全部CPU加起来有多少核,并非计算某个CPU有多少核



  • 三、物理核数(某个CPU)

cat /proc/cpuinfo 后查看cpu cores,该值记录了对应的物理CPU(以该条目中的physical id标识)有多少个物理核。

  • 四、逻辑核数(全部CPU)



逻辑核数,有些地方会逻辑CPU数


cat /proc/cpuinfo | grep 'processor' | wc -l


  • 五、逻辑核数(某个CPU)


cat /proc/cpuinfo后查看siblings,该值记录了对应的物理CPU(以该条目中的physical id标识做分组)有多少个逻辑核。


  • 六、查看是否支持超线程


cat /proc/cpuinfo后查看siblings和cpu cores不一致,说明该physical id的CPU支持超线程,若是一致,明不支持超线程,或者超线程未打开。




相关文章
|
6月前
|
存储 缓存 安全
某鱼电商接口架构深度剖析:从稳定性到高性能的技术密码
某鱼电商接口架构揭秘:分层解耦、安全加固、性能优化三维设计,实现200ms内响应、故障率低于0.1%。详解三层架构、多引擎存储、异步发布、WebSocket通信与全链路防护,助力开发者突破电商接口“三难”困境。
|
7月前
|
存储 弹性计算 网络协议
阿里云服务器ECS通用算力型u2a实例,CPU采用AMD EPYC处理器,睿频最高3.7 GHz
阿里云ECS通用算力型u2a实例搭载AMD EPYC处理器,睿频高达3.7GHz,基于CIPU架构,网络与存储突发带宽最高25Gbps,I/O性能强、延迟低。支持多种云盘及IPv4/IPv6,适用于中小型数据库、APP服务等场景,性价比高,官网价降低9%-22%,是中小企业上云优选。
845 0
|
7月前
|
数据采集 监控 JavaScript
移动端性能监控探索:鸿蒙 NEXT 探针架构与技术实现
阿里云 ARMS 团队倾力打造的鸿蒙 NEXT SDK,为鸿蒙应用提供了业界领先的全链路监控解决方案。这不仅仅是一个 SDK,更是您洞察用户体验、优化应用性能的智能伙伴。
816 69
|
6月前
|
人工智能 自然语言处理 安全
AI助教系统:基于大模型与智能体架构的新一代教育技术引擎
AI助教系统融合大语言模型、教育知识图谱、多模态交互与智能体架构,实现精准学情诊断、个性化辅导与主动教学。支持图文语音输入,本地化部署保障隐私,重构“教、学、评、辅”全链路,推动因材施教落地,助力教育数字化转型。(238字)
1104 23
|
6月前
|
Java Linux 虚拟化
【Docker】(1)Docker的概述与架构,手把手带你安装Docker,云原生路上不可缺少的一门技术!
1. Docker简介 1.1 Docker是什么 为什么docker会出现? 假定您在开发一款平台项目,您的开发环境具有特定的配置。其他开发人员身处的环境配置也各有不同。 您正在开发的应用依赖于您当前的配置且还要依赖于某些配置文件。 您的企业还拥有标准化的测试和生产环境,且具有自身的配置和一系列支持文件。 **要求:**希望尽可能多在本地模拟这些环境而不产生重新创建服务器环境的开销 问题: 要如何确保应用能够在这些环境中运行和通过质量检测? 在部署过程中不出现令人头疼的版本、配置问题 无需重新编写代码和进行故障修复
561 3
|
7月前
|
Cloud Native API 开发者
Gemini 2.5 Flash 技术拆解:从 MoE 架构到阿里云生态落地指南
2025年9月,谷歌Gemini 2.5 Flash发布,性能提升5%、成本降24%,引发行业关注。其MoE架构、百万上下文与“思考”范式,助力阿里云开发者高效构建云原生应用。本文解析技术内核,结合汽车、物流等案例,提供落地指南与避坑建议,展望大模型与流计算融合前景。
833 6
|
7月前
|
存储 缓存 数据挖掘
阿里云轻量应用服务器“CPU优化型”配置介绍、费用价格说明
阿里云轻量应用服务器推出CPU优化型,提供更强计算性能,2核4GB起,最高16核64GB,全系支持200Mbps带宽。适用于企业级应用、数据库、游戏服务器等高算力场景,保障稳定高效运行。
818 1
|
7月前
|
JSON 供应链 监控
1688商品详情API技术深度解析:从接口架构到数据融合实战
1688商品详情API(item_get接口)可通过商品ID获取标题、价格、库存、SKU等核心数据,适用于价格监控、供应链管理等场景。支持JSON格式返回,需企业认证。Python示例展示如何调用接口获取商品信息。

热门文章

最新文章

下一篇
开通oss服务