性能基础之CPU、物理核、逻辑核概念与关系

简介: 性能测试中当我们尝试使用 Linux 命令(如 nproc 或 lscpu )了解服务器CPU架构和性能参数时,我们经常发现我们无法正确解释其结果,因为我们混淆CPU、物理核、逻辑核概念等术语。

引言

性能测试中当我们尝试使用 Linux 命令(如 nproc 或 lscpu )了解服务器CPU架构和性能参数时,我们经常发现我们无法正确解释其结果,因为我们混淆CPU、物理核、逻辑核概念等术语。

基础概念

  • CPU(Central Processing Unit): 中央处理单元,CPU不等于物理核,更不等于逻辑核。
  • 物理核(physical core/processor): 可以看的到的,真实的cpu核,有独立的电路元件以及L1,L2缓存,可以独立地执行指令。
  • 逻辑核(logical core/processor,LCPU): 在同一个物理核内,逻辑层面的核。(比喻,像动画片一样,我们看到的“动画”,其实是一帧一帧静态的画面,24帧/s连起来就骗过了人类的眼睛,看起来像动起来一样。逻辑核也一样,物理核通过高速运算,让应用程序以为有两个cpu在运算)。
  • 超线程(Hyper-threading, HT):超线程可以在一个逻辑核等待指令执行的间隔(等待从cache或内存中获取下一条指令),把时间片分配到另一个逻辑核。高速在这两个逻辑核之间切换,让应用程序感知不到这个间隔,误认为自己是独占了一个核。

关系: 一个CPU可以有多个物理核。如果开启了超线程,一个物理核可以分成n个逻辑核,n为超线程的数量。

起源:单核CPU和超线程

在多核,虚拟或逻辑cpu之类的概念之前,在奔腾处理器时代,大多数计算机安装在他们的主板上的单个芯片相当大,我们称之为微处理器、处理器或简称CPU。只有少数企业计算机或需要更多处理能力的大型服务器可以在同一块板上安装2个或更多这些芯片:它们是多处理器系统。
这些芯片通过连接器或插槽与其他主板元件通信。
计算很简单:这么多连接器或插槽有一主板,一台电脑最多只能有这么多cpu。如果你想要更多的处理能力,你只需要寻找一个拥有更多处理器的板,或者等待它们的发展来提供更高的性能。

但随后英特尔意识到多处理器系统的不同处理器之间的通信效率非常低,因为它们必须通过系统总线完成,而系统总线通常以低得多的速度工作。这通常导致出现瓶颈,使得无法充分利用每个CPU提供的计算能力。
在这里插入图片描述
为了改善这种情况,开发了超线程技术(HT)。HT是关于在相同的芯片中复制一些CPU内部组件,例如寄存器或一级缓存,以便在两个不同的执行线程之间共享信息,而不必通过具有相应瓶颈和速度损失问题的系统总线。这也允许如果一个进程必须等待中断,另一个进程可以继续使用CPU而不停止它。
这样就有可能加快数个计算过程,并开始提供比传统处理器性能更好的处理器。操作系统被欺骗了,因为它被提供了两个虚拟或逻辑cpu (LCPU),而不是单个cpu,因为它被允许“同时”执行两个进程。但是值得注意的是,不可能产生传统处理器两倍的处理能力,也不可能提供完全的并行处理能力。
因此,从Linux或其他操作系统的角度来看,一个只有一个核心处理器但HT的机器就像有两个cpu一样出现在我们眼前。但是这是在同一个物理cpu中运行的两个逻辑cpu。

还有一个转折点:多核架构的出现

但正如在上一节所述,尽管具有超线程的CPU提供了更多的处理能力,但它们无法作为2个完整且独立的处理器运行,因此决定进一步小型化所有处理器组件并将它们封装在单个芯片中 。这些封装处理器中的每一个都称为核心,它允许通过共享相同芯片的内部总线实现它们之间更快的通信。从那一刻起,不再需要转向系统总线,速度要慢得多。
在这里插入图片描述
与 HT 技术不同,现在我们有多个完全独立的 CPU 用于所有意图和目的,每个核心一个。实际上,从性能的角度来看,拥有单个多核处理器比在同一块板上的同等数量的单核 CPU 更好。当然,拥有2个双核处理器仍然比单核处理器更好,但更好的是拥有一个四核处理器。

在操作系统级别,物理四核处理器将显示为4 cpu计算机。但这些将是4个逻辑CPU或非物理LCPU。如果处理器另外提供超线程技术,那么诸如 top 之类的命令将指示系统中有8个cpu,但是在没有超线程的情况下单个八核处理器性能高于8个Lcpu。

1 LCPU = 1个线程

最后,通常我们会发现具有4个线程的处理器,每个核心2个线程以及类似的东西。这只是可以同时运行的执行线程或处理作业的数量,这相当于 LCPU 提供的处理能力。如果处理器允许每个核2个线程,则意味着它是 HT 。否则,匹配线程的内核数量是正常的。

在这里插入图片描述

逻辑CPU与虚拟CPU

虚拟CPU术语与逻辑CPU相当,但它增加了一定的细微差别:它在计算虚拟化方面更加框架化。它指的是从底层主机硬件映射到虚拟机的那些cpus,可以是物理或逻辑cpus,HT。通常,来自主机服务器的1个逻辑cpu映射到虚拟机内的1个虚拟cpu,因此它们几乎是类似的术语。

如何知道Linux系统有多少核心和处理器?

查看Linux上存在的处理器数量的最简单和最短的方法,因为它是coreutils 的一部分而被广泛扩展:

~$ nproc --all
8

另一种获得相同结果的方法是lscpu命令,它也允许我们从处理器获取额外信息:

~$ lscpu | grep 'CPU(s)'
CPU(s):                8
On-line CPU(s) list:   0-7
NUMA node0 CPU(s):     0-7

或者我们可以查询/proc filesystem中的cpuinfo文件:

〜$ grep processor / proc / cpuinfo | wc - l
 8

/pro /cpuinfo文件中有关于这些处理器的许多其他详细信息,包括CPU型号和内核数

~$ cat /proc/cpuinfo | grep "model name"
model name    : Intel(R) Xeon(R) CPU           E5520  @ 2.27GHz
model name    : Intel(R) Xeon(R) CPU           E5520  @ 2.27GHz
~$ cat /proc/cpuinfo | grep "cpu cores"
cpu cores    : 4
cpu cores    : 4

如上,我们示例中的机器有2个处理器,每个处理器有4个核心。

由于HyperThreading技术和其他处理器增强功能,我们可能需要区分物理CPU和逻辑CPU:

# 获取逻辑cpu数量(包括超线程逻辑cpu数量):
~$ lscpu -p | egrep -v '^#' | wc -l
4

# 获得物理cpu/核心的数量:
~$ lscpu -p | egrep -v '^#' | sort -u -t, -k 2,4 | wc -l
8

我们也可以使用其他工具来获取硬件信息,比如dmidecode,但是我们需要root权限:

~# dmidecode -t 4 | egrep 'Socket Designation|Count'
        Socket Designation: CPUSocket
        Core Count: 8
        Thread Count: 8

如果运行上述命令,您会发现系统中存在多个CPU或多个内核,您还需要确保当前的Linux内核具有多处理器支持(SMP,Symmetric MultiProcessing):

$ uname -a
Linux 7dgroup2 3.10.0-514.6.2.el7.x86_64 #1 SMP Thu Feb 23 03:04:39 UTC 2017 x86_64 x86_64 x86_64 GNU/Linux

最后,我们来看下查看cpu参数的命令

$ lscpu
Architecture:          x86_64  #架构 
CPU op-mode(s):        32-bit, 64-bit #运行方式
Byte Order:            Little Endian  #字节顺序
CPU(s):                2  #逻辑cpu颗数 
On-line CPU(s) list:   0,1  #在线CPU
Thread(s) per core:    2  #每个核心线程
Core(s) per socket:    1  #每个cpu插槽核数/每颗物理cpu核数 
Socket(s):             1  #cpu插槽数 
NUMA node(s):          1  #非统一内存访问节点
Vendor ID:             GenuineIntel  #cpu厂商ID 
CPU family:            6   #cpu系列 
Model:                 63  #型号编号
Model name:            Intel(R) Xeon(R) CPU E5-2680 v3 @ 2.50GHz #型号名称
Stepping:              2  #步进
CPU MHz:               2494.222  #cpu主频 
BogoMIPS:              4988.44
Hypervisor vendor:     KVM  #虚拟化架构
Virtualization type:   full  #cpu支持的虚拟化技术 
L1d cache:             32K  #一级缓存(具体为L1数据缓存) 
L1i cache:             32K  #一级缓存(具体为L1指令缓存) 
L2 cache:              256K #二级缓存
L3 cache:              30720K #三级缓存
NUMA node0 CPU(s):     0,1
目录
相关文章
|
5月前
|
算法 编译器
【计算机架构】响应时间和吞吐量 | 相对性能 | 计算 CPU 时间 | 指令技术与 CPI | T=CC/CR, CC=IC*CPI
【计算机架构】响应时间和吞吐量 | 相对性能 | 计算 CPU 时间 | 指令技术与 CPI | T=CC/CR, CC=IC*CPI
269 0
|
6月前
|
SQL Java 数据库连接
联表查询 && 索引 && 事务 && JDBC使用 &&CPU工作原理 && 线程概念 && Thread类的用法
联表查询 && 索引 && 事务 && JDBC使用 &&CPU工作原理 && 线程概念 && Thread类的用法
135 0
|
1月前
|
存储 缓存 并行计算
【软件设计师备考 专题 】CPU和存储器的组成、性能和基本工作原理
【软件设计师备考 专题 】CPU和存储器的组成、性能和基本工作原理
56 0
|
1月前
|
弹性计算 数据挖掘 大数据
阿里云4核8G云服务器怎么样?2024年阿里云4核8G云服务器测评:价格配置、CPU性能
在数字化时代,数据成为驱动业务发展的核心力量。因此,无论是个人站长还是企业用户,都对云服务器的性能和价格提出了更高要求。阿里云作为国内云服务市场的领军者,始终致力于为用户提供卓越性能和极具竞争力的价格。阿里云4核8G通用算力型u1实例云服务器ECS备受瞩目。这款服务器凭借强大的4核CPU和8GB内存,能够轻松应对搭建网站、应用服务器以及进行数据分析和计算等多重任务。而其年度价格仅为955.58元,换算下来每月仅需80元,这一价格无疑在同类产品中极具竞争力。对于那些寻求高性能服务器以支持业务发展的用户来说,阿里云这款4核8G服务器无疑是一个理想选择。它不仅提供了出色的性能,还通过优惠活动大大降低
70 0
|
2月前
|
安全 机器人
ABB PLC自动化可编程逻辑控制器PLC AC500型 CPU
ABB PLC自动化可编程逻辑控制器PLC AC500型 CPU
|
6月前
|
监控 数据挖掘 虚拟化
VMWare 虚拟机 CPU 设置里针对 CPU 的 虚拟化 CPU 性能计数器(U) 选项功能介绍
VMWare 虚拟机 CPU 设置里针对 CPU 的 虚拟化 CPU 性能计数器(U) 选项功能介绍
553 0
|
5月前
|
Java 测试技术 BI
一文告诉你CPU分支预测对性能影响有多大
CPU分支预测本身是为了提升流水线下避免流水线等待的手段,其实本质上是利用了局部性原理,因为局部性的存在,大多数情况下这个技术本身给性能带来的是正向的(要不然它今天也不会存在了),所以我们大多数情况下都不需要关注它的存在,还是放心大胆的写代码吧,不要因为我们这篇博客就把所有的if改成?:三目运算,可能对代码可读性的影响远大于性能提升的收益。再次强调下,我今天只是构造了一个极端的数据来验证其性能差异,因为局部性的存在大多数情况下分支预测都是对的。
57 0
|
7月前
|
存储 弹性计算 运维
阿里云经济型e系列云服务器详细介绍_CPU性能_使用
阿里云经济型e系列云服务器详细介绍_CPU性能_使用,阿里云服务器ECS推出经济型e系列,经济型e实例是阿里云面向个人开发者、学生、小微企业,在中小型网站建设、开发测试、轻量级应用等场景推出的全新入门级云服务器,CPU采用Intel Xeon Platinum架构处理器
486 0
|
7月前
百度搜索:蓝易云【云服务器vCPU与物理CPU关系?】
云服务器中的vCPU(虚拟中央处理器)是在物理服务器的CPU上运行的虚拟处理器。在云服务器中,一台物理服务器通常可以运行多个虚拟机实例,每个实例都有自己的vCPU。
86 0
|
8月前
|
存储 弹性计算 缓存
阿里云服务器u1性能如何?CPU主频、内存、存储及带宽说明
阿里云服务器u1性能如何?CPU主频、内存、存储及带宽说明
208 0