The efficiency of different C++ constructs5

简介: The efficiency of different C++ constructs5

浮点计算和运算符


x86架构中有两种浮点计算方法。


  • 原始方法:使用8个浮点寄存器组成寄存器栈(长双精度80位)。优点:精度高,不同精度之间无需额外转换,有浮点计算指令可用;缺点:难以生成寄存器变量,浮点计算较慢,整数和浮点数之间转换效率很低


  • 向量方法:使用8个或16个向量寄存器(XMM或YMM), 优点:可并行计算,寄存器变量容易实现;缺点:不支持长双精度,数学函数必须使用函数库(但通常比硬件指令更快)


XMM向量寄存器在x86 64架构中可用。如果处理器和操作系统支持AVX指令集,则可使用YMM向量寄存器。当XMM可用时,编译器一般用向量方法计算浮点数


根据微处理器的不同,浮点加法需要3 ‐ 6个时钟周期。乘法需要 4 ‐ 8 个时钟周期。除法需要 14 ‐ 45 个时钟周期



枚举


枚举只是隐藏的整数。



布尔值


布尔操作数的顺序


短路逻辑:当&&的左操作数为false时,便不会计算右操作数。同理, ||的做操作数为true时,也不会计算右操作数。因此建议将通常为true的操作数放在&&表达式最后,或||表达式的开头。


布尔变量被过度检查


由于所有以布尔变量作为输入的运算符都要检查输入是否有除0或1之外的值,因此布尔变量会被过度检查。 如果知道 操作数除了 0 就是 1,布尔运算可以变得有效率的多。编译器之所以不这样假设,是因为如果变量是没有被初始化的或者是 来自其它未知来源的。



布尔向量操作


一个整数可被当做布尔向量操作。例如bitmap



指针和引用


指针 vs. 引用


指针和引用的效率是一样的,因为它们实际上做的事情是相同的,区别在于编程风格。

指针的优点:功能上更灵活,可以做指针计算(例如访问缓冲区),当然也更容易出错

引用的优点:语法更简单,也更安全。




效率


最重要的是,需要一个额外的寄存器来保存指针或引用的值,而寄存器是一种稀缺资源,如果没有足够的寄存器,那么指针每次使用时都必须从内存中加载,这会使程序变慢。另一个缺点是指针的值需要几个时钟周期才能访问所指向的变量。也就是说,要读取指针或引用的值,最坏情况下需要访问两次内存。



函数指针


通过函数指针调用函数通常要比直接调用函数多花几个时钟周期 。




成员指针


在简单的情况下,数据成员指针只是存储数据成员相对于对象开头的偏移量,而成员函数指针只是成员函数的地址。




智能指针


使用智能指针的目的是为了确保对象被正确删除,以及在对象不再使用时释放内存 。

通过智能指针访问对象没有额外的成本。 但是,每当创建、删除、复制或从一个函数转移到另一个函数时,都会产生额外的成本。shared_ptr 的这些成本要高于 unique_ptr。




数组


数组是通过在内存中连续存储元素来实现的,没有存储关于数组大小的信息。因此c/c++中数组相比其他语言更快,但也更不安全。


应该按顺序访问多维数组,保证最后一个索引变化最快;当不按顺序索引时,为了使地址的计算更高效,那么除了第一个维度外,所有维度的大小最好是 2 的幂。如果以非顺序访问元素,则对象的大小(以字节为单位)最好为 2 的幂。 上述建议是为了更好利用cpu的data cache



类型转换


signed/unsigned转换


寄存器值不变,只是编译器换了解释方法。因此没有额外的性能成本。



整形类型大小的转换


类型大小转换通常不需要额外的时间


浮点进度转换



当使用浮点寄存器时,浮点、双精度和长双精度之间的转换不需要额外的时间

当用XMM寄存器时,需要 2 到 15个时钟周期(取决于处理器)


因此建议使用向量化时,不要混用浮点类型。



整形转浮点型



将有符号整数转换为浮点数或双精度浮点数需要 4 ‐ 16个时钟周期,这取决于处理器和使用的寄存器类型。无符号整数的转 换需要更长的时间。如果没有溢出的风险,首先将无符号整数转换为有符号整数会更快:



浮点型转化为整形



如果不启用SSE2 或者更新的指令集,浮点数到整数的转换将花费很长的时间。通常,转换需要 50 ‐ 100 个时钟周期


解决方案:避免转化;使用 64位模式或启用SSE2 指令集;使用四舍五入代替截断,并用汇编语言制作一个舍入函数




指针类型转换




指针可以转换为另一种类型的指针。同样,可以将指针转换为整数,也可以将整数转换为指针。值还是那些值,只是换了种解释方法,因此没有任何开销。


重新解释对象



其实就是c++中的reinterpret_cast , 没有任何额外开销

const_cast


const_cast 运算符用于解除 const 对指针的限制 。同上


static_cast


static_cast 运算符的作用与 C 风格的类型转换相同。例如,它用于将 float 转换为 int


reinterpret_cast


同重新解释对象


dynamic_cast


ynamic_cast 运算符用于将指向一个类的指针转换为指向另一个类的指针。它在运行时检查转换是否有效 。dynamic_cast比static_cast更耗时,也更安全。



转换类对象


只有当程序员定义了构造函数、重载赋值运算符或重载类型转换运算符(指定如何进行转换)时,才有可能进行涉及类对象 (而不是指向对象的指针)的转换。构造函数或重载运算符与成员函数的效率是一样的




分支和switch语句


在微处理器做出正确分支预测的情况下,执行分支指令通常需要 0 ‐ 2 个时钟周期。根据处理器的不同,从分支错误预测中恢复 所需的时间大约为 12 ‐ 25 个时钟周期。这被称为分支预测错误的惩罚


for 循环或 while 循环也是一种分支。在每次迭代之后,它决定是重复还是退出循环。 嵌套循环只能在某些处 理器上得到很好的预测。在许多处理器上,包含多个分支的循环并不能很好地被预测


switch 语句也是一种分支,它可以有两个以上的分支。如果 case 标签是遵循每个标签等于前一个标签加 1 的序列,在这 个时候 switch语句的效率是最高的,因为它可以被实现为一个目标跳转表。如果 switch 语带有许多标签值,并且彼此相 差较大,这将是低效的,因为编译器必须将其转换成一个分支树


分支和 switch 语句的数量最好在程序的关键部分控制在较少的水平 。因为分支和函数调用的目标保存在称为分支目标缓冲区的特殊缓存中。如果一个程序中有许多分支或函数调用,那么在分支目标缓冲区中就可能产生竞争。这种竞争的结果是,即使分支具有良好的可预测性,它们也可能被错误地预测



相关文章
|
存储 缓存 编译器
The efficiency of different C++ constructs4
The efficiency of different C++ constructs4
118 0
|
缓存 安全 编译器
The efficiency of different C++ constructs3
The efficiency of different C++ constructs3
151 0
|
存储 缓存 Unix
The efficiency of different C++ constructs2
The efficiency of different C++ constructs2
139 0
|
缓存 编译器 C++
The efficiency of different C++ constructs
The efficiency of different C++ constructs
140 0
|
13天前
|
C++ 芯片
【C++面向对象——类与对象】Computer类(头歌实践教学平台习题)【合集】
声明一个简单的Computer类,含有数据成员芯片(cpu)、内存(ram)、光驱(cdrom)等等,以及两个公有成员函数run、stop。只能在类的内部访问。这是一种数据隐藏的机制,用于保护类的数据不被外部随意修改。根据提示,在右侧编辑器补充代码,平台会对你编写的代码进行测试。成员可以在派生类(继承该类的子类)中访问。成员,在类的外部不能直接访问。可以在类的外部直接访问。为了完成本关任务,你需要掌握。
54 18
|
13天前
|
存储 编译器 数据安全/隐私保护
【C++面向对象——类与对象】CPU类(头歌实践教学平台习题)【合集】
声明一个CPU类,包含等级(rank)、频率(frequency)、电压(voltage)等属性,以及两个公有成员函数run、stop。根据提示,在右侧编辑器补充代码,平台会对你编写的代码进行测试。​ 相关知识 类的声明和使用。 类的声明和对象的声明。 构造函数和析构函数的执行。 一、类的声明和使用 1.类的声明基础 在C++中,类是创建对象的蓝图。类的声明定义了类的成员,包括数据成员(变量)和成员函数(方法)。一个简单的类声明示例如下: classMyClass{ public: int
38 13
|
13天前
|
编译器 数据安全/隐私保护 C++
【C++面向对象——继承与派生】派生类的应用(头歌实践教学平台习题)【合集】
本实验旨在学习类的继承关系、不同继承方式下的访问控制及利用虚基类解决二义性问题。主要内容包括: 1. **类的继承关系基础概念**:介绍继承的定义及声明派生类的语法。 2. **不同继承方式下对基类成员的访问控制**:详细说明`public`、`private`和`protected`继承方式对基类成员的访问权限影响。 3. **利用虚基类解决二义性问题**:解释多继承中可能出现的二义性及其解决方案——虚基类。 实验任务要求从`people`类派生出`student`、`teacher`、`graduate`和`TA`类,添加特定属性并测试这些类的功能。最终通过创建教师和助教实例,验证代码
37 5
|
13天前
|
存储 算法 搜索推荐
【C++面向对象——群体类和群体数据的组织】实现含排序功能的数组类(头歌实践教学平台习题)【合集】
1. **相关排序和查找算法的原理**:介绍直接插入排序、直接选择排序、冒泡排序和顺序查找的基本原理及其实现代码。 2. **C++ 类与成员函数的定义**:讲解如何定义`Array`类,包括类的声明和实现,以及成员函数的定义与调用。 3. **数组作为类的成员变量的处理**:探讨内存管理和正确访问数组元素的方法,确保在类中正确使用动态分配的数组。 4. **函数参数传递与返回值处理**:解释排序和查找函数的参数传递方式及返回值处理,确保函数功能正确实现。 通过掌握这些知识,可以顺利地将排序和查找算法封装到`Array`类中,并进行测试验证。编程要求是在右侧编辑器补充代码以实现三种排序算法
28 5
|
13天前
|
Serverless 编译器 C++
【C++面向对象——类的多态性与虚函数】计算图像面积(头歌实践教学平台习题)【合集】
本任务要求设计一个矩形类、圆形类和图形基类,计算并输出相应图形面积。相关知识点包括纯虚函数和抽象类的使用。 **目录:** - 任务描述 - 相关知识 - 纯虚函数 - 特点 - 使用场景 - 作用 - 注意事项 - 相关概念对比 - 抽象类的使用 - 定义与概念 - 使用场景 - 编程要求 - 测试说明 - 通关代码 - 测试结果 **任务概述:** 1. **图形基类(Shape)**:包含纯虚函数 `void PrintArea()`。 2. **矩形类(Rectangle)**:继承 Shape 类,重写 `Print
33 4
|
13天前
|
设计模式 IDE 编译器
【C++面向对象——类的多态性与虚函数】编写教学游戏:认识动物(头歌实践教学平台习题)【合集】
本项目旨在通过C++编程实现一个教学游戏,帮助小朋友认识动物。程序设计了一个动物园场景,包含Dog、Bird和Frog三种动物。每个动物都有move和shout行为,用于展示其特征。游戏随机挑选10个动物,前5个供学习,后5个用于测试。使用虚函数和多态实现不同动物的行为,确保代码灵活扩展。此外,通过typeid获取对象类型,并利用strstr辅助判断类型。相关头文件如<string>、<cstdlib>等确保程序正常运行。最终,根据小朋友的回答计算得分,提供互动学习体验。 - **任务描述**:编写教学游戏,随机挑选10个动物进行展示与测试。 - **类设计**:基类
26 3