高性能是什么?其本质是什么东东?

简介: 高性能是什么?其本质是什么东东?

高性能涉及的东西有很多,该怎么才能记住呢?

我觉得这是一个很有代表性的问题,相信很多人都有类似的困惑,所以决定写篇文章来好好聊聊这个问题。

确实是这样,当初在准备高性能相关的面试问题时,也是同样的感受,有好多东西啊,该想个什么办法把它们都串起来呢?

计算机运行的本质,或者说程序执行的本质,就是CPU不断取出内存中的指令,然后执行它。

在这个过程中,CPU需要与内存打交道,因为程序指令在这里面;还需要与硬盘、网卡等一些外部设备打交道,存储数据、传输数据。

CPU、内存、外部设备,这三个是计算机最主要的三个东西,所以我们在思考高性能的问题时,围绕这三个东西,就可以把很多技术串起来。


1、让CPU执行指令更快一点


程序是CPU在执行,最容易想到的当然就是让CPU跑的更快一些。这方面主要是涉及硬件技术,跟软件关系不大。

比如提高CPU主频、指令流水线技术、乱序执行、分支预测等等。


2、使用缓存


程序运行经常需要读取和加载数据,当程序经常需要从一个慢速设备读取数据时,性能势必会受到影响。所以,可以先把数据缓存到一个能快速获取的地方,加快数据加载速度,然后选择适当的时机来更新缓存中的数据。

缓存技术在计算机中无处不在,CPU中有存放数据和指令的一二三级缓存,还有存放内存地址翻译的TLB缓存

操作系统中的文件系统管理硬盘数据也使用了页缓存Page Cache。

后端服务为了快速获取数据,使用Redis/Memcache作为内存数据缓存,避免每次都从数据库中查询。

浏览器中为了加快渲染速度,也有前端资源的缓存,避免每次都找网站服务器请求。

网站服务器为了提高响应速度,也有CDN缓存


3、减少CPU被打断次数


CPU在运行过程中不是一直埋头执行程序,它时不时的会被打断,这就是中断。

最典型的就是网络数据包处理,如果在很大网络流量下,网卡每来一个数据包都通过中断告诉CPU,那CPU一天别干活了,烦都要烦死了。

所以Linux内核中的NAPI技术通过轮询网卡,减少中断次数就能显著提高性能。

另外DMA技术通过把数据传输的工作外包出去,解放CPU,也是这一思想的应用。


4、减少内存拷贝


很多时候,程序需要频繁拷贝数据,但拷贝数据的过程时比较耗时的,如果能减少拷贝的次数,无疑会提高程序性能。

比如内存映射、零拷贝技术就属于这一类技术。

另外高性能抓包技术DPDK,让应用程序直接读取网卡,减少数据拷贝也是这种思想的体现。

5、并行与并发


这个思想很直接,一个人干活忙不过来,那就多找几个人一起干。并行与并发的思想同样在计算机领域无处不在。

如CPU的多核技术,超线程技术、单指令多数据技术SIMD等。

多线程技术、NUMA技术、多节点负载均衡技术等。

后端服务开发中的I/O多路复用技术(select/poll/epoll)。


6、减少锁的竞争


前面提到多线程技术,而提到多线程就离不开锁。很多时候,线程在锁的竞争上浪费了太多时间,上下文的切换这些都需要有开销。

所以减少锁的竞争也是提高性能的一种方式,这方面的技术有原子操作、无锁编程等。


7、资源池化技术


很多程序运行启动时就预先分配好资源,而不是在需要的时候才去分配,这也是一种提高性能的方法。最常见的有线程池、内存池


8、减少I/O次数


程序运行的时候经常要从硬盘上读取数据,而这类操作是非常耗时的,如果能减少I/O的次数,合并I/O次数,对性能的提升将是巨大的。

体现这类思想的技术有B+树、SQL批量执行等。


9、良好的数据结构与算法


程序的灵魂是数据结构与算法,前面说了那么多,即便都做到了,但如果你的数据结构和算法设计的一塌糊涂那也是白搭。

良好的数据结构与算法能够从根本上解决高性能的问题。

这方面思想的体现有哈希表、B+树、跳表等。


总结


上面这几个点不是孤立存在的,很多时候都是互相交织在一起的综合应用。比如零拷贝技术,既是减少内存拷贝的思想,也是减少打扰CPU的思想。在I/O多路复用epoll中,既是并发思想体现,也有减少内存拷贝思想的体现。

最后来总结一下,下次回答提高性能可以从四个增加、四个减少、一个良好来展开:

增加CPU速度、增加缓存、增加并行度、增加资源池

减少内存拷贝、减少I/O次数、减少CPU被打断次数、减少锁竞争

良好的数据结构与算法

目录
相关文章
|
3月前
|
消息中间件 Java 中间件
高性能RockerMQ(一)
高性能RockerMQ(一)
|
6月前
|
消息中间件 缓存 Java
高性能架构设计
高性能架构设计
109 5
|
存储 缓存 文件存储
高性能场景下的云存储
高性能场景下的云存储
59 1
|
7月前
|
存储 对象存储 块存储
高性能数据存储有哪些方式
高性能数据存储有哪些方式
161 0
|
存储 缓存 算法
分布式数据库架构:高可用、高性能的数据存储
分布式数据库架构:高可用、高性能的数据存储
1034 0
|
存储 缓存 NoSQL
互联网开发高可用高性能那点事
互联网开发高可用高性能那点事
|
存储 移动开发 负载均衡
大厂如何打造可扩展的高并发系统?
高可扩展性是个设计指标:表示可通过加机器线性提高系统处理能力,承担更高流量和并发。 架构设计之初,为什么不预先考虑好使用多少台机器,支持现有并发呢?因为峰值流量不可控。
151 0
|
算法 NoSQL 数据库
如何设计一款“高可用高性能”的发号器?
在分布式场景中,很多地方需要生成全局唯一的id,如数据库分库分表后需要用唯一id代替单机版本的自增id。发号器的基本要求是 全局唯一,无论如何都不能重复 某些场景下还要求单调递增,如排序需求等。
416 0
如何设计一款“高可用高性能”的发号器?
|
弹性计算 编解码 负载均衡
如何构建一套高性能、高可用性、低成本的视频处理系统?
基于函数计算和 Serverless 工作流的弹性高可用视频处理架构,充分体现了云原生时代 Serverless 化思想,以事件驱动的形式触发函数执行,真实计算资源真正意义上的按需使用。对于使用而言,这套方案在保证业务灵活度的同时,可以显著降低维护成本与资源成本,并大幅度的缩短项目交付时间。
5040 9
如何构建一套高性能、高可用性、低成本的视频处理系统?