高性能是什么?其本质是什么东东?

简介: 高性能是什么?其本质是什么东东?

高性能涉及的东西有很多,该怎么才能记住呢?

我觉得这是一个很有代表性的问题,相信很多人都有类似的困惑,所以决定写篇文章来好好聊聊这个问题。

确实是这样,当初在准备高性能相关的面试问题时,也是同样的感受,有好多东西啊,该想个什么办法把它们都串起来呢?

计算机运行的本质,或者说程序执行的本质,就是CPU不断取出内存中的指令,然后执行它。

在这个过程中,CPU需要与内存打交道,因为程序指令在这里面;还需要与硬盘、网卡等一些外部设备打交道,存储数据、传输数据。

CPU、内存、外部设备,这三个是计算机最主要的三个东西,所以我们在思考高性能的问题时,围绕这三个东西,就可以把很多技术串起来。


1、让CPU执行指令更快一点


程序是CPU在执行,最容易想到的当然就是让CPU跑的更快一些。这方面主要是涉及硬件技术,跟软件关系不大。

比如提高CPU主频、指令流水线技术、乱序执行、分支预测等等。


2、使用缓存


程序运行经常需要读取和加载数据,当程序经常需要从一个慢速设备读取数据时,性能势必会受到影响。所以,可以先把数据缓存到一个能快速获取的地方,加快数据加载速度,然后选择适当的时机来更新缓存中的数据。

缓存技术在计算机中无处不在,CPU中有存放数据和指令的一二三级缓存,还有存放内存地址翻译的TLB缓存

操作系统中的文件系统管理硬盘数据也使用了页缓存Page Cache。

后端服务为了快速获取数据,使用Redis/Memcache作为内存数据缓存,避免每次都从数据库中查询。

浏览器中为了加快渲染速度,也有前端资源的缓存,避免每次都找网站服务器请求。

网站服务器为了提高响应速度,也有CDN缓存


3、减少CPU被打断次数


CPU在运行过程中不是一直埋头执行程序,它时不时的会被打断,这就是中断。

最典型的就是网络数据包处理,如果在很大网络流量下,网卡每来一个数据包都通过中断告诉CPU,那CPU一天别干活了,烦都要烦死了。

所以Linux内核中的NAPI技术通过轮询网卡,减少中断次数就能显著提高性能。

另外DMA技术通过把数据传输的工作外包出去,解放CPU,也是这一思想的应用。


4、减少内存拷贝


很多时候,程序需要频繁拷贝数据,但拷贝数据的过程时比较耗时的,如果能减少拷贝的次数,无疑会提高程序性能。

比如内存映射、零拷贝技术就属于这一类技术。

另外高性能抓包技术DPDK,让应用程序直接读取网卡,减少数据拷贝也是这种思想的体现。

5、并行与并发


这个思想很直接,一个人干活忙不过来,那就多找几个人一起干。并行与并发的思想同样在计算机领域无处不在。

如CPU的多核技术,超线程技术、单指令多数据技术SIMD等。

多线程技术、NUMA技术、多节点负载均衡技术等。

后端服务开发中的I/O多路复用技术(select/poll/epoll)。


6、减少锁的竞争


前面提到多线程技术,而提到多线程就离不开锁。很多时候,线程在锁的竞争上浪费了太多时间,上下文的切换这些都需要有开销。

所以减少锁的竞争也是提高性能的一种方式,这方面的技术有原子操作、无锁编程等。


7、资源池化技术


很多程序运行启动时就预先分配好资源,而不是在需要的时候才去分配,这也是一种提高性能的方法。最常见的有线程池、内存池


8、减少I/O次数


程序运行的时候经常要从硬盘上读取数据,而这类操作是非常耗时的,如果能减少I/O的次数,合并I/O次数,对性能的提升将是巨大的。

体现这类思想的技术有B+树、SQL批量执行等。


9、良好的数据结构与算法


程序的灵魂是数据结构与算法,前面说了那么多,即便都做到了,但如果你的数据结构和算法设计的一塌糊涂那也是白搭。

良好的数据结构与算法能够从根本上解决高性能的问题。

这方面思想的体现有哈希表、B+树、跳表等。


总结


上面这几个点不是孤立存在的,很多时候都是互相交织在一起的综合应用。比如零拷贝技术,既是减少内存拷贝的思想,也是减少打扰CPU的思想。在I/O多路复用epoll中,既是并发思想体现,也有减少内存拷贝思想的体现。

最后来总结一下,下次回答提高性能可以从四个增加、四个减少、一个良好来展开:

增加CPU速度、增加缓存、增加并行度、增加资源池

减少内存拷贝、减少I/O次数、减少CPU被打断次数、减少锁竞争

良好的数据结构与算法

目录
相关文章
|
Java Windows Cloud Native
阿里巴巴开源 Dragonwell JDK 最新版本 8.1.1-GA 发布
导读:新版本主要有三大变化:同步了 OpenJDK 上游社区 jdk8u222-ga 的最新更新;带来了正式的 feature:G1ElasticHeap;发布了用户期待的 Windows 实验版本 Experimental Windows version。
|
机器学习/深度学习 人工智能 自然语言处理
真实世界的人工智能应用落地——OpenAI篇 ⛵
本文介绍大名鼎鼎的 OpenAI!概述其发展历程,并介绍几款已经实际落地的 AI 应用:GPT3、CLIP、DALL·E 2、Whisper、Codex、ChatGPT。
1746 0
真实世界的人工智能应用落地——OpenAI篇 ⛵
如何从阿里云官方镜像站下载ubuntu并安装
如何从阿里云官方镜像站下载ubuntu并安装
如何从阿里云官方镜像站下载ubuntu并安装
|
中间件 Perl
MQ启动与关闭
MQ启动与关闭
603 0
|
9月前
|
人工智能 并行计算 API
极智AI | 谈谈GPU并行推理的几个方式
大家好,我是极智视界,本文主要聊一下 GPU 并行推理的几个方式。
509 0
|
机器学习/深度学习 存储 弹性计算
阿里云服务器X86计算、ARM计算、GPU/FPGA/ASIC等架构区别及选择参考
在我们选购阿里云服务器的时候,云服务器架构有X86计算、ARM计算、GPU/FPGA/ASIC、弹性裸金属服务器、超级计算集群之分,很多初次接触阿里云服务器的用户并不知道他们之间有何区别,本文来介绍一下阿里云服务器各个架构的特点及适用场景,以供大家了解他们之间的区别,从而对选择哪种架构做一个参考。
1468 2
阿里云服务器X86计算、ARM计算、GPU/FPGA/ASIC等架构区别及选择参考
|
前端开发 JavaScript Linux
宝塔面板超级美化(登录页+后台)
宝塔面板超级美化(登录页+后台)
1106 0
宝塔面板超级美化(登录页+后台)
|
9月前
|
机器学习/深度学习 人工智能 弹性计算
阿里云GPU V100 4卡:高效AI推理的领航者
随着人工智能的发展,AI推理在各种应用中扮演着越来越重要的角色。本文将详细介绍如何利用阿里云GPU产品中的V100 4卡完成高效的AI推理。我们将涵盖什么是AI推理、V100 4卡的产品介绍、程序代码以及具体使用流程,带你一步步了解和应用这一先进的技术。
1037 0
|
存储 Linux
为什么建议使用UUID进行挂载硬盘
为什么建议使用UUID进行挂载硬盘
1226 0

热门文章

最新文章