计算机组成原理(2021最新版)面试知识点集锦（下）

2021-12-08 102

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 计算机组成原理(2021最新版)面试知识点集锦（下）

2 并行优化-阿姆达尔定律

从90s到本世纪初，“面向摩尔定律编程”的套路越来越用不下去了。奔腾4开始，Intel意识到通过提升主频“难”以性能提升。开始推出多核CPU，提升“吞吐率”而非“响应时间”。即通过并行提高性能。

但要使用这种思想，需满足以下条件:

这就引出了阿姆达尔定律（Amdahl’s Law）：

对一个程序优化后，处理器并行运算之后效率提升的情况可用如下公式表示：

优化后的执行时间 = 受优化影响的执行时间/加速倍数+不受影响的执行时间

比如向量点乘，同时计算向量的一小段点积，就是并行提高部分计算性能。但最终还是要在一个人那汇总相加，这部分时间无法并行优化，即不受影响的执行时间。

比如向量

总共需要120ns。这里通过并行4个CPU有了4倍的加速度。那么最终优化后，就有了100/4+20=45ns。

即使增加并行度来提供加速倍数，比如有100个CPU，整个时间也需要100/100+20=21ns，所以并非越多就肯定越快。

3 让性能再次提升

无论是简单提升主频，还是增加CPU核心数，通过并行提升性能，都会遇到瓶颈。

仅靠“堆硬件”，已经不能很好地满足性能。于是，工程师们需要从其他方面开始下功夫。

在“摩尔定律”和“并行计算”之外，在整个计算机组成层面，还有如下：

深度学习，整个计算过程中基本都是向量矩阵计算。所以用GPU替代CPU，大幅度提升了深度学习的模型训练过程，Google不满足GPU性能，还推出了TPU。

现代的工厂里的生产线叫“流水线”。可以把装配iPhone这样的任务拆分成一个个细分的任务，让每个人都只需要处理一道工序，最大化整个工厂的生产效率。

CPU就是一个运算工厂，把CPU指令执行的过程进行拆分，细化运行。

预测下一步而非苦等上一步结果，即提前运算。就像循环访问数组时，你也会猜到下一步会访问数组下一项。比如“分支和冒险”、“局部性原理”。

参考