面试必备基本知识HTTPS 原理分析

本文涉及的产品
密钥管理服务KMS,1000个密钥,100个凭据,1个月
简介: 随着 HTTPS 建站的成本下降,现在大部分的网站都已经开始用上 HTTPS 协议。大家都知道 HTTPS 比 HTTP 安全,也听说过与 HTTPS 协议相关的概念有 SSL 、非对称加密、 CA证书等,但对于以下灵魂三拷问可能就答不上了:1.为什么用了 HTTPS 就是安全的?2.HTTPS 的底层原理如何实现?3.用了 HTTPS 就一定安全吗?本文将层层深入,从原理上把 HTTPS 的安全性讲透。

 # HTTPS

随着 HTTPS 建站的成本下降,现在大部分的网站都已经开始用上 HTTPS 协议。大家都知道 HTTPS 比 HTTP 安全,也听说过与 HTTPS 协议相关的概念有 SSL 、非对称加密、 CA证书等,但对于以下灵魂三拷问可能就答不上了:

1.为什么用了 HTTPS 就是安全的?

2.HTTPS 的底层原理如何实现?

3.用了 HTTPS 就一定安全吗?

本文将层层深入,从原理上把 HTTPS 的安全性讲透。

# HTTPS 的实现原理

大家可能都听说过 HTTPS 协议之所以是安全的是因为 HTTPS 协议会对传输的数据进行加密,而加密过程是使用了非对称加密实现。但其实,HTTPS 在内容传输的加密上使用的是对称加密,非对称加密只作用在证书验证阶段。

HTTPS的整体过程分为证书验证和数据传输阶段,具体的交互过程如下:

image.gif编辑

① 证书验证阶段

    1. 浏览器发起 HTTPS 请求
    2. 服务端返回 HTTPS 证书
    3. 客户端验证证书是否合法,如果不合法则提示告警

    ② 数据传输阶段

    1.当证书验证合法后,在本地生成随机数

    2.通过公钥加密随机数,并把加密后的随机数传输到服务端

    3.服务端通过私钥对随机数进行解密

    4.服务端通过客户端传入的随机数构造对称加密算法,对返回结果内容进行加密后传输

    # 为什么数据传输是用对称加密?

    首先,非对称加密的加解密效率是非常低的,而 http 的应用场景中通常端与端之间存在大量的交互,非对称加密的效率是无法接受的;

    另外,在 HTTPS 的场景中只有服务端保存了私钥,一对公私钥只能实现单向的加解密,所以 HTTPS 中内容传输加密采取的是对称加密,而不是非对称加密。

    # 为什么需要 CA 认证机构颁发证书?

    HTTP 协议被认为不安全是因为传输过程容易被监听者勾线监听、伪造服务器,而 HTTPS 协议主要解决的便是网络传输的安全性问题。

    首先我们假设不存在认证机构,任何人都可以制作证书,这带来的安全风险便是经典的“中间人攻击”问题。

    “中间人攻击”的具体过程如下:

    image.gif编辑

    过程原理:

    1.本地请求被劫持(如DNS劫持等),所有请求均发送到中间人的服务器

    2.中间人服务器返回中间人自己的证书

    3.客户端创建随机数,通过中间人证书的公钥对随机数加密后传送给中间人,然后凭随机数构造对称加密对传输内容进行加密传输

    4.中间人因为拥有客户端的随机数,可以通过对称加密算法进行内容解密

    5.中间人以客户端的请求内容再向正规网站发起请求

    6.因为中间人与服务器的通信过程是合法的,正规网站通过建立的安全通道返回加密后的数据

    7.中间人凭借与正规网站建立的对称加密算法对内容进行解密

    8.中间人通过与客户端建立的对称加密算法对正规内容返回的数据进行加密传输

    9.客户端通过与中间人建立的对称加密算法对返回结果数据进行解密

    由于缺少对证书的验证,所以客户端虽然发起的是 HTTPS 请求,但客户端完全不知道自己的网络已被拦截,传输内容被中间人全部窃取。

    # 浏览器是如何确保 CA 证书的合法性?

    1. 证书包含什么信息?

      • 颁发机构信息
      • 公钥
      • 公司信息
      • 域名
      • 有效期
      • 指纹
      • ......

      2. 证书的合法性依据是什么?

      首先,权威机构是要有认证的,不是随便一个机构都有资格颁发证书,不然也不叫做权威机构。另外,证书的可信性基于信任制,权威机构需要对其颁发的证书进行信用背书,只要是权威机构生成的证书,我们就认为是合法的。所以权威机构会对申请者的信息进行审核,不同等级的权威机构对审核的要求也不一样,于是证书也分为免费的、便宜的和贵的。

      3. 浏览器如何验证证书的合法性?

      浏览器发起 HTTPS 请求时,服务器会返回网站的 SSL 证书,浏览器需要对证书做以下验证:

      1.验证域名、有效期等信息是否正确。证书上都有包含这些信息,比较容易完成验证;

      2.判断证书来源是否合法。每份签发证书都可以根据验证链查找到对应的根证书,操作系统、浏览器会在本地存储权威机构的根证书,利用本地根证书可以对对应机构签发证书完成来源验证;

      image.gif编辑

      3.判断证书是否被篡改。需要与 CA 服务器进行校验;

      4.判断证书是否已吊销。通过CRL(Certificate Revocation List 证书注销列表)和 OCSP(Online Certificate Status Protocol 在线证书状态协议)实现,其中 OCSP 可用于第3步中以减少与 CA 服务器的交互,提高验证效率

      以上任意一步都满足的情况下浏览器才认为证书是合法的。

      这里插一个我想了很久的但其实答案很简单的问题:

      既然证书是公开的,如果要发起中间人攻击,我在官网上下载一份证书作为我的服务器证书,那客户端肯定会认同这个证书是合法的,如何避免这种证书冒用的情况?

      其实这就是非加密对称中公私钥的用处,虽然中间人可以得到证书,但私钥是无法获取的,一份公钥是不可能推算出其对应的私钥,中间人即使拿到证书也无法伪装成合法服务端,因为无法对客户端传入的加密数据进行解密。

      4. 只有认证机构可以生成证书吗?

      如果需要浏览器不提示安全风险,那只能使用认证机构签发的证书。但浏览器通常只是提示安全风险,并不限制网站不能访问,所以从技术上谁都可以生成证书,只要有证书就可以完成网站的 HTTPS 传输。例如早期的 12306 采用的便是手动安装私有证书的形式实现 HTTPS 访问。

      image.gif编辑

      # 本地随机数被窃取怎么办?

      证书验证是采用非对称加密实现,但是传输过程是采用对称加密,而其中对称加密算法中重要的随机数是由本地生成并且存储于本地的,HTTPS 如何保证随机数不会被窃取?

      其实 HTTPS 并不包含对随机数的安全保证,HTTPS 保证的只是传输过程安全,而随机数存储于本地,本地的安全属于另一安全范畴,应对的措施有安装杀毒软件、反木马、浏览器升级修复漏洞等。

      # 用了 HTTPS 会被抓包吗?

      HTTPS 的数据是加密的,常规下抓包工具代理请求后抓到的包内容是加密状态,无法直接查看。

      但是,正如前文所说,浏览器只会提示安全风险,如果用户授权仍然可以继续访问网站,完成请求。因此,只要客户端是我们自己的终端,我们授权的情况下,便可以组建中间人网络,而抓包工具便是作为中间人的代理。通常 HTTPS 抓包工具的使用方法是会生成一个证书,用户需要手动把证书安装到客户端中,然后终端发起的所有请求通过该证书完成与抓包工具的交互,然后抓包工具再转发请求到服务器,最后把服务器返回的结果在控制台输出后再返回给终端,从而完成整个请求的闭环。

      既然 HTTPS 不能防抓包,那 HTTPS 有什么意义?

      A: 客户端发起 HTTPS 请求,服务端返回证书,客户端对证书进行验证,验证通过后本地生成用于改造对称加密算法的随机数,通过证书中的公钥对随机数进行加密传输到服务端,服务端接收后通过私钥解密得到随机数,之后的数据交互通过对称加密算法进行加解密。

      Q: 为什么需要证书?

      A: 防止”中间人“攻击,同时可以为网站提供身份证明。

      Q: 使用 HTTPS 会被抓包吗?

      A: 会被抓包,HTTPS 只防止用户在不知情的情况下通信被监听,如果用户主动授信,是可以构建“中间人”网络,代理软件可以对传输内容进行解密。

      相关文章
      |
      2月前
      |
      消息中间件 存储 缓存
      大厂面试高频:Kafka 工作原理 ( 详细图解 )
      本文详细解析了 Kafka 的核心架构和实现原理,消息中间件是亿级互联网架构的基石,大厂面试高频,非常重要,建议收藏。关注【mikechen的互联网架构】,10年+BAT架构经验倾囊相授。
      大厂面试高频:Kafka 工作原理 ( 详细图解 )
      |
      1月前
      |
      存储 SQL 关系型数据库
      MySQL进阶突击系列(03) MySQL架构原理solo九魂17环连问 | 给大厂面试官的一封信
      本文介绍了MySQL架构原理、存储引擎和索引的相关知识点,涵盖查询和更新SQL的执行过程、MySQL各组件的作用、存储引擎的类型及特性、索引的建立和使用原则,以及二叉树、平衡二叉树和B树的区别。通过这些内容,帮助读者深入了解MySQL的工作机制,提高数据库管理和优化能力。
      |
      2月前
      |
      安全 算法 网络安全
      HTTPS原理
      HTTPS 通过加密、数字证书、握手过程等多种手段,确保了网络通信的安全和可靠。它为用户提供了更高级别的隐私保护和数据安全,是现代互联网中重要的安全保障机制。随着网络安全威胁的不断增加,HTTPS 的应用也越来越广泛,成为保障网络安全的重要基石。
      134 70
      |
      6天前
      |
      Java Linux 调度
      硬核揭秘:线程与进程的底层原理,面试高分必备!
      嘿,大家好!我是小米,29岁的技术爱好者。今天来聊聊线程和进程的区别。进程是操作系统中运行的程序实例,有独立内存空间;线程是进程内的最小执行单元,共享内存。创建进程开销大但更安全,线程轻量高效但易引发数据竞争。面试时可强调:进程是资源分配单位,线程是CPU调度单位。根据不同场景选择合适的并发模型,如高并发用线程池。希望这篇文章能帮你更好地理解并回答面试中的相关问题,祝你早日拿下心仪的offer!
      25 6
      |
      27天前
      |
      Java 数据库连接 Maven
      最新版 | 深入剖析SpringBoot3源码——分析自动装配原理(面试常考)
      自动装配是现在面试中常考的一道面试题。本文基于最新的 SpringBoot 3.3.3 版本的源码来分析自动装配的原理,并在文未说明了SpringBoot2和SpringBoot3的自动装配源码中区别,以及面试回答的拿分核心话术。
      最新版 | 深入剖析SpringBoot3源码——分析自动装配原理(面试常考)
      |
      26天前
      |
      安全 算法 网络协议
      【网络原理】——图解HTTPS如何加密(通俗简单易懂)
      HTTPS加密过程,明文,密文,密钥,对称加密,非对称加密,公钥和私钥,证书加密
      |
      28天前
      |
      网络协议 安全 网络安全
      探索网络模型与协议:从OSI到HTTPs的原理解析
      OSI七层网络模型和TCP/IP四层模型是理解和设计计算机网络的框架。OSI模型包括物理层、数据链路层、网络层、传输层、会话层、表示层和应用层,而TCP/IP模型则简化为链路层、网络层、传输层和 HTTPS协议基于HTTP并通过TLS/SSL加密数据,确保安全传输。其连接过程涉及TCP三次握手、SSL证书验证、对称密钥交换等步骤,以保障通信的安全性和完整性。数字信封技术使用非对称加密和数字证书确保数据的机密性和身份认证。 浏览器通过Https访问网站的过程包括输入网址、DNS解析、建立TCP连接、发送HTTPS请求、接收响应、验证证书和解析网页内容等步骤,确保用户与服务器之间的安全通信。
      103 1
      |
      2月前
      |
      安全 算法 网络协议
      网易面试:说说 HTTPS 原理?HTTPS 如何保证 数据安全?
      45岁老架构师尼恩在其读者交流群中分享了关于HTTP与HTTPS的深入解析,特别针对近期面试中常问的HTTPS相关问题进行了详细解答。文章首先回顾了HTTP的工作原理,指出了HTTP明文传输带来的三大风险:窃听、篡改和冒充。随后介绍了HTTPS如何通过结合非对称加密和对称加密来解决这些问题,确保数据传输的安全性。尼恩还详细解释了HTTPS的握手过程,包括如何通过CA数字证书验证服务器身份,防止中间人攻击。最后,尼恩强调了掌握这些核心技术的重要性,并推荐了自己的技术资料,帮助读者更好地准备面试,提高技术水平。
      |
      5月前
      |
      存储 Java
      【IO面试题 四】、介绍一下Java的序列化与反序列化
      Java的序列化与反序列化允许对象通过实现Serializable接口转换成字节序列并存储或传输,之后可以通过ObjectInputStream和ObjectOutputStream的方法将这些字节序列恢复成对象。
      |
      2月前
      |
      存储 缓存 算法
      面试官:单核 CPU 支持 Java 多线程吗?为什么?被问懵了!
      本文介绍了多线程环境下的几个关键概念,包括时间片、超线程、上下文切换及其影响因素,以及线程调度的两种方式——抢占式调度和协同式调度。文章还讨论了减少上下文切换次数以提高多线程程序效率的方法,如无锁并发编程、使用CAS算法等,并提出了合理的线程数量配置策略,以平衡CPU利用率和线程切换开销。
      面试官:单核 CPU 支持 Java 多线程吗?为什么?被问懵了!