一篇文章帮你拿下面试八股文之网络三次握手四次挥手, HTTP超文本传输协议重点理论刨析到实现简单的HTTP服务, 思考着图解着学习网络 (咱不死记硬背)

本文涉及的产品
全局流量管理 GTM,标准版 1个月
容器服务 Serverless 版 ACK Serverless,952元额度 多规格
容器服务 Serverless 版 ACK Serverless,317元额度 多规格
简介: 一篇文章帮你拿下面试八股文之网络三次握手四次挥手, HTTP超文本传输协议重点理论刨析到实现简单的HTTP服务, 思考着图解着学习网络 (咱不死记硬背)

一. 三次握手  (TCP连接建立)

服务器端在一开始就调用listen() 函数进入监听状态, 阻塞监听着来自客户端的连接请求


客户端调用  connect()  函数发起一个连接请求, 进入 SYN_SENT 状态


服务端接收到这个连接请求, 将其放到SYN队列中, 应答客户端并且向客户端发起连接请求, 服务器进入SYN_RECVD状态


客户端接收到服务端发送过来的数据包, 客户端确定连接建立, connect返回, 应答服务器且进入ESTABLISHED状态


服务器接收到应答包, accept返回, 服务端确立连接建立, accept返回其实是从accept队列中拿取一个节点的.


注意, 细节问题, 在上述过程中其实还存在两个队列, 一个叫做  SYN队列,也叫做等待队列, 是服务端接收到来自客户端的SYN请求之后都会将这个请求挂在SYN 队列下面,  还有一个队列叫做accept队列, 这个队列中都是完成了三次握手的请求, 也就是刚刚SYN队列中的对应节点直接转移过来的.   accept其实就是从 accept队列中拿取的一个节点分析返回connfd的


细节疑惑刨析


SYN  ACK  都是标志位   SYN: 标志发起一个连接请求   ACK : 标识确认号是否有效, 确认刚刚发起的连接请求是否收到, 标识应答.


seqnum  arcnum 都是序号,     seqnum是初始化序号,  是arcnum是确认序号(应答序号)


上述此处仅暂做简单理解, 后序分析各种协议报文的时候会详解.

面试灵魂拷问, 为什么是三次握手,而不是二次握手也不是四次握手?

很多面经上面的的统一回答方向:  为了确立客户端和服务端双放的收发数据是否正常


上述回答肯定是没有问题的,  毕竟三次握手就是为了在最小的资源浪费条件下让CS双方建立一个稳定的通信的连接通道


第一二次握手, 客户端确定服务端是可以正常收到我的数据包的, 也是可以正常发送数据包的, 但是服务端并不知晓客户端是否可以正常接收到它的应答请求包, 它仅仅知道客户端发送是OK的


第一三次握手,  服务端确定客户端是可以正常收发数据的


四次五次乃至更多次握手不是不可以达到要求, 而是三次握手就足以建立CS双方稳定的连接, 所以没有必要再进行更多的资源浪费...  


上述回答结束OK吗? 当然是OK的, 但是其实存在诸多细节没有刨析


从连接已失效的历史请求报文段的方向来思考为什么必须要三次握手而不是两次握手.

上述就是两次连接会造成的经典问题, 连接历史包, 在拥塞的网络环境下, 可能刚开始一个客户端发送的历史包被网络阻塞住了, 新的客户端发送的连接还没有到来之前的历史失效报文段阻塞消失了, 并且 历史包还体现到达了服务端 , 两次握手, 服务端此时向客户端发出应答报文段完成连接建立, 误以为新的连接已经成功建立了, 就会傻等着这个客户端发送数据过来, 但是当然正在连接请求的客户端根本不认识这个server的确认连接的数据包, 不会理睬这个server的确认连接的信息,  重点来了, 这个时候没有第三次连接呀, 客户端倒是知道了这个数据包不对, 但是服务端 已经是确立连接的状态了, 就会一直等着服务这个客户端, 但是事实是人家不鸟他, 但是三次握手才让服务端确立连接就可以避免服务端的空白连接, 浪费服务端的资源

二. 四次挥手 (TCP的连接断开)

第一次挥手, 客户端发送一个 FIN(结束), 用来关闭自己到服务器的连接,  注意: 是断开的客户端到服务器的单向连接, 仅仅只是客户端不可以再向服务端发送数据了...  客户端进入FIN_wait1 状态


第二次挥手, 服务端接收到这这个 FIN , 先回一个 ACK, 我知道了,至此半关闭状态完成, 服务端进入 CLOSE_WAIT状态, 这个 CLOSE_WAIT的原因是因为, 服务端还需要将手头上没有发送完的数据包发送完, 因为一旦发送了 FIN(结束)就无法在发送数据了。。。   同时客户端收到ACK应答进入FIN_WAIT2状态


第三次挥手,  服务端发送一个FIN(结束)到客户端, 关闭服务端到客户端的连接, 服务端至此进入LAST_ACK状态, 等待客户端确认


第四次挥手, 客户端发送ACK 报文确定, 同时在等待  2MSL 之后完成CLOSE.


2MSL  :   等待网络中残存的数据包丢失, 不然下一次复用同一个端口的时候可能会收到这些遗留的数据包, 造成错误


MSL :  (max segment live) 报文最大生存时间


FIN : 结束标志位        SYN : 同步连接标志位      ACK: 确认标志位    (常见标志位)  

面试灵魂拷问2,为什么是四次挥手, 而不是三次

我们类比着三次握手来解释,  三次握手之所以是三次。 是因为第二次的时候是 SYN (同步序号)和ACK(确认应答) 合在了一起, 放在一个报文中发送给了客户端  (此处不懂请回溯)


But  :  四次挥手的时候   FIN 和 ACK  不可以放在同一个报文发送给客户端, 这个是为什么?


因为对方(Client)发送FIN 过来 仅仅代表客户端没有数据需要再发送给你服务端了, 但是你服务端可能还有数据需要发送响应给客户端, 所以你服务端暂时不能直接回FIN, 因为一旦回了FIN 就不可以再发送数据了, 所以只能先ACK, 等服务端把当前还需要发送的数据发送完再发送FIN 请求关闭连接.  ------   故此 FIN 和 ACK 需要分开

三. HTTP超文本传输协议

啥叫作超文本, URL, DNS?

我听过超链接, 也听过文本, 但是木有听过超文本, 其实就是含有超链接的文本文件彼此之间链接起来, 形成网状,是不是迷糊了, 其实还有个别称: 网页.这些链接使用的都是URL, 不清楚这个的在写博文的时候点一下你的链接, 上面就有...


啥是URL?   网页资源在服务器上的什么位置问题的解决,    网页是放在在服务器上的

DNS:域名系统     (解决IP地址不好记忆的问题), 记IP你能记住几个?? 根部记不住,

原理:  


一个组织的系统管理机构, 系统内的每个主机的IP和主机名的对应关系.


如果新计算机接入网络, 将这个信息注册到数据库中;


用户输入域名的时候, 会自动查询DNS服务器, 由DNS服务器检索数据库, 得到对应的IP地址.


DNS系统: 是一整套从域名映射到IP的系统

超文本传输协议HTTP(正式刨析)

  • 超文本传输协议  :    通过URL的指示, 将服务器上的超文本文档(网页) 传输到 客户端(浏览器)上的一种应用层协议....
  • HTTP协议是基于TCP/IP的一个应用层协议
  • HTTP的工作原理图解如下

上述图解分析的仅仅只是最为简单的最初版本的HTTP请求, 一次请求之后一个流程走完, 请求网页, 响应网页之后立马断开...   这个叫做  非持久性连接,  


问题  :   每一次请求网页都必须建立和断开一次TCP连接, 效率着实低下


然后 HTTP  1.2 版本叫做持久性连接  :    正如其名:  它支持了一个连接中, 可以多次进行网页的请求和响应, 咱商量好哈, 咱不那么费, 访问的人多, 咱把这个连接的时间定的短一点, 不造成网络拥堵, 访问的人少, 咱把连接的时间定的长一点, 这个连接保持的时间可以应需求而定  


无状态性  :  就是说每一次访问都是新的一次访问, 服务器不知道你曾经是否访问过, HTTP的无状态性简化了服务器的设计, 使其更容易支持大量并发的HTTP请求   ( 说实话这句话是网上抄的, 自己不是特别理解, 很朦胧, 要是大佬看见希望评论区留下您的理解, 大家有自己的见解都可以讨论, 万分感谢)


最后下面附上报文的各种请求方法截图一张:   (主要也就是  GET  和  POST)   一个是从服务器申请网页, 另外个是往服务器上 POST 网页  

这个状态码感兴趣的看一看就是  咱经常访问哪些  (非法网站的时候) 会弹出  40几呀   50几呀, 懂得都懂3

然后简单的写一个HTTP服务器 (最简易版本)

  • 网页上打印一个  hello hhtp,   如下,  其实几乎和  TCP  差不多, 只是我们需要按照HHTP的规则来构造数据, 以及访问URL
#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>
#include <stdlib.h>
#include <arpa/inet.h>
#include <sys/socket.h>
#include <string.h>
#define ERR_EXIT(m) \
  do { perror(m); exit(EXIT_FAILURE); } while (0)
typedef struct sockaddr SA;
int main(int argc, char* argv[]) {
  int connfd, listenfd;
  socklen_t buffLen;
  char dst[256] = {0};
  struct sockaddr_in clientAdd, serveAdd;
  if (argc != 2) {
    fprintf(stderr, "Usage: %s <ip>\n", argv[0]);
    exit(EXIT_FAILURE);
  }
  //域(协议家族), 服务类型, 弃用
  if ((listenfd = socket(AF_INET, SOCK_STREAM, 0)) == -1 ) {
    ERR_EXIT("socket error");
  }
  //确定协议地址簇
  serveAdd.sin_family = AF_INET;//协议家族
  serveAdd.sin_addr.s_addr = htonl(INADDR_ANY);//确定ip, 通配ip
  serveAdd.sin_port = htons(atoi(argv[1]));//确定绑定端口号
  //bind绑定固定端口号便于接收连接请求
  if (bind(listenfd, (SA*)&serveAdd, sizeof(serveAdd)) == -1) {
    ERR_EXIT("bind error");
  }
  //开始监听
  if (listen(listenfd, 3) == -1) {
    ERR_EXIT("listen error");
  }
  fprintf(stdout, "wait accept:\n");
  for ( ;; ) {//循环接收客户端的请求
    buffLen = sizeof(clientAdd);
    if ((connfd = accept(listenfd, (SA*)&clientAdd, &buffLen)) == -1) {
      ERR_EXIT("accept error");
    }
    printf("accept connection from ip is %s and port is %d \n", 
      inet_ntop(AF_INET, &clientAdd.sin_addr, dst, sizeof(dst)), 
      ntohs(clientAdd.sin_port));
    char input_buff[1024 * 10] = {0}; //开足够大的空间写入数据
    ssize_t read_size = read(connfd,input_buff, sizeof(input_buff) - 1);//留一个结束字符
    if (read_size == -1) {
      ERR_EXIT("read error");
    } 
    printf("[Request] %s", input_buff);
    char  buff[1024] = {0};
    const char* hello = "<h1>hello hhtp</h1>";
    sprintf(buff, "HHTP/1.0 200 OK\nContent-Length:%lu\n\n%s", strlen(hello), hello);//按照hhtp规矩写入
    write(connfd, buff, sizeof(buff));
  }
  exit(EXIT_SUCCESS);
}

备注: 此处我们使用 9090 端口号启动了HTTP服务器. 虽然HTTP服务器一般使用80端口,


但这只是一个通用的习惯. 并不是说HTTP服务器就不能使用其他的端口号.


使用chrome测试我们的服务器时, 可以看到服务器打出的请求中还有一个 GET /favicon.ico HTTP/1.1 这 样的请求.

四. 总结

首先本文描述了三次握手, 核心关键在于  为什么是三次不是二次也不是四次?


简单解释是:  为了使得确定客户端服务端双放的收发数据的正常, 确立双方稳定的数据通信的连接,   从避免历史包的接收建立服务端的无效连接浪费服务端资源的角度再理解了一下为啥两次连接不行, 四次乃至更多次的连接不是不可以而是没有必要, 浪费资源


四次挥手重点, 为啥是四次挥手不是三次?  核心点在于  这个  FIN + ACK为啥不能何在一起? (此处你应该能自己回答出来)不能请回溯


最后介绍HHTP 应用层协议: 超文本传输协议, 其实还有 FTP:文件传输协议等等 都是再应用层上的协议, HHTP : 超文本传输协议, 和我们平时使用的网页网站强相关, 所谓网页就是多个超链接连接一次构成的网状结构.  网站可以理解为存储多个网页的服务端.


DNS  域名系统, 为了解决IP地址不好记忆的问题, 搞出来了IP映射的这样一个域名系统, 可以利用域名映射IP地址  +  端口号访问服务器,


URL  : 服务类型  域名(IP)  端口号  文件路劲     资源定位


GET    从网站中获取网页       POST: 向网站中post网页


HTTP  是建立的一次TCP连接的基于TCP在其之上的应用层协议


HTTP  多次不断的进行TCP的连接和断开连接的效率低下方面的解决措施:  搞出来了持久连接  (连接保持一段时间)


无状态性  :  不会记录之前是否访问, 简化服务器设计, 更容易支持大量并发



相关实践学习
通过Ingress进行灰度发布
本场景您将运行一个简单的应用,部署一个新的应用用于新的发布,并通过Ingress能力实现灰度发布。
容器应用与集群管理
欢迎来到《容器应用与集群管理》课程,本课程是“云原生容器Clouder认证“系列中的第二阶段。课程将向您介绍与容器集群相关的概念和技术,这些概念和技术可以帮助您了解阿里云容器服务ACK/ACK Serverless的使用。同时,本课程也会向您介绍可以采取的工具、方法和可操作步骤,以帮助您了解如何基于容器服务ACK Serverless构建和管理企业级应用。 学习完本课程后,您将能够: 掌握容器集群、容器编排的基本概念 掌握Kubernetes的基础概念及核心思想 掌握阿里云容器服务ACK/ACK Serverless概念及使用方法 基于容器服务ACK Serverless搭建和管理企业级网站应用
相关文章
|
7天前
|
域名解析 存储 安全
HTTP【网络】
HTTP协议格式、HTTP的方法 、HTTP的状态码、HTTP常见的Header
138 6
HTTP【网络】
|
2天前
|
XML 前端开发 Java
Spring,SpringBoot和SpringMVC的关系以及区别 —— 超准确,可当面试题!!!也可供零基础学习
本文阐述了Spring、Spring Boot和Spring MVC的关系与区别,指出Spring是一个轻量级、一站式、模块化的应用程序开发框架,Spring MVC是Spring的一个子框架,专注于Web应用和网络接口开发,而Spring Boot则是对Spring的封装,用于简化Spring应用的开发。
9 0
Spring,SpringBoot和SpringMVC的关系以及区别 —— 超准确,可当面试题!!!也可供零基础学习
|
20天前
|
数据采集 JSON API
🎓Python网络请求新手指南:requests库带你轻松玩转HTTP协议
本文介绍Python网络编程中不可或缺的HTTP协议基础,并以requests库为例,详细讲解如何执行GET与POST请求、处理响应及自定义请求头等操作。通过简洁易懂的代码示例,帮助初学者快速掌握网络爬虫与API开发所需的关键技能。无论是安装配置还是会话管理,requests库均提供了强大而直观的接口,助力读者轻松应对各类网络编程任务。
73 3
|
21天前
|
机器学习/深度学习 JSON API
HTTP协议实战演练场:Python requests库助你成为网络数据抓取大师
在数据驱动的时代,网络数据抓取对于数据分析、机器学习等至关重要。HTTP协议作为互联网通信的基石,其重要性不言而喻。Python的`requests`库凭借简洁的API和强大的功能,成为网络数据抓取的利器。本文将通过实战演练展示如何使用`requests`库进行数据抓取,包括发送GET/POST请求、处理JSON响应及添加自定义请求头等。首先,请确保已安装`requests`库,可通过`pip install requests`进行安装。接下来,我们将逐一介绍如何利用`requests`库探索网络世界,助你成为数据抓取大师。在实践过程中,务必遵守相关法律法规和网站使用条款,做到技术与道德并重。
32 2
|
22天前
|
数据采集 存储 JSON
从零到一构建网络爬虫帝国:HTTP协议+Python requests库深度解析
在网络数据的海洋中,网络爬虫遵循HTTP协议,穿梭于互联网各处,收集宝贵信息。本文将从零开始,使用Python的requests库,深入解析HTTP协议,助你构建自己的网络爬虫帝国。首先介绍HTTP协议基础,包括请求与响应结构;然后详细介绍requests库的安装与使用,演示如何发送GET和POST请求并处理响应;最后概述爬虫构建流程及挑战,帮助你逐步掌握核心技术,畅游数据海洋。
51 3
|
28天前
|
数据采集 网络协议 API
HTTP协议大揭秘!Python requests库实战,让网络请求变得简单高效
【9月更文挑战第13天】在数字化时代,互联网成为信息传输的核心平台,HTTP协议作为基石,定义了客户端与服务器间的数据传输规则。直接处理HTTP请求复杂繁琐,但Python的`requests`库提供了一个简洁强大的接口,简化了这一过程。HTTP协议采用请求与响应模式,无状态且结构化设计,使其能灵活处理各种数据交换。
52 8
|
1天前
|
JSON API 开发者
深入解析Python网络编程与Web开发:urllib、requests和http模块的功能、用法及在构建现代网络应用中的关键作用
深入解析Python网络编程与Web开发:urllib、requests和http模块的功能、用法及在构建现代网络应用中的关键作用
6 0
|
22天前
|
Python
HTTP协议不再是迷!Python网络请求实战,带你走进网络世界的奥秘
本文介绍了HTTP协议,它是互联网信息传递的核心。作为客户端与服务器通信的基础,HTTP请求包括请求行、头和体三部分。通过Python的`requests`库,我们可以轻松实现HTTP请求。本文将指导你安装`requests`库,并通过实战示例演示如何发送GET和POST请求。无论你是想获取网页内容还是提交表单数据,都能通过简单的代码实现。希望本文能帮助你在Python网络请求的道路上迈出坚实的一步。
36 0
|
2月前
|
存储 Java
【IO面试题 四】、介绍一下Java的序列化与反序列化
Java的序列化与反序列化允许对象通过实现Serializable接口转换成字节序列并存储或传输,之后可以通过ObjectInputStream和ObjectOutputStream的方法将这些字节序列恢复成对象。
|
2天前
|
JSON 安全 前端开发
第二次面试总结 - 宏汉科技 - Java后端开发
本文是作者对宏汉科技Java后端开发岗位的第二次面试总结,面试结果不理想,主要原因是Java基础知识掌握不牢固,文章详细列出了面试中被问到的技术问题及答案,包括字符串相关函数、抽象类与接口的区别、Java创建线程池的方式、回调函数、函数式接口、反射以及Java中的集合等。
9 0

热门文章

最新文章