http和https有什么区别?
HTTP
超文本传输协议(HTTP)(HyperText Transfer Protocol)
是用于传输诸如 HTML 的超媒体文档的应用层协议,是互联网上应用最为广泛的一种网络协议。
HTTPS
HTTPS(Hypertext Transfer Protocol Secure)(安全的 HTTP)是 HTTP 协议加密版本
它通常使用 SSL 或者 TLS 来加密客户端和服务器之间的所有通信。是以安全为目标的 HTTP 通道。
HTTP(请求报文,响应报文)
HTTP 通过报文进行沟通
请求报文
客户端向服务器发起请求时会生成一段请求报文,请求报文是由请求方法,URL,协议版本,可选的请求首部字段和内容实体构成。
一旦连接建立,用户代理可以发送请求(用户代理通常是 Web 浏览器,但也可以是其他的(例如爬虫))。
客户端请求由一系列文本指令组成,并使用 CRLF 分隔,它们被划分为三个块:
- 第一行包括请求方法及请求参数
- 文档路径,不包括协议和域名的绝对路径 URL
- 使用的 HTTP协议版本
- 接下来的行每一行都表示一个 HTTP 首部,为服务器提供关于所需数据的信息(例如语言,或 MIME 类型),或是一些改变请求行为的数据(例如当数据已经被缓存,就不再应答)。这些 HTTP 首部组成一个空行结束的一个块。
- 最后一行是可选数据块,包含更多数据,主要被 POST 方法所使用
<!-- 发送表单的结果 --> POST / contact_form.php HTTP/1.1 HOST: developer.mozilla.org Content-length:64 Content-Type: application/x-www-form-urlencoded name=lambda&age=18
响应报文
接收到请求的服务器,会将请求内容的处理结构以响应的形式返回。响应报文基本上由协议版本,状态码,用以解释状态的原因短语,可选的响应首部字段以及实体主体构成。
当收到用户代理发送的请求后,Web 服务器就会处理它,并最终送回一个响应。
与客户端请求很类似,服务器响应由一系列文本指令组成,并使用 CRLF 分隔,它们被划分为三个不同的块
- 第一行是状态行,包括使用的 HTTP 协议版本,状态码和一个状态描述(可读描述文本)
- 接下来每一行都表示一个 HTTP 首部,为客户端提供关于所发送数据的一些信息如类型,数据大小,使用的压缩算法,缓存指示)。与客户端请求的头部块类似,这些 HTTP 首部组成一个块,并以一个空行结束。
- 最后一块是数据块,包含了响应的数据(如果有的话)
<!-- 成功的网页响应 --> HTTP/1.1 200 OK Date: Sat, 27 Mar 2021 14:28:02 GMT Server: Apache Last-Modified: Tue, 01 Dec 2020 20:18:22 GMT ETag: "51142bc1-7449-479b075b2891b" Accept-Ranges: bytes Content-Length: 29769 Content-Type: text/html
<!-- 请求资源已被永久移动的网页响应 --> HTTP/1.1 301 Moved Permanently Server: Apache/2.2.3 (Red Hat) Content-Type: text/html; charset=iso-8859-1 Date: Sat, 27 Mar 2021 14:30:24 GMT Location: https://developer.mozilla.org/ (目标资源的新地址, 服务器期望用户代理去访问它) Keep-Alive: timeout=15, max=98 Accept-Ranges: bytes Via: Moz-Cache-zlb05 Connection: Keep-Alive X-Cache-Info: caching X-Cache-Info: caching Content-Length: 325 (如果用户代理无法转到新地址,就显示一个默认页面)
<!-- 请求资源不存在的网页响应 --> HTTP/1.1 404 Not Found Date: Sat, 27 Mar 2021 14:33:02 GMT Server: Apache Last-Modified: Tue, 01 May 2020 14:24:39 GMT ETag: "499fd34e-29ec-42f695ca96761;48fe7523cfcc1" Accept-Ranges: bytes Content-Length: 10732 Content-Type: text/html
HTTP 响应代码
HTTP 响应状态代码指示特定 HTTP 请求是否已成功完成。
响应分为五类:信息响应(1xx),成功响应(2xx),重定向(3xx),客户端错误(4xx)和服务器错误(5xx)。
常见的 HTTP 状态码
- 成功状态码
- 200 服务器成功返回内容
- 301/2 临时/永久重定向
- 304 资源未被修改过
- 失败的状态码
- 404 请求内容不存在
- 500 服务器暂时不可用
- 503 服务器内部错误
GET 请求和 POST 请求的异同
相同点
- 都将数据提交到远程服务器
不同点
- 提交的位置不同
- GET 会将数据放在 URL 后面
- POST 会将数据放到请求头中
- 提交数据大小限制不同
- GET 请求对数据有大小限制
- POST 请求对数据没有大小限制
GET/POST 请求应用场景
- GET 请求用于提交非敏感数据和小数据
- POST 请求用于提交敏感数据和大数据
注意
上传文件一般使用 POST 提交
上传文件必须设置 enctype="multipart/form-data"
浏览器缓存机制(HTTP)
Date :服务器响应的内容日期
Cache-control :内容缓存时间
no-cache :不被缓存的,只不过每次在向客户端(浏览器)提供响应数据时,缓存都要向服务器评估缓存响应的有效性。
no-store :用于防止重要的信息被无意的发布。在请求消息中发送将使得请求和响应消息都不使用缓存。 根据缓存超时
max-age :指示客户机可以接收生存期不大于指定时间(以秒为单位)的响应。
min-fresh :指示客户机可以接收响应时间小于当前时间加上指定时间的响应。
max-stale :指示客户机可以接收超出超时期间的响应消息。如果指定max-stale消息的值,那么客户机可以 接收超出超时期指定值之内的响应消息。
Expires :内容保质期,表示存在时间,允许客户端在这个时间之前不去检查(发请求),等同max-age的效果。但是如果同时存在,则被cache-control的max-age覆盖。
其他
网站如何统计用户从何点击而来?
Referer: 如果从浏览器地址栏里直接输入地址请求头没有 Referer