HTTP简介
HTTP(超文本传输协议)是网络上最为广泛的传输协议,被用于在web浏览器和网站服务器之间的传输协议。HTTP是一个简单的请求-响应协议,它通常运行在TCP之上。它指定了客户端可能发送给服务器什么样的消息以及得到什么样的响应。请求和响应消息的头以ASCII形式给出;而消息内容则具有一个类似MIME的格式。这个简单模型是早期Web成功的有功之臣,因为它使开发和部署非常地直截了当。
HTTP是应用层协议,同其他应用层协议一样,是为了实现某一类具体应用的协议,并由某一运行在用户空间的应用程序来实现其功能。HTTP是一种协议规范,这种规范记录在文档上,为真正通过HTTP进行通信的HTTP的实现程序。
报文格式
HTTP报文由从客户机到服务器的请求和从服务器到客户机的响应构成。请求报文格式如下:
请求行 - 通用信息头 - 请求头 - 实体头 - 报文主体
(为了图方便,图是用excel画的所以有一道线)
应答报文格式如下:
状态行 - 通用信息头 - 响应头 - 实体头 - 报文主体
HTTP协议的特点
1.HTTP协议是无状态的
就是说每次HTTP请求都是独立的,任何两个请求之间没有什么必然的联系。但是在实际应用当中并不是完全这样的,引入了Cookie和Session机制来关联请求。
2.多次HTTP请求
在客户端请求网页时多数情况下并不是一次请求就能成功的,服务端首先是响应HTML页面,然后浏览器收到响应之后发现HTML页面还引用了其他的资源,例如,CSS,JS文件,图片等等,还会自动发送HTTP请求这些需要的资源。现在的HTTP版本支持管道机制,可以同时请求和响应多个请求,大大提高了效率。
3.基于TCP协议
HTTP协议目的是规定客户端和服务端数据传输的格式和数据交互行为,并不负责数据传输的细节。底层是基于TCP实现的。现在使用的版本当中是默认持久连接的,也就是多次HTTP请求使用一个TCP连接。
HTTP请求方法
请求方法是客户端用来告知服务器其动作意图的方法。就像下达命令一样。在HTTP1.1版本中支持GET、POST等近10种方法。
HTTP请求方法
方法 | 描述 |
GET | 获取资源GET方法用来请求访问已被URI识别的资源。也就是指定了服务器处理请求之后响应的内容。 |
POST | 传输实体主体POST方法用来传输实体主体。POST与GET的区别之一就是目的不同,二者之间的区别会在文章的最后详细说明。虽然GET方法也可以传输,但是一般不用,因为GET的目的是获取,POST的目的是传输。 |
PUT | 传输文件PUT方法用来传输文件。类似FTP协议,文件内容包含在请求报文的实体中,然后请求保存到URL指定的服务器位置 |
HEAD | 获得报文首部HEAD方法类似GET方法,但是不同的是HEAD方法不要求返回数据。用于确认URI的有效性及资源更新时间等 |
DELETE | 删除文件DELETE方法用来删除文件,是与PUT相反的方法。DELETE是要求返回URL指定的资源 |
OPTIONS | 询问支持的方法因为并不是所有的服务器都支持规定的方法,为了安全有些服务器可能会禁止掉一些方法例如DELETE、PUT等。那么OPTIONS就是用来询问服务器支持的方法 |
TRACE | 追踪路径TRACE方法是让Web服务器将之前的请求通信环回给客户端的方法。这个方法并不常用 |
CONNECT | 要求用隧道协议连接代理CONNECT方法要求在与代理服务器通信时建立隧道,实现用隧道协议进行TCP通信。主要使用SSL/TLS协议对通信内容加密后传输。 |
HTTPS简介
HTTPS(安全套接字层超文本传输协议)是以安全为目标的HTTP通道。
为什么要使用https
首先了解一下HTTP的缺点:
- 通信使用明文传输
- 不验证通信方身份
- 无法验证报文的完整性
这时为了解决该缺陷需要使用另一种协议:HTTPS。为了数据传输的安全,HTTPS在HTTP的基础上加入了SSL协议,SSL依靠证书来验证服务器的身份,并为浏览器和服务器之间的通信加密。即HTTP下加入SSL层,HTTPS的安全基础是SSL,因此加密的详细内容就需要SSL,http+加密+认证+完整性保护=https。
HTTP工作原理
HTTPS和HTTP的主要区别
- HTTPS协议需要到CA申请证书,一般免费证书较少,因而需要一定费用。
- HTTP是超文本传输协议,信息是明文传输,HTTPS则是具有安全性的ssl/tls加密传输协议。
- HTTP和HTTPS使用的是完全不同的连接方式
- HTTP端口:80,HTTPS端口:443
- HTTP的连接无状态的;HTTPS协议是由SSL/TLS+HTTP协议构建的可进行加密传输、身份认证的网络协议,比HTTP协议安全。
HTTPS的缺点
HTTPS也并不是没有缺点的:
- 虽然HTTPS加了一层安全保护,但并不是绝对安全, 掌握根证书的机构、掌握加密算法的组织同样可以进行中间人形式的攻击
- HTTPS协议握手阶段比较费时,增加耗电和加载时间
- HTTPS连接缓存逊色于HTTP,会增加数据开销和功耗,甚至已有的安全措施也会因此而受到影响
- CA证书需要钱,功能越强大的证书费用越高(白嫖党直接哭泣)
- SSL通常需要绑定IP,不能在同一IP上绑定多个域名,IPv4资源非常难以支撑该消耗
注:
状态码:
1xx:信息
消息 |
描述 |
100 Continue |
服务器仅接收到部分请求,但是一旦服务器并没有拒绝该请求,客户端应该继续发送其余的请求。 |
101 Switching Protocols |
服务器转换协议:服务器将遵从客户的请求转换到另外一种协议。 |
2xx:成功
消息 |
描述 |
200 OK |
请求成功(其后是对GET和POST请求的应答文档。) |
201 Created |
请求被创建完成,同时新的资源被创建。 |
202 Accepted |
供处理的请求已被接受,但是处理未完成。 |
203 Non-authoritative Information |
文档已经正常地返回,但一些应答头可能不正确,因为使用的是文档的拷贝。 |
204 No Content |
没有新文档。浏览器应该继续显示原来的文档。如果用户定期地刷新页面,而Servlet可以确定用户文档足够新,这个状态代码是很有用的。 |
205 Reset Content |
没有新文档。但浏览器应该重置它所显示的内容。用来强制浏览器清除表单输入内容。 |
206 Partial Content |
客户发送了一个带有Range头的GET请求,服务器完成了它。 |
3xx:重定向
消息 |
描述 |
300 Multiple Choices |
多重选择。链接列表。用户可以选择某链接到达目的地。最多允许五个地址。 |
301 Moved Permanently |
所请求的页面已经转移至新的url。 |
302 Found |
所请求的页面已经临时转移至新的url。 |
303 See Other |
所请求的页面可在别的url下被找到。 |
304 Not Modified |
未按预期修改文档。客户端有缓冲的文档并发出了一个条件性的请求(一般是提供If-Modified-Since头表示客户只想比指定日期更新的文档)。服务器告诉客户,原来缓冲的文档还可以继续使用。 |
305 Use Proxy |
客户请求的文档应该通过Location头所指明的代理服务器提取。 |
306 Unused |
此代码被用于前一版本。目前已不再使用,但是代码依然被保留。 |
307 Temporary Redirect |
被请求的页面已经临时移至新的url。 |
4xx:客户端错误
消息 |
描述 |
400 Bad Request |
服务器未能理解请求。 |
401 Unauthorized |
被请求的页面需要用户名和密码。 |
401.1 |
登录失败。 |
401.2 |
服务器配置导致登录失败。 |
401.3 |
由于ACL对资源的限制而未获得授权。 |
401.4 |
筛选器授权失败。 |
401.5 |
ISAPI/CGI应用程序授权失败。 |
401.7 |
访问被Web服务器上的URL授权策略拒绝。这个错误代码为IIS 6.0所专用。 |
402 Payment Required |
此代码尚无法使用。 |
403 Forbidden |
对被请求页面的访问被禁止。 |
403.1 |
执行访问被禁止。 |
403.2 |
读访问被禁止。 |
403.3 |
写访问被禁止。 |
403.4 |
要求SSL。 |
403.5 |
要求SSL 128。 |
403.6 |
IP地址被拒绝。 |
403.7 |
要求客户端证书。 |
403.8 |
站点访问被拒绝。 |
403.9 |
用户数过多。 |
403.10 |
配置无效。 |
403.11 |
密码更改。 |
403.12 |
拒绝访问映射表。 |
403.13 |
客户端证书被吊销。 |
403.14 |
拒绝目录列表。 |
403.15 |
超出客户端访问许可。 |
403.16 |
客户端证书不受信任或无效。 |
403.17 |
客户端证书已过期或尚未生效。 |
403.18 |
在当前的应用程序池中不能执行所请求的URL。这个错误代码为IIS 6.0所专用。 |
403.19 |
不能为这个应用程序池中的客户端执行CGI。这个错误代码为IIS 6.0所专用。 |
403.20 |
Passport登录失败。这个错误代码为IIS 6.0所专用。 |
404 Not Found |
服务器无法找到被请求的页面。 |
404.0 |
(无)–没有找到文件或目录。 |
404.1 |
无法在所请求的端口上访问Web站点。 |
404.2 |
Web服务扩展锁定策略阻止本请求。 |
404.3 |
MIME映射策略阻止本请求。 |
405 Method Not Allowed |
请求中指定的方法不被允许。 |
406 Not Acceptable |
服务器生成的响应无法被客户端所接受。 |
407 Proxy Authentication Required |
用户必须首先使用代理服务器进行验证,这样请求才会被处理。 |
408 Request Timeout |
请求超出了服务器的等待时间。 |
409 Conflict |
由于冲突,请求无法被完成。 |
410 Gone |
被请求的页面不可用。 |
411 Length Required |
"Content-Length"未被定义。如果无此内容,服务器不会接受请求。 |
412 Precondition Failed |
请求中的前提条件被服务器评估为失败。 |
413 Request Entity Too Large |
由于所请求的实体的太大,服务器不会接受请求。 |
414 Request-url Too Long |
由于url太长,服务器不会接受请求。当post请求被转换为带有很长的查询信息的get请求时,就会发生这种情况。 |
415 Unsupported Media Type |
由于媒介类型不被支持,服务器不会接受请求。 |
416 Requested Range Not Satisfiable |
服务器不能满足客户在请求中指定的Range头。 |
417 Expectation Failed |
执行失败。 |
423 |
锁定的错误。 |
5xx:服务器错误
消息 |
描述 |
500 Internal Server Error |
请求未完成。服务器遇到不可预知的情况。 |
500.12 |
应用程序正忙于在Web服务器上重新启动。 |
500.13 |
Web服务器太忙。 |
500.15 |
不允许直接请求Global.asa。 |
500.16 |
UNC授权凭据不正确。这个错误代码为IIS 6.0所专用。 |
500.18 |
URL授权存储不能打开。这个错误代码为IIS 6.0所专用。 |
500.100 |
内部ASP错误。 |
501 Not Implemented |
请求未完成。服务器不支持所请求的功能。 |
502 Bad Gateway |
请求未完成。服务器从上游服务器收到一个无效的响应。 |
502.1 |
CGI应用程序超时。 |
502.2 |
CGI应用程序出错。 |
503 Service Unavailable |
请求未完成。服务器临时过载或宕机。 |
504 Gateway Timeout |
网关超时。 |
505 HTTP Version Not Supported |
服务器不支持请求中指明的HTTP版本。 |
请求头:
Header | 解释 | 示例 |
Accept | 指定客户端能够接收的内容类型 | Accept: text/plain, text/html |
Accept-Charset | 浏览器可以接受的字符编码集。 | Accept-Charset: iso-8859-5 |
Accept-Encoding | 指定浏览器可以支持的web服务器返回内容压缩编码类型。 | Accept-Encoding: compress, gzip |
Accept-Language | 浏览器可接受的语言 | Accept-Language: en,zh |
Accept-Ranges | 可以请求网页实体的一个或者多个子范围字段 | Accept-Ranges: bytes |
Authorization | HTTP授权的授权证书 | Authorization: Basic QWxhZGRpbjpvcGVuIHNlc2FtZQ== |
Cache-Control | 指定请求和响应遵循的缓存机制 | Cache-Control: no-cache |
Connection | 表示是否需要持久连接。(HTTP 1.1默认进行持久连接) | Connection: close |
Cookie | HTTP请求发送时,会把保存在该请求域名下的所有cookie值一起发送给web服务器。 | Cookie: $Version=1; Skin=new; |
Content-Length | 请求的内容长度 | Content-Length: 348 |
Content-Type | 请求的与实体对应的MIME信息 | Content-Type: application/x-www-form-urlencoded |
Date | 请求发送的日期和时间 | Date: Tue, 15 Nov 2010 08:12:31 GMT |
Expect | 请求的特定的服务器行为 | Expect: 100-continue |
From | 发出请求的用户的Email | From: user@email.com |
Host | 指定请求的服务器的域名和端口号 | Host: www.zcmhi.com |
If-Match | 只有请求内容与实体相匹配才有效 | If-Match: “737060cd8c284d8af7ad3082f209582d” |
If-Modified-Since | 如果请求的部分在指定时间之后被修改则请求成功,未被修改则返回304代码 | If-Modified-Since: Sat, 29 Oct 2010 19:43:31 GMT |
If-None-Match | 如果内容未改变返回304代码,参数为服务器先前发送的Etag,与服务器回应的Etag比较判断是否改变 | If-None-Match: “737060cd8c284d8af7ad3082f209582d” |
If-Range | 如果实体未改变,服务器发送客户端丢失的部分,否则发送整个实体。参数也为Etag | If-Range: “737060cd8c284d8af7ad3082f209582d” |
If-Unmodified-Since | 只在实体在指定时间之后未被修改才请求成功 | If-Unmodified-Since: Sat, 29 Oct 2010 19:43:31 GMT |
Max-Forwards | 限制信息通过代理和网关传送的时间 | Max-Forwards: 10 |
Pragma | 用来包含实现特定的指令 | Pragma: no-cache |
Proxy-Authorization | 连接到代理的授权证书 | Proxy-Authorization: Basic QWxhZGRpbjpvcGVuIHNlc2FtZQ== |
Range | 只请求实体的一部分,指定范围 | Range: bytes=500-999 |
Referer | 先前网页的地址,当前请求网页紧随其后,即来路 | Referer: http://www.zcmhi.com/archives/71.html |
TE | 客户端愿意接受的传输编码,并通知服务器接受接受尾加头信息 | TE: trailers,deflate;q=0.5 |
Upgrade | 向服务器指定某种传输协议以便服务器进行转换(如果支持) | Upgrade: HTTP/2.0, SHTTP/1.3, IRC/6.9, RTA/x11 |
User-Agent | User-Agent的内容包含发出请求的用户信息 | User-Agent: Mozilla/5.0 (Linux; X11) |
Via | 通知中间网关或代理服务器地址,通信协议 | Via: 1.0 fred, 1.1 nowhere.com (Apache/1.1) |
Warning | 关于消息实体的警告信息 | Warn: 199 Miscellaneous warning |