HTTP:超文本传输协议 允许将HTTP文档从Web服务器传送到客户端的浏览器。HTTP请求报文分为3部分。第一部分叫做起始行(Request line)。第二部分叫首部(Request Header)。第三部分叫主题(Body)。
代理服务器
- 共享网络
- 提高访问速度,大部分代理服务器有缓冲功能
- 突破访问限制
- 隐藏身份
Web通信安全
1.浏览器和Web服务器之间的内容应该只有浏览器和Web服务器能够看到通信的真正内容。
2.HTTP请求的内容和HTTP请求的响应不会被第三方篡改。
Web服务器与每个客户端使用不同的对称加密算法。
HTTPS = HTTP + TLS 安全传输层协议或 SSL(Secure Sockets Layer 安全套接层)
HTTP 请求方法
GET | 请求指定的页面信息并返回实体主体 |
HEAD | 类似于GET请求,只不过返回的响应中没有具体的内容,用于获取报头 |
POST | 向指定资源提交数据进行处理请求(例如提交表单或者上传文件)。数据被包含在请求体中,post请求可能会导致新的资源的建立和/或对已有资源的修改 |
PUT | 从客户端向服务端传送的数据取代指定文档的内容 |
DELETE | 请求服务器删除指定的页面 |
OPTIONS | 询问支持的方法,用来查询针对请求 URI 指定的资源支持的方法 |
TRACE | 追踪路径,让 Web 服务器端将之前的请求通信环回给客户端的方法 |
CONNECT | 要求用隧道协议连接代理,要求在与代理服务器通信时建立隧道,实现用隧道协议进行 TCP通信。 |
GET
用于获取资源,常用于向服务器查询某些信息。打开网页一般都是用GET方法,因为要以Web服务器获取信息。
参数
浏览器也可以在GET方法中把数据传给服务器,数据放在URL的问号(?)后面,叫查询字符串,也叫做Query String。查询字符串以“名=值”这样的形式出现,多个之间用“&”隔开
POST
通常用来把表单中填好的数据发送给服务器
GET和POST区别
- GET提交的数据会放在URL之后。POST放在Body中。
- GET提交的数据大小是有限制的(URL长度有限制)。POST没有限制。
- GET方式提交数据会带来安全问题,比如用户名和密码出现在URL中。页面被缓存或其他人访问这台机器,可从历史记录中获得该用户的账号和密码。
HTTP/1.1 状态码
状态码 | 已定义范围 | 分类 |
1XX | 100 - 101 | 信息提示表示请求已被成功接收,继续处理 |
2XX | 200 - 206 | 成功表示请求已被成功接收、理解、接收 |
3XX | 300 - 302 | 重定向,要完成请求,必须进行更进一步的处理 |
4XX | 400 - 415 | 客户端错误,请求有语法错误或请求无法实现 |
5XX | 500 - 505 | 服务器错误,服务器未能实现合法的请求 |
常见的状态码
名称 | 释义 |
200 | OK:服务器成功处理了请求(这个是我们见到最多的) |
301/302 | Moved Permanently(重定向):请求的URL已移走。Response中应该包含一个Location URL,说明资源现在所处的位置 |
304 | Not Modified(未修改):客户的缓存资源是最新的,需要客户端使用缓存 |
404 | Not Found:未找到资源 |
401 | 禁止访问 |
501 | Internal Server Error:服务器遇到一个错误,使其无法对请求提供服务 |
200(OK)
表示该请求被成功地完成,所请求的资源成功地发送回客户端。
204(No Content,没有内容)
返回的HTTP响应中只有一些Header和一个状态行,没有实体的主体内容(没有响应Body)
204 状态码作用如下:
- 在不获取资源的情况下了解资源的情况(比如判断其类型)、
- 通过查看HTTP响应中的状态码看某个对象是否存在
- 通过常看Header测试资源是否被修改
206(Partial Content,部分内容)
表示服务器已经成功处理了部分GET请求(只有发送GET方法的HTTP请求,Web服务器才可能返回206)
- FlashGet、迅雷或者HTTP下载工具都是使用206状态码来实现断点续传的
- 将一个大文档分解为多个下载段同时下载,比如在线看视频。
http://tv.sohu.com/20121011/n354681393.shtml
301(Moved Permanently)
表示请求的网页已经永久性地转移到另一个地址
如下情况需要用到301:
- 防止用户输错域名。
- 网站更换域名。比如www.360buy.com改为www.jd.com
- 有多个权重不错的域名,需要把所有的权重都传递到新域名上,这就需要301重定向了。如果不设置301,多个域名绑定在一个主机头上,会被搜索引擎认为是两个相同的站点,不利于网站的排名。绑定的域名越多,内容重复度也就越高,排名越低。
302(Found)
当我们访问一个URL的时候,服务器要我们访问另一个资源,这回收浏览器会继续发一个HTTP,请求访问新的资源。
比如为登陆状态下,直接访问需要登陆才能访问的页面,会被服务器返回302,跳转到登陆页面。
301和302区别
- 301表示旧地址的资源已经被永久的移除了(这个资源不可访问了),搜索引擎会把权重算到新地址。
- 302表示旧地址的资源还在(仍然可以访问),这个重定向只是临时地从旧地址跳转到新地址,搜索引擎会把权重算到旧地址。
304(Not Modified)
304状态码代表上次的文档已经被缓存了,还可以继续使用
如果不想使用本地缓存,用【Ctrl + F5】强制刷新
400(Bad Request)
表示客户端请求有语法错误
401(Unauthorized)
状态码401是指未授权错误,有些网页采用的是HTTP基本认证(Basic Authentication),需要在HTTP请求中带上 Authentication Header,否则服务器会返回状态码401
403(Forbidden)
表示Web客户端发送的请求被Web服务器拒绝了。如果想说明原因,可以在body中说明,但是这个状态码通常表示服务器不想说明拒绝原因
404(Not Found)
资源不存在。本来就不存在,或者被删了,或者被墙了。
500(Internal Server Error)
服务器内部错误。比如代码错误,数据库连接语句出错,空指针等。
503(Server Unavailable)
服务器暂不可用。由于服务器维护或者过载,服务器当前无法处理请求;这个状况是临时的,并且将在一段时间以后恢复。
学习还是要先用理论开始,再到工具的使用,最后是代码编写,二次开发。
不然始终是只会用工具,而不知道是什么意思,无法做到举一反三。