解读HTTP包

简介:
解读HTTP包:[摘要]详细介绍HTTP包的格式、协议内容及相关的处理方法,内容分3节:1、超文本传输协议及HTTP包;2、Socket类与ServerSocket类;3、读取HTTP包。
一、超文本传输协议及HTTP包
HTTP协议用于在Internet上发送和接收消息。HTTP协议是一种请求-应答式的协议——客户端发送一个请求,服务器返回该请求的应答,所有的请求与应答都是HTTP包。HTTP协议使用可靠的TCP连接,默认端口是80。HTTP的第一个版本是HTTP/0.9,后来发展到了HTTP/1.0,现在最新的版本是HTTP/1.1。HTTP/1.1由RFC 2616 定义。

在HTTP中,Client/Server之间的会话总是由客户端通过建立连接和发送HTTP请求包初始化,服务器不会主动联系客户端或要求与客户端建立连接。浏览器和服务器都可以随时中断连接,例如,在浏览网页时你可以随时点击"停止"按钮中断当前的文件下载过程,关闭与Web服务器的HTTP连接。 

1 HTTP请求包
HTTP请求包(GET、POST等请求方法)由三个部分构成,分别是:方法-URI-协议/版本,请求头,请求正文。下面是一个HTTP请求包(GET)的例子: 
GET /index.jsp HTTP/1.1
Accept-Language: zh-cn
Connection: Keep-Alive 
Host: 192.168.0.106
Content-Length: 37 

userName=new_andy&password=new_andy

请求包的第一行是方法-URI-协议/版本:
GET就是请求方法,根据HTTP标准,HTTP请求可以使用多种请求方法。HTTP 1.1支持七种请求方法:GET、POST、HEAD、OPTIONS、PUT、delete和TRACE等,常用的为请求方法是GET和POST。

/index.jsp表示URI。URI指定了要访问的网络资源。
HTTP/1.1是协议和协议的版本。
最后一行userName=new_andy&password=new_andy为正文,正文与HTTP头部有一个空行(\r\n)分隔。这里需要说明的一点,其中Content-Length说明正文的长度,有的正文长度没有在头部说明,只是标明Transfer-Encoding: chunked。关于chunked类型的长度计算方法,见RFC 1626。
请求包的头部还会包含许多有关客户端环境和请求正文的有用信息,这里不再描述。

2 HTTP应答包
和HTTP请求包相似,由三个部分构成,分别是:协议-状态代码-描述,应答头,应答正文。下面是一个HTTP应答的例子: 
HTTP/1.1 200 OK
Server: Microsoft-IIS/4.0
Date: Mon, 3 Jan 2005 13:13:33 GMT
Content-Type: text/html
Last-Modified: Mon, 11 Jan 2004 13:23:42 GMT
Content-Length: 90

<html>
<head>
<title>解读HTTP包示例</title></head><body>
Hello WORLD!
</body>
</html>

HTTP应答包的第一行类似于HTTP请求的第一行,表示所用的协议是HTTP 1.1,服务器处理请求的状态码200。 
应答头也和请求头一样包含许多有用的信息,例如服务器类型、日期时间、内容类型和长度等。应答的正文就是服务器返回的HTML页面。应答头和正文之间也用CRLF分隔。 

二、Socket类与ServerSocket类 
在Java中,通信端点由java.net.Socket类(客户端)或java.net.ServerSocket类(服务器端)表示。应用程序通过端点向网络发送或从网络读取数据。位于两台不同机器上的应用软件通过网络连接发送和接收字节流,从而实现通信。要把HTTP包发送给另一个应用,首先要知道对方的IP地址以及其通信端点的端口号。

Socket类代表的是客户端,它是一个连接远程服务器应用时临时创建的端点。
ServerSocker类代表的是服务器端,它启动后等待来自客户端的连接请求;一旦接收到请求,ServerSocket创建一个Socket实例来处理与该客户端的通信。对于服务器应用,我们不知道客户端应用什么时候会试图连接服务器,服务器必须一直处于等待连接的状态。

下面是ServerSocket提供了四个构造函数,常用的构造函数的的一种形式为:
public ServerSocket(int port, int backLog, InetAddress bindingAddress);

参数:port指定服务器端监听客户端的端口;
backlog为连接请求的最大队列长度,一旦超越这个长度,服务器端点开始拒绝客户端的连接请求。
bindingAddress是一个java.net.InetAddress的实例,指定绑定IP地址。
创建好ServerSocket实例之后,调用它的accept方法,要求它等待传入的连接请求。只有出现了连接请求时,accept方法才会返回,它的返回值是一个Socket类的实例。随后,这个Socket对象就可以用来与客户端应用通信。

Socket类有许多构造函数,常用的为:
public Socket(String host, int port)。

参数是主机名称(IP地址或域名)和端口号。
参数host是远程机器的名字或IP地址,port是远程应用的端口号。
成功创建了Socket类的实例之后,我们就可以用它来发送和接收字节流形式的数据,数据一般为HTTP包。

要发送字节流,首先要调用Socket类的getOutputStream方法获得一个java.io.OutputStream对象;要从连接的另一端接收字节流,首先要调用Socket类的getInputStream方法获得一个java.io.InputStream对象。 

下面的代码片断创建一个与本地HTTP服务器(127.0.0.1代表本地主机的IP地址)通信的Socket,发送一个HTTP请求包,准备接收服务器的应答。
Socket socket = new Socket("127.0.0.1", "80");
OutputStream os = socket.getOutputStream();
InputStream ins = socket.getInputStream();
StringBuffer sb=new StringBuffer();
sb.append("GET /index.jsp HTTP/1.1\r\n");//注意\r\n为回车换行
sb.append("Accept-Language: zh-cn\r\n");
sb.append("Connection: Keep-Alive\r\n");
sb.append("Host: 192.168.0.106\r\n");
sb.append("Content-Length: 37\r\n");
sb.append("\r\n");
sb.append("userName=new_andy&password=new_andy\r\n");
sb.append("\r\n");

//向Web服务器发送一个HTTP请求包
os.write(sb.toString().getBytes()); 

服务器端的代码在大致结构为:
while (!shutdown) {
Socket socket = null;
try {
socket = serverSocket.accept(); //等待客户以送HTTP请求包
// 创建HTTP请求包处理线程
RequestThread request = new RequestThread(socket);
request.start();
if(shutdown) System.exit(0);
}
catch (Exception e) {
e.printStackTrace();
}
}


RequestThread线程分析HTTP请求包,跟根据请求包内容在服务端生成一个HTTP应答包。下一节说明怎样分析HTTP包。
InputStream input = socket.getInputStream(); //从此字节数据流获得HTTP请求包内容
OutputStream output= socket.getOutputStream(); //向此字节流写入HTTP应答包内容

三、读取HTTP包
以下是一个读取HTTP包的类SocketRequest。
public class SocketRequest { //从指定的Socket的InputStream中读取数据

private InputStream input;
private String uri;
private StringBuffer request = new StringBuffer(); //用于保存所有内容
private int CONTENT_LENGTH = 0; //实际包内容数据长
private boolean bePost = false;
private boolean beHttpResponse = false;
private boolean beChucked = false;
private boolean beGet = false;
private byte crlf13 = (byte) 13; //'\r'
private byte crlf10 = (byte) 10; //'\n'

public SocketRequest(InputStream input) {
this.input = input;
}

public SocketRequest(Socket socket) {
this.input = socket.getInputStream();
}

public void ReadData() { //解析 获得InputStream的数据

ReadHeader(); //头部

if (beChucked) { //为Chucked
int ChuckSize = 0;
while ((ChuckSize = getChuckSize()) > 0) { //多个Chucked
readLenData(ChuckSize + 2); //读取定长数据
}
readLenData(2); //最后的2位
}

if (CONTENT_LENGTH > 0) {
readLenData(CONTENT_LENGTH); //读取定长数据
}

uri = ""; //parseUri(new String(request));
}

private void readLenData(int size) { //读取定长数据
int readed = 0; //已经读取数
try {
int available = 0; //input.available(); //可读数
if (available > (size - readed)) {
available = size - readed;
} while (readed < size) {
while (available == 0) { //等到有数据可读
available = input.available(); //可读数
}
if (available > (size - readed)) {
available = size - readed; //size-readed--剩余数
}
if (available > 2048) {
available = 2048; //size-readed--剩余数
}
byte[] buffer = new byte[available];
int reading = input.read(buffer);
request = request.append(new String(buffer, 0, reading)); //byte数组相加
readed += reading; //已读字符
}
} catch (IOException e) {
System.out.println("Read readLenData Error!");
}
}

private void ReadHeader() { //读取头部 并获得大小
byte[] crlf = new byte[1];
int crlfNum = 0; //已经连接的回车换行数 crlfNum=4为头部结束
try {
while (input.read(crlf) != -1) { //读取头部
if (crlf[0] == crlf13 || crlf[0] == crlf10) {
crlfNum++;
} else {
crlfNum = 0;
} //不是则清
request = request.append(new String(crlf, 0, 1)); //byte数组相加
if (crlfNum == 4) {
break;
}
}
} catch (IOException e) {
System.out.println("Read Http Header Error!");
return;
}

String tempStr = (new String(request)).toUpperCase();

//这里我只处理了GET与POST方法
String strMethod = tempStr.substring(0, 4);
if (strMethod.equals("GET ")) { //前
beGet = true;
} else if (strMethod.equals("POST")) {
bePost = true;
getContentlen_Chucked(tempStr);
} else {
System.out.println("不支持的HTTP包类型");

} //其它的其它类型 暂不支持
}

private void getContentlen_Chucked(String tempStr) { //获得长度 CONTENT-LENGTH 或 是否为CHUNKED型
String ss1 = "CONTENT-LENGTH:";
String ss2 = new String("TRANSFER-ENCODING: CHUNKED");

int clIndex = tempStr.indexOf(ss1);
int chuckIndex = tempStr.indexOf(ss2); //为CHUNKED型
byte requst[] = tempStr.getBytes();
if (clIndex != -1) { //从clIndex+1起至\r\n
StringBuffer sb = new StringBuffer();

for (int i = (clIndex + 16); ; i++) {
if (requst[i] != (byte) 13 && requst[i] != (byte) 10) {
sb.append((char) requst[i]);
} else {
break;
}
}

CONTENT_LENGTH = Integer.parseInt(sb.toString()); //正式的HTML文件的大小
//System.out.println("CONTENT_LENGTH== "+CONTENT_LENGTH);
}
if (chuckIndex != -1) {
beChucked = true;
}
}

private int getChuckSize() { //Chuck大小
byte[] crlf = new byte[1];
StringBuffer sb1 = new StringBuffer();

int crlfNum = 0; //已经连接的回车换行数 crlfNum=4为头部结束

try {
while (input.read(crlf) != -1) { //读取头部
if (crlf[0] == crlf13 || crlf[0] == crlf10) {
crlfNum++;
} else {
crlfNum = 0;
} //不是则清
sb1.append((char) crlf[0]);
request = request.append(new String(crlf, 0, 1)); //byte数组相加
if (crlfNum == 2) {
break;
}
}
} catch (IOException e) {
System.out.println("Read Http Package Error!");
return 0;
}

return Integer.parseInt((sb1.toString()).trim(), 16); //16进控制
}

//通过此来进行过滤,是否为发至目标服务器的HTTP包
private String parseUri(String requestString) {
int index1, index2;
index1 = requestString.indexOf(' ');
if (index1 != -1) {
index2 = requestString.indexOf(' ', index1 + 1);
if (index2 > index1) {
return requestString.substring(index1 + 1, index2);
}
}
return null;
}

public String getData() {
return request.toString();
}
}


使用此类:
SocketRequest request = new SocketRequest(socket); //socket为ServerSocket.accept()返回的Socket实例
request.ReadData(); //读取数据
request.getData();

为什么我要用这么大的力量去读取呢,尤其是在因为Socket连接在发送数据时,由于网络的原因经常会发生延迟现象,可能在服务器端开始接收数据时可能只有部分数据可以从InputStream中获得,在一些地方处理不当时,可能只能获得不完整的数据或是错误的数据。

从InputStream读取字节时有多种办法:
常用int read()与int read(byte[] b)。在用read(byte[])时,程序员经常会犯错误,因为在网络环境中,读取的数据量不一定等于参数的大小。




本文转自 水之真谛 51CTO博客,原文链接:http://blog.51cto.com/zhangyu/33875,如需转载请自行联系原作者
目录
相关文章
|
4月前
|
安全 网络协议 Linux
Linux网络应用层协议展示:HTTP与HTTPS
此外,必须注意,从HTTP迁移到HTTPS是一项重要且必要的任务,因为这不仅关乎用户信息的安全,也有利于你的网站评级和粉丝的信心。在网络世界中,信息的安全就是一切,选择HTTPS,让您的网站更加安全,使您的用户满意,也使您感到满意。
126 18
|
4月前
|
网络安全 开发者
如何解决HTTPS协议在WordPress升级后对网站不兼容的问题
以上就是解决WordPress升级后HTTPS协议对网站的不兼容问题的方法。希望能把这个棘手的问题看成是学校的管理问题一样来应对,将复杂的技术问题变得更加有趣和形象,并寻觅出解决问题的方式。希望你的网站能在新的学期得到更好的发展!
110 19
|
4月前
|
JSON 安全 网络协议
HTTP/HTTPS协议(请求响应模型、状态码)
本文简要介绍了HTTP与HTTPS协议的基础知识。HTTP是一种无状态的超文本传输协议,基于TCP/IP,常用80端口,通过请求-响应模型实现客户端与服务器间的通信;HTTPS为HTTP的安全版本,基于SSL/TLS加密技术,使用443端口,确保数据传输的安全性。文中还详细描述了HTTP请求方法(如GET、POST)、请求与响应头字段、状态码分类及意义,并对比了两者在请求-响应模型中的安全性差异。
357 20
|
4月前
|
安全 网络协议 算法
HTTP/HTTPS与SOCKS5协议在隧道代理中的兼容性设计解析
本文系统探讨了构建企业级双协议隧道代理系统的挑战与实现。首先对比HTTP/HTTPS和SOCKS5协议特性,分析其在工作模型、连接管理和加密方式上的差异。接着提出兼容性架构设计,包括双协议接入层与统一隧道内核,通过协议识别模块和分层设计实现高效转换。关键技术部分深入解析协议转换引擎、连接管理策略及加密传输方案,并从性能优化、安全增强到典型应用场景全面展开。最后指出未来发展趋势将更高效、安全与智能。
165 1
|
5月前
|
安全 网络安全 数据安全/隐私保护
HTTP 与 HTTPS 协议及 SSL 证书解析-http和https到底有什么区别?-优雅草卓伊凡
HTTP 与 HTTPS 协议及 SSL 证书解析-http和https到底有什么区别?-优雅草卓伊凡
277 3
|
7月前
|
网络协议 安全 网络安全
HTTP与HTTPS协议入门
HTTP协议是互联网的基石,HTTPS则是其安全版本。HTTP基于TCP/IP协议,属于应用层协议,不涉及数据包传输细节,主要规定客户端与服务器的通信格式,默认端口为80。
227 25
HTTP与HTTPS协议入门
|
12月前
|
监控 安全 搜索推荐
设置 HTTPS 协议以确保数据传输的安全性
设置 HTTPS 协议以确保数据传输的安全性
|
9月前
|
网络协议 安全 网络安全
探索网络模型与协议:从OSI到HTTPs的原理解析
OSI七层网络模型和TCP/IP四层模型是理解和设计计算机网络的框架。OSI模型包括物理层、数据链路层、网络层、传输层、会话层、表示层和应用层,而TCP/IP模型则简化为链路层、网络层、传输层和 HTTPS协议基于HTTP并通过TLS/SSL加密数据,确保安全传输。其连接过程涉及TCP三次握手、SSL证书验证、对称密钥交换等步骤,以保障通信的安全性和完整性。数字信封技术使用非对称加密和数字证书确保数据的机密性和身份认证。 浏览器通过Https访问网站的过程包括输入网址、DNS解析、建立TCP连接、发送HTTPS请求、接收响应、验证证书和解析网页内容等步骤,确保用户与服务器之间的安全通信。
482 3
|
10月前
|
安全 搜索推荐 网络安全
HTTPS协议是**一种通过计算机网络进行安全通信的传输协议
HTTPS协议是**一种通过计算机网络进行安全通信的传输协议
231 11
|
10月前
|
缓存 安全 网络协议
HTTPS协议的历史发展
HTTPS协议的历史发展
386 8