15.4.4 网页刷新器
程序http1在访问页面上存在着如下不足:其一,只能根据IP地址而不能根据域名访问网页;其二,只能访问一个特定的网页;其三,只读取一次WEB服务端返回的信息。事实上,在大多数页面的响应报文中,实体内容项会有很多的内容,远远超过了一次recv调用能够接收的范围,因此客户端必须反复调用recv直到信息接收完毕为止。
本处设计一个网页刷新器,用户将需要访问的WEB服务器域名和网页绝对路径地址作为命令行参数输入,如代码15-17所示:
代码15-17 网页刷新器(节自/code/chapter15/http2.c)
#include <comlib.h>
char buf2[]= /*
组装
HTTP
协议
GET
请求报文
*/
"GET %s HTTP/1.0\r\n"
"Accept: */*\r\n"
"Accept-Language: zh-cn\r\n"
"Accept-Encoding: gzip, deflate\r\n"
"User-Agent: Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 2.0.50727)\r\n"
"Host: %s\r\n"
"Connection: Keep-Alive\r\n\r\n";
int main(int argc, char *argv[])
{
char buf[1024];
int nSock, i=9999, j=0;
struct hostent *host;
if (argc != 3) return 0;
/*
参数
argv[1]
是
WEB
服务器域名,域名转主机地址
*/
if ((host = gethostbyname(argv[1])) == NULL)
{
herror("gethostbyname");
return 2;
}
fprintf(stderr, "%s\n", inet_ntoa(*((struct in_addr *)host->h_addr)));
/*
主机地址转字符串
IP
地址,建立
TCP
连接,
WEB
端的端口号一般是
80 */
ASSERT(ConnectSock(&nSock, 80, inet_ntoa(*((struct in_addr *)host->h_addr))) == 0);
/*
组建
HTTP
协议
GET
请求包
*/
sprintf(buf, buf2, argv[2], argv[1]);
/*
发送
HTTP
协议
GET
请求报文
*/
WriteFile(nSock, buf, strlen(buf));
fprintf(stderr, buf);
while (i > 0)
{ /*
反复接收套接字
nSock
上的信息,直到发生错误或接收不到信息为止
*/
memset(buf, 0, sizeof(buf));
i = recv(nSock, buf, sizeof(buf), 0);
j = j + i;
fprintf(stderr, buf);
}
/*
中断套接字连接
*/
close(nSock);
PrintLog(stderr, "%d", j);
}
【实践经验】函数sprintf的格式控制参数(第二个参数)不一定必须为常量字符串,也可以为变量字符串,比如代码15-17中的黑体语句中就使用了buf2作为格式控制字符串。
编译代码15-17:
# make http2
cc -o http2 http2.c -O -DUNIX -DDEBUG -DTRACE_FILE='"./trace"' -D__PATH__='"/"' -I/u/zyx/code/comlib/include -L/u/zyx/code/comlib/lib -lcom
运行代码15-17:
例1. 访问以下URL:
[url]http://publish.games.sina.com.cn/poll.php?p_id=560&t_id=1327[/url]
实现网页投票器功能:
# http2 publish.games.sina.com.cn /poll.php?p_id=560&t_id=1327
例2. 访问网页“[url]www.csai.cn[/url]”:
# http2 [url]www.csai.cn[/url] /
【注意】本节讲述网页刷新器的设计,目的只是为了向读者阐述基于TCP连接的SOCKET客户端程序的设计方法和域名转化为IP地址的方法。请读者妥善使用网页刷新器,不要把它作为一种攻击WEB端服务器流量的工具。
本文转自 zhuyunxiang 51CTO博客,原文链接:http://blog.51cto.com/zhuyunxiang/138511,如需转载请自行联系原作者