知识巩固源码落实之4:http get同步请求数据demo

本文涉及的产品
.cn 域名,1个 12个月
简介: 知识巩固源码落实之4:http get同步请求数据demo

1:背景介绍

http是基于C/S模式的,一直对如何实现http请求很疑惑。

http的协议理论了解很多,却一直无从下手不知道怎么实现一个http的请求。

作为一个http的客户端,请求服务器的一个消息,实现demo,做代码备份。

1.1:协议简单了解

这里实现一个http的get请求,获取对端服务器的响应进行打印,实现demo

//http请求实际就是按照http协议,构造特定的数据,使用tcp进行发送 
//请求行 请求头部 空行  请求数据
    // GET %s %s\r\n   resource  HTTP_VERSION   请求行
  // Host: %s\r\n    hostname         请求头
  // %s\r\n          CONNECTION_TYPE      请求头
  // \r\n

1.2:关注细节

1.2.1:需要关注hostname转ip的相关方法

把hostname转为目的服务器的具体ip,创建tcp client,进行连接,发送数据得请求。

//转换 url和ip  返回ip
char *get_ip_by_host(const char * hostname)
{
  //通过域名获取ip
  struct hostent *host_entry = gethostbyname(hostname);
  if(host_entry == NULL)
  {
    return NULL;
  }
  //通过 struct hostent * 可以获取到域名  ip列表等信息
  printf("host name is [%s] \n", host_entry->h_name);
  printf("the other name is :\n");
  for(int i=0; host_entry->h_aliases[i]; ++i)
  {
    printf("   [i:%d][%s] \n", i, host_entry->h_aliases[i]);
  }
  printf("Address type: %s\n", (host_entry->h_addrtype==AF_INET) ? "AF_INET": "AF_INET6");
  printf("address length: %d \n", host_entry->h_length);
  printf("ip list is :\n");
  for(int i=0; host_entry->h_addr_list[i]; ++i)
  {
    // printf("   [i:%d][%s] \n", i, host_entry->h_addr_list[i]);
    printf("   [i:%d][%s] \n", i, inet_ntoa(*(struct in_addr*)host_entry->h_addr_list[i]));
  }
  return inet_ntoa(*(struct in_addr*)*host_entry->h_addr_list);
}

1.2.2:需要关注如何按照http协议构造要发送的数据

构造发送的字符串,使用tcp进行发送。

#define HTTP_VERSION    "HTTP/1.1"
//好像不同的浏览器有不同的一些参数  可以在网页用f12请求进行查看 
#define USER_AGENT      "User-Agent: Mozilla/5.0 (Windows NT 5.1; rv:10.0.2) Gecko/20100101 Firefox/10.0.2\r\n"
#define ENCODE_TYPE     "Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8\r\n"
#define CONNECTION_TYPE "Connection: close\r\n"
int len = sprintf(send_buff, "GET %s %s\r\nHost: %s\r\n%s\r\n\r\n",\
    resource, HTTP_VERSION, hostname, CONNECTION_TYPE);
//send_buff 即为我们对服务器请求的http格式的消息,使用tcp进行发送

2:测试代码

http基于tcp/ip实现的,使用tcp发送特定协议的报文数据而已。

注意按照http的协议格式构造tcp待发送数据,等待对端的回应。 (作为http的客户端,对服务器进行数据请求)

/********************************************************
info: 作为http的客户端,拉取一下远端服务器数据,练习一下
data: 2022/02/10
author: hlp
测试:./XXX www.baidu.com /
    ./XXX api.seniverse.com /v3/weather/now.json?key=0pyd8z7jouficcil&location=beijing&language=zh-Hans&unit=c
********************************************************/
//练习http的get请求,通过url转换ip,创建tcp,发送构造的http协议,请求服务器的内容
//异步发送和接收  其实是利用了epoll event的指针,指向的函数指针
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <sys/types.h>
#include <sys/socket.h>
#include <sys/time.h>
#include <netinet/in.h>
#include <arpa/inet.h>
#include <unistd.h>       /* close */
#include <netdb.h> 
#include <time.h>
#include <fcntl.h>
#include <errno.h>
//转换 url和ip  返回ip
char *get_ip_by_host(const char * hostname);
//创建socket 根据服务器ip和断开 进行连接 返回fd
int create_http_socket(const char * ip);
//发送http请求 返回发送成功还是失败
int send_http_request(int fd, const char * hostname, const char* resource);
//获取回应消息并打印 监听对端的回应进行打印 返回成功或者失败
int get_recv_http_response(int sockfd);
//作为http的客户端,一请求一结束
int main(int argc, char *argv[])
{
  if(argc < 3)
  {
    printf(" please use ./%s hostname resouse \n\n", argv[0]);
    return -1;
  }
  //根据入参,解析获取到的url,保存请求的资源
  char * ip = get_ip_by_host(argv[1]);
  printf("get ip is [%s] \n", ip);
  //构造tcp连接 作为tcp的客户端,主动连接目标服务器
  int connfd = create_http_socket(ip);
  //构造http报文,发送http请求,并获取到返回结果
  send_http_request(connfd, argv[1], argv[2]);
  //监听获取http的请求的回复 内部做输出查看
  get_recv_http_response(connfd);
  close(connfd); //客户端主动关闭fd
  return 0;
}
// struct hostent {
//    char  *h_name;            /* 官方域名 */
//    char **h_aliases;         /* 别名 */
//    int    h_addrtype;        /* 地址簇类型 标明ipv4和ipv6 */
//    int    h_length;          /* ip地址的长度 */
//    char **h_addr_list;       /* 以整数的形式标识ip */
//            }
//转换 url和ip  返回ip
char *get_ip_by_host(const char * hostname)
{
  //通过域名获取ip
  struct hostent *host_entry = gethostbyname(hostname);
  if(host_entry == NULL)
  {
    return NULL;
  }
  //通过 struct hostent * 可以获取到域名  ip列表等信息
  printf("host name is [%s] \n", host_entry->h_name);
  printf("the other name is :\n");
  for(int i=0; host_entry->h_aliases[i]; ++i)
  {
    printf("   [i:%d][%s] \n", i, host_entry->h_aliases[i]);
  }
  printf("Address type: %s\n", (host_entry->h_addrtype==AF_INET) ? "AF_INET": "AF_INET6");
  printf("address length: %d \n", host_entry->h_length);
  printf("ip list is :\n");
  for(int i=0; host_entry->h_addr_list[i]; ++i)
  {
    // printf("   [i:%d][%s] \n", i, host_entry->h_addr_list[i]);
    printf("   [i:%d][%s] \n", i, inet_ntoa(*(struct in_addr*)host_entry->h_addr_list[i]));
  }
  return inet_ntoa(*(struct in_addr*)*host_entry->h_addr_list);
}
//创建socket 根据服务器ip和断开 进行连接 返回fd
int create_http_socket(const char * ip)
{
  //创建socket 根据Ip:port连接对端
  int sockfd = socket(AF_INET, SOCK_STREAM, 0);
  if(sockfd < 0)
  {
    return -1;
  }
  struct sockaddr_in sin = {0};
    sin.sin_addr.s_addr = inet_addr(ip);
    sin.sin_port = htons(80);
    sin.sin_family = AF_INET;
    //连接服务器 
    if (-1 == connect(sockfd, (struct sockaddr*)&sin, sizeof(struct sockaddr_in))) {
      printf("connect http server error \n");
        return -1;
    }
    //设置fd非阻塞
  fcntl(sockfd, F_SETFL, O_NONBLOCK);    
  return sockfd;
}
#define HTTP_VERSION    "HTTP/1.1"
//好像不同的浏览器有不同的一些参数  可以在网页用f12请求进行查看 
#define USER_AGENT      "User-Agent: Mozilla/5.0 (Windows NT 5.1; rv:10.0.2) Gecko/20100101 Firefox/10.0.2\r\n"
#define ENCODE_TYPE     "Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8\r\n"
#define CONNECTION_TYPE "Connection: close\r\n"
#define BUFFER_SIZE 4096
//发送http请求 返回发送成功还是失败
int send_http_request(int fd, const char * hostname, const char* resource)
{
  char send_buff[BUFFER_SIZE] = {0};
  //构造发送的请求报文  请求行 请求头部 空行  请求数据
  // GET /teacher_6.jpg HTTP/1.1
  // Host: www.0voice.com
  // User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.113 Safari/537.36
  // Content-Type: application/x-www-form-urlencoded
  // Content-Length: 9
  // lingsheng
//只关注了必须的参数  测试一下
  // GET %s %s\r\n   resource  HTTP_VERSION   请求行
  // Host: %s\r\n    hostname         请求头
  // %s\r\n          CONNECTION_TYPE      请求头
  // \r\n
  int len = sprintf(send_buff, "GET %s %s\r\nHost: %s\r\n%s\r\n\r\n",\
    resource, HTTP_VERSION, hostname, CONNECTION_TYPE);
  printf("send request buff is [%lu][%s] \n", strlen(send_buff), send_buff);
  int buff_len = strlen(send_buff);
  int sendlen = send(fd, send_buff, strlen(send_buff), 0);
  if(buff_len != sendlen)
  {
    printf("send buffer error \n");
    return -1;
  }
  return 0;
}
//获取回应消息并打印 监听对端的回应进行打印 返回成功或者失败
int get_recv_http_response(int sockfd)
{
  //使用io多路复用select对接收 进行输出
  struct timeval tv;
    tv.tv_sec = 5;
    tv.tv_usec = 0;
  fd_set fdread;
    FD_ZERO(&fdread);
    FD_SET(sockfd, &fdread);
    //存储最终结果
    char *result = malloc(sizeof(int));
    result[0] = '\0';
    //存储每次recv的数据
    int len = 0;
    char buffer[BUFFER_SIZE] = {0};
    while (1) {
        int selection = select(sockfd+1, &fdread, NULL, NULL, &tv);
        if (!selection || !(FD_ISSET(sockfd, &fdread))) {
            break;
        } else {
          //这里是客户端  只针对这个连接的场景
            len = recv(sockfd, buffer, BUFFER_SIZE, 0);
            if (len == 0) break;
      //重新申请大小并对接收到的数据进行追加 
            result = realloc(result, (strlen(result) + len + 1) * sizeof(char));
            strncat(result, buffer, len);
        }
    }
    if(result == NULL)
    {
      return -1;
    }
    //打印并释放接收到的数据
    puts(result);
    free(result);
  return 0;
}

3:测试结果:

如,请求baidu的主页,有的url是https的,这里暂时只是http的练习,https的相关需要安全认证。

./XXX www.baidu.com /

./XXX api.seniverse.com /v3/weather/now.json?key=0pyd8z7jouficcil&location=beijing&language=zh-Hans&unit=c

hlp@ubuntu:~/220107$ ./get www.baidu.com /
... #这里打印过多 省略
hlp@ubuntu:~/220107$ ./get api.seniverse.com /v3/weather/now.json?key=0pyd8z7jouficcil&location=hefei&language=zh-Hans&unit=c
[1] 9103
[2] 9104
[3] 9105
hlp@ubuntu:~/220107$ host name is [api.seniverse.com] 
the other name is :
Address type: AF_INET
address length: 4 
ip list is :
   [i:0][116.62.81.138] 
get ip is [116.62.81.138] 
send request buff is [104][GET /v3/weather/now.json?key=0pyd8z7jouficcil HTTP/1.1
Host: api.seniverse.com
Connection: close
] 
HTTP/1.1 400 Bad Request
Date: Sun, 13 Feb 2022 14:26:26 GMT
Content-Type: application/json
Content-Length: 55
Connection: close
access-control-allow-origin: *
x-request-id: FtNerTOXZFLlW0IvMUaB
{"status":"Wrong parameters.","status_code":"AP010001"}

我开始试着积累一些常用代码:自己代码库中备用

我的知识储备更多来自这里,推荐你了解:Linux,Nginx,ZeroMQ,MySQL,Redis,fastdfs,MongoDB,ZK,流媒体,CDN,P2P,K8S,Docker,TCP/IP,协程,DPDK等技术内容,立即学习

目录
相关文章
|
12天前
|
缓存 应用服务中间件 Apache
HTTP 范围Range请求
HTTP范围请求是一种强大的技术,允许客户端请求资源的部分内容,提高了传输效率和用户体验。通过正确配置服务器和实现范围请求,可以在视频流、断点续传下载等场景中发挥重要作用。希望本文提供的详细介绍和示例代码能帮助您更好地理解和应用这一技术。
57 19
|
1月前
|
JSON Java 数据格式
java操作http请求针对不同提交方式(application/json和application/x-www-form-urlencoded)
java操作http请求针对不同提交方式(application/json和application/x-www-form-urlencoded)
89 25
java操作http请求针对不同提交方式(application/json和application/x-www-form-urlencoded)
|
20天前
|
JSON JavaScript 前端开发
什么是HTTP POST请求?初学者指南与示范
HTTP POST请求是一种常用的HTTP方法,主要用于向服务器发送数据。通过合理设置请求头和请求主体,可以实现数据的可靠传输。无论是在客户端使用JavaScript,还是在服务器端使用Node.js,理解和掌握POST请求的工作原理和应用场景,对于Web开发至关重要。
184 18
|
20天前
|
JSON 数据格式
.net HTTP请求类封装
`HttpRequestHelper` 是一个用于简化 HTTP 请求的辅助类,支持发送 GET 和 POST 请求。它使用 `HttpClient` 发起请求,并通过 `Newtonsoft.Json` 处理 JSON 数据。示例展示了如何使用该类发送请求并处理响应。注意事项包括:简单的错误处理、需安装 `Newtonsoft.Json` 依赖,以及建议重用 `HttpClient` 实例以优化性能。
62 2
|
1月前
|
Web App开发 大数据 应用服务中间件
什么是 HTTP Range请求(范围请求)
HTTP Range 请求是一种非常有用的 HTTP 功能,允许客户端请求资源的特定部分,从而提高传输效率和用户体验。通过合理使用 Range 请求,可以实现断点续传、视频流播放和按需加载等功能。了解并掌握 HTTP Range 请求的工作原理和应用场景,对开发高效的网络应用至关重要。
123 15
|
1月前
|
数据采集 JSON 测试技术
Grequests,非常 Nice 的 Python 异步 HTTP 请求神器
在Python开发中,处理HTTP请求至关重要。`grequests`库基于`requests`,支持异步请求,通过`gevent`实现并发,提高性能。本文介绍了`grequests`的安装、基本与高级功能,如GET/POST请求、并发控制等,并探讨其在实际项目中的应用。
54 3
|
1月前
|
Web App开发 网络安全 数据安全/隐私保护
Lua中实现HTTP请求的User-Agent自定义
Lua中实现HTTP请求的User-Agent自定义
|
4月前
|
监控 安全 搜索推荐
设置 HTTPS 协议以确保数据传输的安全性
设置 HTTPS 协议以确保数据传输的安全性
|
21天前
|
网络协议 安全 网络安全
探索网络模型与协议:从OSI到HTTPs的原理解析
OSI七层网络模型和TCP/IP四层模型是理解和设计计算机网络的框架。OSI模型包括物理层、数据链路层、网络层、传输层、会话层、表示层和应用层,而TCP/IP模型则简化为链路层、网络层、传输层和 HTTPS协议基于HTTP并通过TLS/SSL加密数据,确保安全传输。其连接过程涉及TCP三次握手、SSL证书验证、对称密钥交换等步骤,以保障通信的安全性和完整性。数字信封技术使用非对称加密和数字证书确保数据的机密性和身份认证。 浏览器通过Https访问网站的过程包括输入网址、DNS解析、建立TCP连接、发送HTTPS请求、接收响应、验证证书和解析网页内容等步骤,确保用户与服务器之间的安全通信。
84 1

热门文章

最新文章