Linux自学笔记——套接字与http协议基础

简介:

WebService

应用层:http,https

传输层协议:TCP, UDP,SCTP

进程间通信:IPC

      Socket:ip:port

IANA定义的端口信息:

      0-1023:众所周知,永久地分配给固定的应用使用,特权端口;

      1024-41951:亦为注册端口,但要求不是特别严格,分配给程序注册为某应用使用:3306/tcp,11211/tcp

      41952+:客户端程序随机使用的端口,动态端口,或私有端口:其范围定义在/proc/sys/net/ipv4/ip_local_port_range

BSDSocket:IPC的一种实现,允许位于不同主机(也可以是同一主机)上的进程之间进行通信;

      Socket API(封装了内核中的socket通信相关的系统调用)

      套接字三种类型:

           SOCK_STREAM:tcp套接字

           SOCK_DGRAM:UDP套接字

           SOCK_RAW:raw套接字

      根据套接字所使用的地址格式,Socket Domain

TCPFSM(有限状态机):在tcp传输连接的建立和释放中的通信双方主机的这些状态称之为“有限状态机”

      CLOSED:呈阻塞、关闭状态,表示主机当前没有活动的传输连接或正在进行传输连接;

      LISTEN:呈监听状态,表示服务器正在等待新的传输连接进入;

      SYN RCVD:表示主机已收到一个传输连接请求,但尚未确认;

      ESTABLISHED:传输连接建立,通信双方进入正常数据传输状态;

      FIN WAIT 1:(主动关闭)主机已经发送关闭连接请求,等待对方确认;

      FIN WAIT 2:(主动关闭)主机已收到对方关闭传输连接确认,等待对方发送关闭传输连接请求;

      TIMED WAIT:完成双向传输连接关闭,等待所有分组消失;

      CLOSING:双方同时尝试关闭传输连接,等待双方确认;

      CLOSE WAIT:(被动关闭)收到对方发来的关闭传输连接请求,并已确认;

      LAST ACK:(被动关闭)等待最后一个关闭传输连接请求,并等待所有分组消失;

TCP协议的特性:

      建立连接:三次握手;

      将数据打包成段:校验和(CRC32)

      确认、重传及超时;

      排序:逻辑序号;

      流量控制:滑动窗口算法;

      拥塞控制:慢启动和拥塞避免算法;

 

http协议:

http:hyper text transferprotocol,应用层协议,80/tcp,文本协议

      html:hyper text mark language,编程语言,超文本标记语言;

      格式:

      <html>

           <head>

                 <title>TITLE</title>

           </head>

           <body>

                 <h1></h1>

                      <p>blabla…<ahref=”http://www.magedu.com/download.html”> bla…</a></p>

                 <h2></h2>

           </body>

      </html>

      http协议版本:

           http 0.9:原型版本,功能简陋;

           http 1.0:cache, MIME,method,                    

                      MIME:MultipurposeInternet Mail Extesion

                      method:GET, POST, HEAD,PUT, DELETE,TRACE,OPTIONS

           http 1.1:缓存功能,条件式请求;

           http 2.0:rfc

      css:Cascading Style Sheet

      js:JavaScript,客户端脚本;

      html文档的生成方式:

           静态:

           动态:编程语言编写的程序可输出html格式的结果

                 php,jsp,asp,.net

                 依赖脚本解释器

                      php:php解释器

                      jsp:jvm

      工作模式:

           http请求报文:http request

           http响应报文;http response

                 一次http事务:请求<-->响应

      Web资源:web resourse

           静态资源(无须服务端做出额外处理):.jpg,.png, .gif, .html, txt, .js, .css, .mp3,  .avi

           动态资源(服务端需要通过执行程序做出处理,发送给客户端的是程序运行的结果):.php,.jsp

           Note:一个页面中展示的资源可能有多个;每个资源都需要单独请求;

 

           资源标识机制:URL

                 Uniform Resourse Locator:用于描述服务器某特定资源的位置;

                      例如:http://www.sina.com.cn/index.html

                            Scheme://Server[:port][/PATH/TO/SOME_RESOURSE]

一次完整的http请求处理过程:

1)    建立或处理连接;接收请求或拒绝请求;

2)    接受请求:接收来自网络上的主机请求报文中对某特定资源的一次请求过程;

接收请求的模型:

  并发访问响应模型:

单进程I/O模型:启动一个进程处理用户请求;这意味着,一次只能处理一个请求,多个请求被串行响应;

     多进程I/O结构:并行启动多个进程,每个进程响应一个请求;

     复用的I/O结构:一个进程响应n个请求;

          多线程模式:一个进程生成n个线程,一个线程处理一个请求;

          时间驱动(event-driven):一个进程直接响应n个请求

复用的多进程I/O结构:启动多个(m个)进程,每个进程生成多个(n个)线程;响应的请求的数量:m*n

3)    处理请求;对请求报文进行解析,获取客户端请求的资源及请求方法等相关信息;

分析请求报文http请求报文的首部

http协议:

  http请求报文首部;

  http响应报文首部;

请求报文首部格式:

  <method> <URL> <VERSION>

  HEADERS:(name: value)

  <request body>

4)    访问资源:获取请求报文中请求的资源;

web服务器,即存放了web资源的主机,负责向请求者提供对方请求的静态资源,或动态资源运行的生成的结果;这些资源通常应该放置于本地文件系统某路径下;此路径称为DocRoot;

  /var/www/html/:

        Images/logo.jpg

  例如:

        http://www.claude.com/images/logo.jpg

  web服务器的资源路径映射方式:

a.     DocRoot

b.    别名;

c.     虚拟主机的docroot

d.    用户家目录的docroot

5)    构建响应报文

6)    发送响应报文;

7)    记录日志;

 

http请求处理中的连接模式:

  保持连接(长连接):keep-alive

       时间:

       数量:

  非保持连接 (短连接):

 


本文转自 claude_liu 51CTO博客,原文链接:http://blog.51cto.com/claude666/1977491,如需转载请自行联系原作者

相关文章
|
5月前
|
缓存 负载均衡 网络协议
HTTP 与 SOCKS5 代理协议:企业级选型指南与工程化实践
面向企业网络与数据团队的代理协议选型与治理指南,基于流量特征选择HTTP或SOCKS5协议,通过多协议网关统一出站,结合托管网络降低复杂度,实现稳定吞吐、可预测时延与合规落地。
|
8月前
|
缓存 监控 搜索推荐
301重定向实现原理全面解析:从HTTP协议到SEO最佳实践
301重定向是HTTP协议中的永久重定向状态码,用于告知客户端请求的资源已永久移至新URL。它在SEO中具有重要作用,能传递页面权重、更新索引并提升用户体验。本文详解其工作原理、服务器配置方法(如Apache、Nginx)、对搜索引擎的影响及最佳实践,帮助实现网站平稳迁移与优化。
817 68
|
7月前
HTTP协议中请求方式GET 与 POST 什么区别 ?
GET和POST的主要区别在于参数传递方式、安全性和应用场景。GET通过URL传递参数,长度受限且安全性较低,适合获取数据;而POST通过请求体传递参数,安全性更高,适合提交数据。
685 2
|
7月前
|
应用服务中间件
HTTP协议中常见的状态码
HTTP协议状态码分为1xx、2xx、3xx、4xx、5xx五类,常见状态码包括:101(请求已接受)、200(请求成功)、302(重定向)、400(请求错误)、401(未认证)、403(无权限)、404(资源不存在),以及500(服务器错误)、502(网关错误)、503(服务不可用)、504(网关超时)等。
406 0
|
7月前
|
网络协议 安全 网络安全
什么是HTTP协议
HTTP协议是超文本传输协议,基于TCP,规定了客户端与服务器端通信规则,但数据以明文传输,安全性低。HTTPS则通过SSL加密保障数据安全。两者默认端口不同,HTTP为80,HTTPS为443。HTTPS安全性更高,但消耗更多服务器资源。
257 0
|
7月前
|
数据采集 Web App开发 JSON
Python爬虫基本原理与HTTP协议详解:从入门到实践
本文介绍了Python爬虫的核心知识,涵盖HTTP协议基础、请求与响应流程、常用库(如requests、BeautifulSoup)、反爬应对策略及实战案例(如爬取豆瓣电影Top250),帮助读者系统掌握数据采集技能。
635 0
|
8月前
|
存储 网络协议 安全
HTTP 协议及会话跟踪机制详解
本文详解了 HTTP 协议的核心知识,包括其定义(超文本传输协议,基于 TCP,规定客户端与服务器通信规则)及与 HTTPS 的区别(安全性、端口、资源消耗)。 介绍了 GET 与 POST 请求的差异(参数限制、安全性、应用场景),以及 Restful 风格(通过 URL 定位资源,请求方式决定操作)。列举了常见 HTTP 状态码(如 200 成功、404 资源未找到),对比了转发与重定向的区别(服务器端一次请求 vs 客户端两次请求)。 还阐述了会话跟踪机制:Cookie 基于客户端存储,通过Set-Cookie和Cookie头实现,安全性较低;Session 基于服务端存储,依赖 C
702 1
|
9月前
|
缓存
HTTP协议深度剖析:常见请求头信息讲解
这就是HTTP请求头背后的工作原理,希望通过比作“邮差”和“标签”,可以让你对这个繁琐技术更有感触,更得心应手。尽管这些信息可能很琐碎,但了解了它们的含义和工作方式,就等于揭开了HTTP协议神秘的面纱,掌控了网络交流的核心。你还等什么,赶快动手尝试一下吧!
291 17
|
7月前
|
缓存 网络协议 UED
深度解析HTTP协议从版本0.9至3.0的演进和特性。
总的来说,HTTP的演进是互联网技术不断发展和需求日益增长的结果。每一次重要更新都旨在优化性能,增进用户体验,适应新的应用场景,而且保证了向后兼容,让互联网的基础架构得以稳定发展。随着网络技术继续进步,我们可以预期HTTP协议在未来还会继续演化。
870 0

热门文章

最新文章