web基础与http协议
一、DNS与域名回顾
- 由于IP地址不好记,出现了符号化的地址方案,来代替数字型的 IP 地址,也就是域名
阿里云上域名如何申请
申请----->查询重名----->给钱20-60块----->备案(阿里云)----->拍照(负责人拍照人)----->等待10-20天(域名申请之后就可以解析和使用但是如果有问题申请的域名会被封,所以最好等待10-20天)
DNS解析的生效顺序: 1 hosts文件 2 网卡配置文件 3 /etc/resolv.conf
二、网页的概念
2.1 网页HTTP/HTTPS
1、网页
纯文本格式文件
编写语言为HTML
在用户的浏览器中被“翻译”成网页形式显示出来( 浏览器:“解释和执行”HTML源码的工具 )
2、网站
由一个一个页面构成的,是多个网页的结合体
主页:打开网站后出现的第一个网页称为网站主页(或首页)
3、域名
浏览网页时输入的网址
4、HTTP/HTTPS
用来传输网页的通信协议(HTTP不加密,HTTPS加密),是一种通讯/交互的标准/规范
5、URL
是一种万维网寻址系统
6、 HTML
用来编写网页的超文本标记语言
7、超链接
超链接是将网站中不同网页链接起来的功能
8、发布
将制作好的网页上传到服务器供用户访问的过程
2.2 HTML概述
2.2.1 HTML文件结构
HTML网页
头部部分
标题部分
主体部分
网页内容,包括文本、图像等
<html> <head> <title>网页标题内容</title> </head> <body > 网页显示内容 </body> </html>
头标签中常用标签
标签 | 描述 |
<title> | 定义了文档的标题 |
<base> | 定义了页面链接标签的默认链接地址 |
<link> | 定义了一个文档和外部资源之间的关系 |
<meta> | 定义了 HTML 文档中的元数据 |
<script> | 定义了客户端的脚本文件 |
<style> | 定义了 HTML 文档的样式文件 |
内容标签中常用标签
标签 | 描述 |
<table> | 定义一个表格 |
<tr> | 定义了表格中的一行 |
<td> | 定义了表格中某一行的一列 |
<img> | 定义了一个图像 |
<a> | 定义了一个超链接 |
<p> | 定义了一行 |
<br> | 定义了换行 |
<font> | 定义了字体 |
2.2.2 网页基本标签
网页摘要信息的作用
- 有利于浏览器解析
- 有利于搜索引擎搜索
<title>标签 #标题 <meta>标签 #元标志
2.2.3 标题标签类型
行控制相关标签
范围标签
图像标签
超链接标签
三、Web
3.1 Web概述
Web(World Wide Web)即全球广域网,也称为万维网一种分布式图形信息系统,是建立在Internet上的一种网络服务
万维网并非某种特殊的计算机网络,是一个大规模的、联机式的信息贮藏库,使用链接的方法能非常方便地从因特网上的一个站点访问另一个站点(超链技术),具有提 供分布式服务的特点。万维网是一个分布式的超媒体系统,是超文本系统的扩充,基于B/S架构实现
URL:万维网使用统一资源定位符(Uniform Resource Locator)来标志万维网上的各种文档,并使每个文档在整个因特网的范围内具有唯一的标识符URL
3.2 Web1.0 与 Web2.0 的区别
Web1.0
以编辑为特征,网站提供给用户的内容是编辑处理后的,然后用户阅读网站提供的内容
这个过程是网站到用户的单向行为
Web2.0
更注重用户的交互作用,用户既是网站内容的消费者(浏览者),也是网站内容的制造者
加强了网站与用户之间的互动,网站内容基于用户提供,网站的诸多功能也由用户参与建设,实现了网站与用户双向的交流与参与
Web2.0特征
用户分享、以兴趣为聚合点的社群、开放的平台,活跃的用户
3.3 静态页面与动态页面
3.3.1 静态网页概述
在网站设计中,纯粹HTML格式的网页通常被称为“静态网页”,静态网页是标准的HTML文件,它的文件扩展名是.htm、.html。静态网页是网站建设的基础,早期的网站一般都是由静态网页制作的。静态网页没有后台数据库、不含程序和不可交互的网页,相对更新起来比较麻烦,适用于一般更新较少的展示型网站
3.3.2 静态网页特点
- 每个静态网页都有一个固定的URL,且URL以.htm、.html、.shtml等常见形式为后缀,而不含有“?”
- 网页内容一经发布到网站服务器上,无论是否有用户访问,每个静态网页都是保存在网站服务器上的
- 静态网页的内容相对稳定,容易被搜索引擎检索
- 静态网页没有数据库的支持,在网站制作和维护方面工作量较大,因此当网站信息量很大时完全依靠静态网页制作方式比较困难
- 静态网页的交互性较差,在功能方面有较大的限制
- 页面浏览速度迅速,过程无需连接数据库,开启页面速度快于动态页面
3.3.3 动态网页概述
所谓的动态网页,是指跟静态网页相对的一种网页编程技术。静态网页,随着HTML代码的生成,页面的内容和显示效果就基本上不会发生变化了——除非是修改页面代码。而动态网页页面代码虽然没有变,但是显示的内容却是可以随着时间、环境或者数据库操作的结果而发生改变的。
动态网页URL的后缀不是.htm、.html、.shtml、.xml等静态网页的常见网页制作格式,而是以.aspx、.asp、.jsp、.php、.perl、.cgi等形式为后缀,并且在动态网页网址中有一个标志性的符号——“?”。
动态网页常用的语言有PHP、JSP、Python、Ruby等
3.3.4 动态网页特点
- 交互性
网页会根据用户的要求和选择而动态改变和响应,将浏览器作为客户端界面,这将是今后WEB发展的大势所趋
- 自动更新
无须手动地更新HTML文档,便会自动生成新的页面,可以大大节省工作量
- 因时因人而变
- 当不同的时间,不同的人访问同一网址时会产生不同的页面
四、HTTP协议
4.1 HTTP概述
HTTP(超文本传输协议)是基于TCP协议的应用层传输协议,简单来说就是客户端和服务端进行数据传输的一种规则。HTTP/HTTPS是应用层上的协议,建立在传输层TCP之上,客户端通过与服务端进行TCP连接(三次握手),之后发送HTTP请求与接收HTTP响应都是通过访问Socket接口来调用TCP协议实现。
HTTP 是一种无状态 (stateless) 协议, HTTP协议本身不会对发送过的请求和相应的通信状态进行持久化处理(存储,保存)。这样做的目的是为了保持HTTP协议的简单性,从而能够快速处理大量的事务, 提高效率。
4.2 cookie 和 session
当我们需要保持用户登录的状态或记录用户购物车中的商品。由于HTTP是无状态协议,所以必须引入一些技术来记录管理状态,例如cookie。
cookie和session都是为了实现http的短期的持久化(通过内存/缓存方式,这样查询快、效率比较高)
- cookie 省服务器性能
- session 更安全
4.3 HTTP的版本
- HTTP/0.9:已过时。只接受 GET 一种请求方法,没有在通讯中指定版本号,且不支持请求头。由于该版本不支持 POST 方法,所以客户端无法向服务器传递太多信息。
- HTTP/1.0:这是第一个在通讯中指定版本号的 HTTP 协议版本,至今仍被广泛采用,特别是在代理服务器中。
- HTTP/1.1:引入了持久连接,即TCP连接默认不关闭,可以被多个请求复用,能很好地配合代理服务器工作。还支持管道方式机制,即在同一个TCP连接里面,客户端可以同时发送多个请求,以便降低线路负载,提高传输速度。
- HTTP/2.0:完全多路复用,在一个连接里,客户端和浏览器都可以同时发送多个请求或回应,而且不用按照顺序一一对应。引入了头信息压缩机制,使用gzip或compress压缩后再发送。支持服务端推送,允许服务器未经请求,主动向客户端发送资源。
4.4 HTTP 请求格式( GET / POST 方式 )
4.4.1 GET 请求方式
1、请求行:
请求的方式 请求的资源路径 请求的版本协议号
2、请求头(描述信息/标准化信息)
4.4.2 POST 请求方式
1、请求行:
请求的方式 请求的资源路径 请求的版本协议号
2、请求头
4.4.3 GET 与POST 区别
GET 方法
- 从指定的服务器上获得数据
- GET请求能被缓存
- GET请求会保存在浏览器的浏览纪录里
- GET请求有长度的限制
- 主要用于获取数据
- 查询的字符串会显示在URL中,不安全
- POST 方法
- 提交数据给指定服务器处理
- POST请求不能被缓存
- POST请求不会保存在浏览器的浏览纪录里
- POST请求没有长度限制
- 查询的字符串不会显示在URL中,比较安全
4.5 HTTP状态码
当使用浏览器访问某一个URL,会根据处理情况返回相应的处理状态
通常正常的状态码为2xx,3xx(如200)
如果出现异常会返回4xx,5xx(如404)
状态码首位 | 已定义范围 | 分类 |
1xx | 100-101 | 信息提示 |
2xx | 200-206 | 成功 |
3xx | 300-305 | 重定向 |
4xx | 400-415 | 客户端错误 |
5xx | 500-505 | 服务器错误 |
生产环境常见的HTTP状态码
4.6 HTTP协议请求流程分析
客户端先通过DNS 解析到IP地址,解析到IP地址后会通过TCP的三次握手与服务器建立连接