网络协议初始
协议分层
协议分层的好处
各层之间是独立的。某一层并不知道它的下一层是如何实现的,而仅仅需要知道该层通过层间的接口所提供的服务。这样,整个问题的复杂度就下降了,也就是说上一层的工作如何进行并不影响下一层的工作,这样我们在进行每一层的工作设计时只要保证接口不变可以随意调整整层内的工作方式。
灵活性好。当任何一层发生变化时,只要层间接口关系保持不变,则在这层以上或以下层均不受影响。当某一层出现技术革新或者某一层工作中出现问题时不会连累到其他层的工作,排除问题时也只需要考虑这一层单独的问题即可。
结构上可以分开。各层都可以采用最合适的技术来实现,技术的发展往往不对称的,一方面技术的不完善而影响整体的工作效率。
易于实现和维护。这种结构使得实现和调试一个庞大又复杂的系统变得易于处理,因为整个的系统已经被分解为若干个相对独立的子系统。进行调试和维护时,可以对每一层进行单独的调试,避免了出现找不到、解决错问题的情况。
例子:在当电话的时候,站在工程师的角度实际这两个人并不是直接进行沟通的,而是甲的电话将甲说的话记录下来,经过一系列编码转码后,通过通信网络将信息从甲的电话传递到了乙的电话,然后信息在乙的电话中再经过对应的编码转码,最后乙才通过话筒听到了甲所说的话。
其中,人与人之间通信使用的是汉语,我们可以将其称为语言层;而电话和电话之间通信使用的是电话系统相关的一些接口,我们可以将其称之为通信设备层。
后来随着科技的发展,我们都用上了智能手机,此时我们下层使用的通信设备变了,或是这部电话卖到了其他国家,此时上层使用的通信语言变了,但我们仍然可以正常沟通。
分层最大的好处在于“封装”,在分层情况下,将某层的协议进行替换后,通信双方之间是不会受到影响的。
理解各层之间直接通信
从上述例子我们还可以看出,虽然在打电话时我们并不是直接进行沟通的,但是我们可以认为我们是在直接进行沟通,并且这两台电话也不是直接在进行沟通的,数据经过电话后,还需要各种基站,各种电信网络来进行数据转发,但是这两台电话依旧可以认为是直接在和对方电话进行通信的。
因此对于网络协议我们需要有一个基本的认识:关于通信,同层协议可以认为自己在和对方层直接进行通信,从而达到简化对于网络协议栈的理解。
也就是说,在网络协议栈中我们可以认为通信双方的应用层之间直接在进行通信,也可以认为通信双方的传输层之间直接在进行通信,对于网络层和数据链路层也同样如此。
OSI七层模型
上面所说的是TCP/IP四层协议,而实际当初那个站出来的人定的协议叫做OSI七层协议:
七层模型从上到下依次是:
- 应用层:协议有:HTTP FTP TFTP SMTP SNMP DNS TELNET HTTPS POP3 DHCP
- 表示层:数据的表示、安全、压缩。格式有,JPEG、ASCll、DECOIC、加密格式等
- 会话层:建立、管理、终止会话。对应主机进程,指本地主机与远程主机正在进行的会话
- 传输层:定义传输数据的协议端口号,以及流控和差错校验。协议有:TCP UDP,数据包一旦离开网卡即进入网络传输层
- 网络层:进行逻辑地址寻址,实现不同网络之间的路径选择。协议有:ICMP IGMP IP(IPV4 IPV6) ARP RARP
- 数据链路层:建立逻辑连接、进行硬件地址寻址、差错校验等功能。将比特组合成字节进而组合成帧,用MAC地址访问介质,错误发现但不能纠正。
- 物理层:建立、维护、断开物理连接。
TCP/IP五层(或四层)模型
TCP/IP是一组协议的代名词,它还包括许多协议,共同组成了TCP/IP协议簇。TCP/IP通讯协议采用了五层的层级结构,每一层都呼叫它的下一层所提供的网络来完成自己的需求。
- 物理层:负责光/电信号的传递方式。主要是基于电器特性发送高低电压(电信号),高电压对应数字1,低电压对应数字0.
- 数据链路层: 负责设备之间的数据帧的传送和识别。单纯的电信号0和1没有任何意义,必须规定电信号多少位一组,每组什么意思。数据链路层的功能就是定义了电信号的分组方式。
1.以太网协议
(1)ethernet规定
一组电信号构成一个数据包,叫做"帧",每一数据帧分成:报头head和数据data两部分。
(2)head包含
发送者/源地址,6个字节;接收者/目标地址,6个字节;数据类型,6个字节。
2.mac地址(局域网内广播时,根据mac地址定位)
head中包含的源和目标地址由来:ethernet规定接入internet的设备都必须具备网卡,发送端和接收端的地址便是指网卡的地址,即mac地址。
mac地址:每块网卡出厂时都被烧制上一个世界唯一的mac地址,长度为48位2进制,通常由12位16进制数表示(前六位是厂商编号,后六位是流水线号):
3.广播
有了mac地址,同一网络内的两台主机就可以通信了(一台主机通过arp协议获取另外一台主机的mac地址)
ethernet采用最原始的方式,基于MAC地址广播的方式进行通讯,即计算机通信基本靠吼。
pc1按照上图格式以广播的方式发送以太网包给pc4,然而pc2,pc3,pc5都会收到,大家都受到pc1发来的包,拆开后发现目标mac如果不是自己就丢弃,如果是自己就响应
网络层: 负责地址管理和路由选择,引入一套新的地址用来区分不同的广播域/子网,这套地址即网络地址。有了ethernet、mac地址、广播的发送方式,世界上的计算机就可以彼此通信了,问题是世界范围的互联网是由一个个彼此隔离的小的局域网组成的,
- 那么如果所有的通信都采用以太网的广播方式,那么一台机器发送的包全世界都会收到,这就不仅仅是效率低的问题了,这回事一种灾难。
世界大网络是由一个个彼此隔离的局域网组成,以太网包只能在局域网内发送,一个局域网是一个广播域。 以太网的广播包只能在一个广播域内发送,跨广播域通信只能通过路由转发。
传输层: 负责两台主机之间的数据传输。传输层的由来:网络层的ip帮我们区分子网,以太网层的mac帮我们找到主机,再通过端口来标识主机上的应用程序。端口即应用程序与网卡关联的编号。传输层功能,
- 建立端口到端口的通信,补充:端口范围0-65535,0-1023为系统占用端口。传输层的两种协议,TCP和UDP。
- 应用层:负责应用程序间沟通。比如简单电子邮件传输(SMTP)、文件传输协议(FTP)、网络远程访问协议(Telnet)等。我们的网络编程主要就是针对应用层的。
与OSI七层模型各层的对应关系:
网络传输基本流程
同一时段两台主机进行文件传输:
同局域网的两台主机通信
首先需要清楚的是,同一个局域网内的主机是可以进行直接通信的,因为最初局域网的设计目的就是让局域网内的主机能够进行通信
其实局域网内的主机直接进行通信,并不像我们看到那样,例如应用层,直接可以通过FTP协议传过去,而是当用户要将文件传输给另一台主机前,该文件数据需要先通过网络协议栈进行封装,具体步骤如下:
文件数据先交给应用层,应用层添加上对应应用层协议的报头信息后,将数据再传给传输层
传输层收到数据后,再添加上对应传输层协议的报头信息,并将数据继续向下进行交付。
网络层收到数据后,再添加上对应网络层协议的报头信息,接着将数据再交给链路层。
链路层收到数据后,最后再添加上对应链路层协议的包头信息,至此数据封装完毕。
数据封装完毕后就可以通过局域网将其发送给对端主机了,而当对端主机收到数据后,对应也需要通过网络协议栈对该数据进行解包与应用:
链路层收到数据后,先将数据中对应链路层协议的报头信息提取出来,然后将剩下的数据交给网络层。
网络层收到数据后,再将数据中对应网络协议的报头信息提取出来,然后将剩下的数据继续向上进行交付。
传输层收到该数据后,再将数据中对应传输层协议的报头信息提取出来,然后将剩下的数据再交付给应用层。
应用层收到数据后,最后将数据中对应应用层协议的报头信息提取出来,至此便完成了数据的解包与分用。
也就是说,任何一台主机在发送数据之前,该数据都要先自顶向下贯穿协议栈来完成数据的封装,在这个过程中,每一层协议都会添加上对应的报头信息;而任何一台主机收到数据后,都要先自底向上贯穿协议栈来完成数据的解包和分用,在这个过程中,每一层协议都会将对应的报头信息提取出来。
数据包封装和分用
- 不同协议层对数据包有不同的称谓,在传输层叫做段(segment),在网络层叫做数据报(datagram),在链路层叫做帧(frame)。
- 应用层数据通过协议栈发到网络上,每层协议都要加上一个数据首部(header),称为封装(Encapsulation)。
- 首部信息中包含了一些类似于首部有多长,载荷(payload)有多长,上层协议是什么等信息。
- 数据封装成帧后发到传输介质上,到达目的主机后每层协议再剥掉相应的首部,根据首部中的“上层协议字段”将数据交给对应的上层协议处理。
下图为数据封装的过程:
下图为数据分用的过程: