【俺修复的印象最深的bug】一名在校网工处理的一个无语的网络Bug

简介: 【以及经过脱敏处理,无重要信息泄露】本人在校大学生,网络水平还行,是学校信息中心常驻外援工程师,hhhhhhhhhhhhh。某次在食堂吃晚饭的时候一个电话把我call过去,说新配置一新机房网络,网联不通,弄了一下午了看不出问题。

磕头了各位,就我天天往楼层弱电间和中心机房跑


问题背景:

 XX楼,学校清理了两个房间作为新工作室,该楼的网段起初分配为VLAN90-98网段,管理员查看配置发现95网段是空着的无人使用,决定将新工作室使用95网段进行上网,配置了接入交换机对应端口为vlan95以及将信息点的跳线接到对应接入交换机的4546端口,在测试机上配置好IP地址后却结果发现数据无法联通,ping不通网关地址254

 

大致网络拓扑结构:

image.png

 

开始问题排查:

1.因为测试无法到达网关,首先在二层数据流经处排查问题

image.png

检查接入交换机的配置,在接入处配置了vlan,在上联接口配置了trunk,放行了vlan95

[XX楼接入交换机]display current-configuration
#
interface GigabitEthernet1/0/45
 port access vlan 95
#
interface GigabitEthernet1/0/46
 port access vlan 95
#
interface Ten-GigabitEthernet1/0/49
 port link-type trunk
 undo port trunk permit vlan 1
 port trunk permit vlan 95

 

检查vlan,没有问题

[XX楼接入交换机]display vlan br
95        VLAN 0095                        GE1/0/38  GE1/0/45 GE1/0/46
                                          XGE1/0/49  XGE1/0/50  XGE1/0/51
                                          XGE1/0/52


由于对整体网络结构的不了解,通过lldp检查邻居,寻找上行设备为汇聚交换机

[XX楼接入交换机]display lldp neighbor-information list
Chassis ID : * -- -- Nearest nontpmr bridge neighbor
             # -- -- Nearest customer bridge neighbor
             Default -- -- Nearest bridge neighbor
Local Interface Chassis ID      Port ID                    System Name
XGE1/0/49       00be-d5f2-f5e2  Ten-GigabitEthernet1/0/6   XX楼汇聚交换机

 

 

2.检查上联汇聚交换机

再次通过lldp检查上下联邻居,检查连接的端口,可以看到上联通过端口聚合连接到核心交换机

image.png

[XX楼汇聚交换机]display lldp neighbor-information list
Chassis ID : * -- -- Nearest nontpmr bridge neighbor
             # -- -- Nearest customer bridge neighbor
             Default -- -- Nearest bridge neighbor
Local Interface Chassis ID      Port ID                    System Name
XGE1/0/6        00be-d5fa-8fc4  Ten-GigabitEthernet1/0/49  XX楼接入交换机
XGE1/0/23       084f-0ace-5300  XGigabitEthernet1/2/0/0    核心交换机
XGE1/0/24       084f-0ace-5300  XGigabitEthernet2/2/0/0    核心交换机

 

检查配置,上下连接的端口均为trunk且放行了vlan95

[XX楼汇聚交换机]display current-configuration
#
interface Ten-GigabitEthernet1/0/6
 port link-type trunk
 port trunk permit vlan 95
#
interface Ten-GigabitEthernet1/0/23
 port link-type trunk
 port trunk permit vlan 95
#
interface Ten-GigabitEthernet1/0/24
 port link-type trunk
 port trunk permit vlan 95
#

 

3.找到问题!

由于少部分管理网段的网关在核心上,而大部分业务网段的网关是配置在汇聚上面的,我查询了汇聚上的vlanif接口地址,发现vlan95的网关地址居然不在该台汇聚交换机上,91-98其余的网关均在上面,和一旁的管理员再次沟通确认了一下,他跟我确认是91-98网关都在的,我只好表达质疑,继续排

f0c35efb4fe928858e3660bd8b14b87.jpg

image.png

[XX楼汇聚交换机]display ip interface brief
*down: administratively down
(s): spoofing  (l): loopback
Interface           Physical Protocol IP address      VPN instance Description
Vlan91              up       up      xxx.xxx.xxx.xxx  --           --
Vlan92              up       up      xxx.xxx.xxx.xxx  --           --
Vlan93              up       up      xxx.xxx.xxx.xxx  --           --
Vlan94              up       up      xxx.xxx.xxx.xxx  --           --
Vlan96              up       up      xxx.xxx.xxx.xxx  --           --
Vlan97              up       up      xxx.xxx.xxx.xxx  --           --
Vlan98              up       up      xxx.xxx.xxx.xxx  --           --

 

 

 

 

4.检查核心交换机的配置,检查三层流量走向

跟管理员申请了权限,登录核心设备上查看了相关配置。

既然汇聚上网关不在上面,那就需要通过排查三层数据走向找到vlan95的网关在哪一台上面了。直接检查了核心设备上的路由表,可以看到95的静态路由指向的下一跳是隔壁楼汇聚交换机,那么问题就很好解决了

image.png

<核心交换机>display ip routing-table
Route Flags: R - relay, D - download to fib
------------------------------------------------------------------------------
Routing Tables: Public
         Destinations : 155      Routes : 155
Destination/Mask    Proto  Pre  Cost      Flags NextHop         Interface
   x.x.95.0/24  Static 60   0          RD  x.x.x.x(隔壁楼汇聚交换机)  Vlanifxxx

 

lldp看一下邻居,确认一下连接的接口,毕竟核心设备,我一个学生,不敢乱动

<核心交换机>display lldp neighbor brief
Local Intf    Neighbor Dev             Neighbor Intf             Exptime(s)
XGE1/2/0/0    XX楼汇聚交换机           Ten-GigabitEthernet1/0/23 110
XGE1/2/0/7    隔壁楼汇聚交换机         Ten-GigabitEthernet1/0/24 104
XGE2/2/0/0    XX楼汇聚交换机           Ten-GigabitEthernet1/0/24 113
XGE2/2/0/7    隔壁楼汇聚交换机         Ten-GigabitEthernet1/0/23 105

 

 

5.找到vlan95的网关设备了,打通数据流经的trunk

确认vlan95的网关在隔壁楼的汇聚上了,这证实了网络管理员手里的信息有误

[隔壁楼汇聚交换机]display ip interface brief
*down: administratively down
(s): spoofing  (l): loopback
Interface           Physical Protocol IP address      VPN instance Description
Vlan95              up       up      x.x.x.95.x  --          --


设置标签

 

再次确认lldp上与核心设备相连的端口

[隔壁楼汇聚交换机]display lldp neighbor-information list
Chassis ID : * -- -- Nearest nontpmr bridge neighbor
             # -- -- Nearest customer bridge neighbor
             Default -- -- Nearest bridge neighbor
Local Interface Chassis ID      Port ID                    System Name
XGE1/0/23       084f-0ace-5300  XGigabitEthernet2/2/0/7    核心交换机
XGE1/0/24       084f-0ace-5300  XGigabitEthernet1/2/0/7    核心交换机

 

image.png

配置连接的端口trunk,放行vlan95

[隔壁楼汇聚交换机]display current-configuration
interface Ten-GigabitEthernet1/0/23
 port link-mode bridge
 port link-type trunk
 port trunk permit vlan 95
#
interface Ten-GigabitEthernet1/0/24
 port link-mode bridge
 port link-type trunk
 port trunk permit vlan 95

 

在核心设备上的端口trunk,放行vlan95

<核心交换机>display lldp neighbor brief
Local Intf    Neighbor Dev             Neighbor Intf             Exptime(s)
XGE1/2/0/7    隔壁楼汇聚交换机    Ten-GigabitEthernet1/0/24 104
XGE2/2/0/7    隔壁楼汇聚交换机    Ten-GigabitEthernet1/0/23 105

打通trunk

<核心交换机>display current-configuration
#
interface Eth-Trunk5
 port link-type trunk
 port trunk allow-pass vlan 95
#
interface XGigabitEthernet1/2/0/7
 eth-trunk 5
#
interface XGigabitEthernet2/2/0/7
 eth-trunk 5
#

 d4892c04286d3aa1acfe50b2e34ae34.jpg

ping通了,收工

完工小结:

 其实我只做了两个步骤,找到vlan95网关地址所在,然后打通所有trunk的放行。解决过程其实也很简单,排完错甚至有点无大语,学校管理员自信满满的认为业务网关没有问题,压根没往这方向去想。但是暴露了不少问题,在网络实施时很多基础的配置具体下发的时候,没有好好的做一个检查就验收存档了,或者是之前对配置又改动了,也没又记录下来,导致了这次排了半天还以为是什么stp问题,环路啊啥的。不过按照网络规划的初衷,这个95网段的网关不应该在隔壁楼的汇聚上面,后续我应该会把网关迁移到本楼的汇聚上。

f16eb25fb0bbccb2699dcf083ab1478.jpg

相关文章
|
3月前
|
前端开发
elementui-upload组件自定义样式上传(upload中常用的属性,但是网络上却找不到教程)(解决bug删除之后再次上传会上传删除的图片)专注后端工程师的前端速成
elementui-upload组件自定义样式上传(upload中常用的属性,但是网络上却找不到教程)(解决bug删除之后再次上传会上传删除的图片)专注后端工程师的前端速成
63 0
|
12月前
|
Java Android开发
Android10.0(Q) 网络自动校时bug修改
Android10.0(Q) 网络自动校时bug修改
110 0
|
10月前
|
存储 前端开发
网络基础 登录对接CAS-跨域导致的一个意想不到的Bug
网络基础 登录对接CAS-跨域导致的一个意想不到的Bug
144 1
|
11月前
|
存储 传感器 网络协议
宽带接入网络的形式(软考网工知识点总结)
宽带接入网络的形式(软考网工知识点总结)
436 0
|
11月前
|
网络架构
常见的网络端口(软考网工知识点总结)
常见的网络端口(软考网工知识点总结)
331 0
|
11月前
|
网络协议 Windows
修复windows电脑网络不稳定的问题
修复windows电脑网络不稳定的问题
65 0
|
监控 网络协议 测试技术
网工必备网络排错管理工具之IP链路测试工具
网工必备网络排错管理工具之IP链路测试工具
364 0
网工必备网络排错管理工具之IP链路测试工具
|
缓存 监控 网络协议
网工必备网络排错管理工具之IP_MAC地址工具
网工必备网络排错管理工具之IP_MAC地址工具
432 0
网工必备网络排错管理工具之IP_MAC地址工具
|
机器学习/深度学习 安全 JavaScript
|
网络协议 数据安全/隐私保护 芯片