开发者社区> 技术小胖子> 正文

ThinkServer KVM网络故障一例

简介:
+关注继续查看

最近新上了一批ThinkServerRD640,KVM的网口lan0,在BIOS里可以设置为专有,共享等模式,默认为共享模式。共享模式下,该网口除了能做KVM管理外,还能在操作系统里当做一个百兆的网卡,不清楚联想的设计是怎么想的,这个年代服务器上要个百兆的网口做什么。

最大的问题是,如果作为共享模式呢(默认配置),如果服务器冷启动,热启动等等操作,如果你ping管理口的管理IP会发现 在服务器自检到网卡以前是ping不通的,就是说 这个管理口KVM你想进入BIOS或raid卡是不可能的。则在BIOS里改为专享模式。改为专享模式,机器自检时只能检测到2个网卡,此时的KVM口只能做KVM作用。

在一直ping该KVMIP的时候会发现,机器在重启操作的时候会有个10秒左右的丢包现象。接显示器看的话,可以发现等你能ping通可以远程KVM管理操作的时候,机器已经过了F1进入BIOS的阶段了。

当时就在想,这他妈的是谁设计的!

再与800工程师联系后,工程师得出的结论是某些批次(不是所有RD640的服务器)的KVM的BMC芯片和CISCO的生成树协议有冲突,机器重启的时候,导致交换机认为此时该网口离线了,因此把交换机该端口进行重启检测该端口,cisco的交换机端口检测是需要时间的,因此会有该现象。

800工程师给的解决方案是 给我提供一个特殊的BMC 然后刷新进去就可以了,同时800工程师表示刷进去后该网口就可能是10M的了。

为了验证工程师的说话,将笔记本网线和服务器的KVM口直连,ping 然后重启,发现这时候不会有掉包现象,准确的说是掉一个包,不影响KVM管理。

刷BMC是可以接受的,刷新后KVM变10M 实际上也可以接受,不能接受的是 可能变10M 这个可能 的潜台词莫非是说也有其他可能性?

因此决定从交换机头来解决。

登录交换机后:

Password: 

s041>enable

Password: 

s041#ping 192.168.48.X  (ping 管理口IP)


Type escape sequence to abort.

Sending 5, 100-byte ICMP Echos to 192.168.48.122, timeout is 2 seconds:

!!!!!

Success rate is 100 percent (5/5), round-trip min/avg/max = 1/5/17 ms

s041#show arp

Protocol  Address          Age (min)  Hardware Addr   Type   Interface

Internet  192.168.48.X           -   5006.04d5.4ac0  ARPA   Vlan1

Internet  192.168.48.1X          0   70e2.8405.a0ca  ARPA   Vlan1

Internet  192.168.51.X           5   0050.56b2.4383  ARPA   Vlan1

Internet  192.168.50.XX          0   000d.b004.03b8  ARPA   Vlan1

s041#show mac add

s041#show mac address-table | i 70e2.8405.a0ca 查该mac在哪个端口上

   1    70e2.8405.a0ca    DYNAMIC     Fa0/36

conf t  进入配置

interface fastEthernet 0/36 进入端口

spanning-tree portfast trunk 启用该端口的port fast

exit

exit

wr

然后在测试,机器重启过程 一直能ping通KVM IP


      本文转自天山三害 51CTO博客,原文链接:http://blog.51cto.com/skybug/1419843,如需转载请自行联系原作者






版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
在与 SQL Server 建立连接时出现与网络相关的或特定于实例的错误
错误信息: 标题: 连接到服务器 ------------------------------ 无法连接到 (local)。 ------------------------------ 其他信息: 在与 SQL Server 建立连接时出现与网络相关的或特定于实例的错误。未找到或无法访问服务器。请验证实例名称是否正确并且 SQL Server 已配置为允许远程连接。 (provider
1652 0
在与SQL Server建立连接时出现与网络相关的或特定于实例的错误
        向往前一样,学习牛腩新闻发布系统的视频,敲代码,打开数据库,出现一个框框,详细内容如下:                 数据库连接不上,所有的工作都要歇班,捣鼓了会儿,简单总结一下解决该问题的方法。
1603 0
阿里云服务器如何登录?阿里云服务器的三种登录方法
购买阿里云ECS云服务器后如何登录?场景不同,阿里云优惠总结大概有三种登录方式: 登录到ECS云服务器控制台 在ECS云服务器控制台用户可以更改密码、更换系.
29133 0
sql server 性能调优 资源等待之网络I/O
原文:sql server 性能调优 资源等待之网络I/O 一.概述    与网络I/O相关的等待的主要是ASYNC_NETWORK_IO,是指当sql server返回数据结果集给客户端的时候,会先将结果集填充到输出缓存里(ouput cache),同时网络层会开始将输出缓存里的数据打包,由客户端接收。
1018 0
Flink之CEP案例分析-网络攻击检测
上一篇我们介绍了Flink CEP的API,这一篇我们将以结合一个案例来练习使用CEP的API编写应用程序,以强化对API的理解。所选取的案例是对网络遭受的潜在攻击进行检测并给出告警。当下互联网安全形势仍然严峻,网络攻击屡见不鲜且花样众多,这里我们以DDOS(分布式拒绝服务攻击)产生的流入流量来作为遭受攻击的判断依据。
2852 0
阿里云服务器端口号设置
阿里云服务器初级使用者可能面临的问题之一. 使用tomcat或者其他服务器软件设置端口号后,比如 一些不是默认的, mysql的 3306, mssql的1433,有时候打不开网页, 原因是没有在ecs安全组去设置这个端口号. 解决: 点击ecs下网络和安全下的安全组 在弹出的安全组中,如果没有就新建安全组,然后点击配置规则 最后如上图点击添加...或快速创建.   have fun!  将编程看作是一门艺术,而不单单是个技术。
20693 0
阿里云服务器怎么设置密码?怎么停机?怎么重启服务器?
如果在创建实例时没有设置密码,或者密码丢失,您可以在控制台上重新设置实例的登录密码。本文仅描述如何在 ECS 管理控制台上修改实例登录密码。
23579 0
21114
文章
0
问答
文章排行榜
最热
最新
相关电子书
更多
JS零基础入门教程(上册)
立即下载
性能优化方法论
立即下载
手把手学习日志服务SLS,云启实验室实战指南
立即下载