《企业运维之弹性计算原理与实践》——ECS 进阶概念-运维——第三章(下)实验 2:ECS 问题排查及实验案例(1) https://developer.aliyun.com/article/1231582?groupCode=supportservice
二、 实验:远程连接排查
实验概述:排查 ECS 无法正常 SSH 并修复问题。
【思路 1】:根据日志报错信息逐一排查并修复问题。
操作步骤:
1) 进入实例列表,找到需要进行远程连接排查的实例,单击实例右侧的远程连
接,选择 VNC 远程连接。
2) 输入用户名 root+密码登录实例。
说明
输入完成后按回车键即可,登录 Linux 实例时界面不会显示密码的输入过程。
3) 查看网络连接信息。
netstat -ntlp
如图所示,只有端口 80 和端口 25 被监听,并且没有 SSH 服务。
4) 尝试手动启动 SSH 服务,发现无法启动。
systemclt start sshd
5) 查看日志
systemclt status sshd
报错:日志显示在 ssh 配置文件的 137 行有错误。
6) 查看报错的配置文件。
vim /etc/ssh/sshd_config
:set nu #显示行号
:137 #跳到 137 行
在 test 前加#注释掉,然后输入:wq 保存。
7) 再次启动 SSH,仍然还是无法启动。
8) 查看日志,发现另一个报错。
报错:在目录/var/empty/sshd 中缺少权限。
建议
在运维过程中尽量不要进行删除操作,可以备份后进行修改。
9) 修复报错目录,SSH 恢复正常启动,端口 22 恢复监听。
【思路 2】:使用-t 预启动排查配置文件。
-t 参数:测试模式,专门用来检查配置文件和 key 的可用性。
操作步骤:
1) 进入实例列表,找到需要进行远程连接排查的实例,单击实例右侧的远程连
接,选择 Workbench 远程连接登录实例。
2) 进入登录页面,输入密码,单击确定。
3) 执行命令:/usr/sbin/sshd-t,快速找到问题原因,然后进行相关操作(操作同
上)。
《企业运维之弹性计算原理与实践》——ECS 进阶概念-运维——第三章(下)实验 2:ECS 问题排查及实验案例(3) https://developer.aliyun.com/article/1231579?groupCode=supportservice