错误排查思路:如何排查Connection refused

本文涉及的产品
云防火墙,500元 1000GB
.cn 域名,1个 12个月
简介: 遇到ConnectionRefused Exception异常时的排查思路和常见的linux网络命令

问题出现场景

我在使用hdfs的时候,报出如下异常:

java.net.ConnectException: Connection refused

排查思路

 ConnectionRefused Exception的定义如下:

You get a  ConnectionRefused Exception when there is a machine at the address specified, but there is no program listening on the specific TCP port the client is using -and there is no firewall in the way silently dropping TCP connection requests.

—— http://wiki.apache.org/hadoop/ConnectionRefused

即对应地址和端口没有进程进行TCP监听。

那么大致的排查思路就有了,从上到下为:

  1. 确保ip和端口正确(已经服务器应用是否启动)
  2. ping一下网络,看是否正常
  3. 查看端口是否有TCP监听
root@ecs-284712:~ netstat -tlpn
Active Internet connections (only servers)
Proto Recv-Q Send-Q Local Address           Foreign Address         State       PID/Program name    
tcp        0      0 127.0.0.53:53           0.0.0.0:*               LISTEN      537/systemd-resolve 
tcp        0      0 0.0.0.0:50070           0.0.0.0:*               LISTEN      10442/java          
tcp        0      0 0.0.0.0:22              0.0.0.0:*               LISTEN      2280/sshd           
tcp        0      0 0.0.0.0:50010           0.0.0.0:*               LISTEN      10613/java          
tcp        0      0 0.0.0.0:50075           0.0.0.0:*               LISTEN      10613/java          
tcp        0      0 0.0.0.0:50020           0.0.0.0:*               LISTEN      10613/java          
tcp        0      0 127.0.0.1:9000          0.0.0.0:*               LISTEN      10442/java          
tcp        0      0 0.0.0.0:50090           0.0.0.0:*               LISTEN      10809/java       

当发现地址为127.0.0.1时要注意,该地址仅单机可使用,外界不能连接。(一般都是/etc/hosts文件的域名映射不正确,将localhost映射为127.0.0.1, 我个人将hdfs配置文件etc/hadoop/core-site.xml中的localhost改为0.0.0.0可行)

  1. 查看防火墙是否开放该端口
# 1. 查看ufw的状态
root@ecs-284712:~ sudo ufw status

# 2. 开启ufw
root@ecs-284712:~ sudo ufw enable


# 3. 重启防火墙
root@ecs-284712:~ sudo ufw reload

# 4. 对外开启端口
root@ecs-284712:~ sudo ufw allow 9000


# 5. 关闭防火墙
root@ecs-284712:~ sudo ufw disable
  1. 阿里云、华为云等ESC服务器,一般要在安全组配置对应端口

ps: 顺便吐槽一下,我的云服务器突然ssh登陆不上了,找了一下午才发现是因为我开启了防火墙,没把端口22开放。

补充: linux常见网络请求

网络环境查看命令

  • ifconfig : 查看IP与子网掩码
  • 关闭与启动网卡

    • ifdown 网卡设备名 :禁用该网卡设备
    • ifup 网卡设备名 :启用该网卡设备
  • route 命令设置网关

    • route -n 查看路由列表(可以看到网关)
    • route add default gw 192.168.1.1 临时设置网关
  • netstat 选项 :查询网络状态

    • -t:列出TCP协议端口
    • -u:列出UDP协议端口
    • -n:不使用域名与服务名,而是使用IP地址和端口号
    • -l :仅列出在监听状态网络连接
    • -a:列出所有的网络连接
$ netstat -tn
Active Internet connections (w/o servers)
Proto Recv-Q Send-Q Local Address           Foreign Address         State
tcp        0      0 172.16.247.46:47302     100.100.30.25:80        ESTABLISHED  //已经建立连接
tcp        0     36 172.16.247.46:22        171.14.145.224:32371    ESTABLISHED
tcp        0      0 172.16.247.46:22        171.14.145.224:32732    ESTABLISHED
$ netstat -tnl
Active Internet connections (only servers)
Proto Recv-Q Send-Q Local Address           Foreign Address         State
tcp        0      0 0.0.0.0:8080            0.0.0.0:*               LISTEN   //说明tomcat已经启动
tcp        0      0 0.0.0.0:22              0.0.0.0:*               LISTEN
tcp        0      0 127.0.0.1:8005          0.0.0.0:*               LISTEN
$ netsate -an | grep  ESTABLISHED | wc -l   统计建立的连接数 

网络通信命令

  • ping [选项] ip或域名 : 探测指定IP或域名的网络状况. ( -c 次数:指定ping包的次数)
  • telnet [ip或域名] [端口] : 远程管理与端口探测命令。由于telnet明文传输,不建议用于远程管理,但可以探测端口是否开启。
  • traceroute [选项] ip或域名 : 路由跟踪命令(采用ICMP协议,-n 使用IP,不使用域名,速度更快
  • wget命令:下载命令

Linux环境变量

Linux环境变量设置

  • /etc/environment : 设置整个系统的环境。

img

  • /etc/profile : 此文件为所有用户设置环境信息。当用户第一次登录时,该文件被执行。
  • /etc/bashrc : 为每一个运行bash shell的用户执行此文件.当bash shell被打开时,该文件被读取。
  • ~/.bash_profile : 文件为单个用户设置环境信息。当用户登录时,该文件仅仅执行一次。默认情况下,他设置一些环境变量,执行用户的.bashrc文件。
  • ~/.bashrc : 当登录时以及每次打开新的shell时,该文件被读取。(zsh配置 ~/.zshrc)
  • ~/.bash_logout: 当每次退出系统(退出bash shell)时,执行该文件。
  • export: 设置临时变量。终端关闭时失效。
相关文章
|
关系型数据库 MySQL 数据库
一文剖析MySQL主从复制异常错误代码13114
一文剖析MySQL主从复制异常错误代码13114
1123 0
|
2月前
|
网络协议 Java 网络安全
如何处理“协议异常”错误
当遇到“协议异常”错误时,通常需要检查网络连接、防火墙设置和软件版本。确保所有组件都是最新的,并尝试重新启动设备或应用程序。如果问题持续存在,请联系技术支持以获取进一步的帮助。
156 59
|
6月前
|
网络协议
邮件发送失败SPF报错问题排查解决方法
在邮件服务中, SPF报错常因域名未正配SPF记录致邮件被拒收。SPF用于防邮件欺诈,指定可代表域发邮件的服务器。常见SPF报错原因包括:缺少记录、格式错误、记录过长及新服务器未包含在记录中。排查步骤:检查记录存在性、验证格式、优化长度、确认服务器已包含。使用AOKSend时,获取其SPF记录并加入到DNS中。完成配置后测试邮件并利用服务日志进一步诊断问题。正确配置SPF能提高邮件送达率。
|
监控 网络协议 前端开发
502问题怎么排查?
502问题怎么排查?
190 0
|
Web App开发 开发框架 安全
503错误和500错误故障解决案例
记录下特殊的503和500报错场景
221 0
|
缓存 运维 网络协议
ping 问题分析
ping 问题分析
662 0
ping 问题分析
|
消息中间件 监控 druid
排查数据库连接池错误
最近在使用druid数据源时,碰到一个问题closed connection。在本地及测试环境都运行正常,但是在正式环境,过一段时间就出现closed conneciton问题,关闭的连接。
788 0
|
网络协议 NoSQL Redis
predis连接问题(connection refused)排查
## 背景 最近有用户报使用PHP客户端`predis`访问阿里云`Redis`(原`KVStore`)时,会出现`connection refused`错误,用户怀疑是因为后端连接数超了,导致连接被拒绝,但是监控看连接数并没有超过阈值,进而怀疑是后端redis的连接数限制逻辑有问题,经过排查发现连接数限制逻辑并没有问题,下面说下具体的排查过程。 ## 排查过程 通常通过`socke
8942 0
如何解决URLerror中的异常?原来这样也行
前言 我们每次编写爬虫程序的时候,总会遇到一些异常,相信大家都很头疼的去百度,却没什么效果,本节为你们介绍两个普通的异常,,,,,URLError还有HTTPError,以及对它们的一些处理。 1.URLError 首先解释下URLError可能产生的原因: · 网络无连接,即本机无法上网 · 连接不到特定的服务器 · 服务器不存在 在代码中,我们需要用try-except语句来包围并捕获相应的异常。
1807 0