服务器中毒了——菜是原罪

简介: 服务器中毒了——菜是原罪

周五朋友生日,刚吃完饭准备唱歌,接到消息说业务支付失败,问题是银行前置机无法正常和银行建立连接。


640.png


我麻了......


这台服务器是银行那边亲自搭的,说实话我很少去管理:
1、是一台Windows服务器,我也不熟悉(太菜:路走窄了)
2、不知道银行装了什么东西,动了会不会造成其他问题(还是太菜:心里畏惧了)
3、业务量也不大,平时也没出现啥问题(还是太菜:惯性思维)

但是出了问题,不得不管呀,歌也没唱了 ,跑到车库,打开电脑,开始一顿瞎操作。

先去查了所有的监控数据(这个时候就靠它了)。

首先确定CPU、内存、磁盘IO、网络等都是正常的。


640.png

640.png

640.png


但是发现在问题时间点,前置机的连接数非常高(也许这就是问题的关键)。


640.png


没办法,先试试能不能远程进服务器,发现是OK的。

先使用网络排查三板斧:(1)打开浏览器访问域名,发现无法建立连接。(2)Ping域名,发现域名可以正常解析。(3)Telnet IP+Port,发现Telnet不通。

当时也没往连接数已经使用完上想(菜的扣脚)。

然后就去找Windows的事件日志了,日志实在是太多了,多的发麻,看的头晕脑花,不过功夫不负有心人,还是发现点问题,如下:


bbaa3a41a285bdf0d8c0727819d59978.png


0dc472b9ba2bdd47e7eebfd037cb3109.png



啥意思?

就是本地端口用完了,没有多余的端口可以分配使用会导致无法与外部通信。

啥意思?

这就要说到TCP三次握手了,TCP客户端和服务器连接时,客户端必须分配一个动态端口,不过这里就继续赘述了,大家都是大佬。

Windows默认动态端口范围是1024-5000,也就是只能发起约4000个Socket连接,然后第一反应就是增大动态端口分配范围(简直太聪明了)。

然后我就更改了注册表([HKEY_LOCAL_MACHINE\System\CurrentControlSet\Services\Tcpip\Parameters]),把端口范围增大到2000,然后重启了服务器(名副其实的SRE(Server Reboot Enginer))。


d17db9a2c6ff09dc3fbc0f8e9e976dd7.png


服务器重启过后,肯定是可以正常服务了,毕竟没有重启解决不了的问题,如果有,那就再重启几次。


但是事情就这么完了?


当然不,得找找为什么会有这么多连接,正常的业务情况下,不会出现这种问题。

所以就打开控制台,使用natstat -ano,不看不知道,一看吓一跳,发现非常多的链接都是和47.95.x.x进行的。


f9a44608dd94182d352b704a1d3f97cf.png


我使用netstat -ano | find "47.95.x.x" | find /c "80"一查,刚起的机器,就有2000多个连接了,着实吓到我了。

先问业务方,确认该IP是不是第三方的,得到明确答案不是,我开始慌了。

然后在网上查,发现这个IP是阿里云北京数据中心的。


62f198961e2d7f764026cefc6d8ad131.png


一开始以为是阿里云的某些公用云服务,比如阿里云盾、云监控等(懂的都懂)。

所以就直接找阿里咯,得到回复说不是阿里云盾这些服务的IP,我慌的一批,一种不好的预感萦绕心头。

马上把这个IP禁用了,在安全组给限制掉。


ef74113581476fb28de552e89653ba72.png

617f39c3f1bfeb646175f94ef48752c2.png


然后从netstat -ano可以发现主要是通过1060这个进程建立连接的


26bb35ac17a95286220eec58c1d3af21.png


uqccmg这个进程一看就非常规进程(不符合约定俗成的命名规则),当然也要确认一番。

得到准确答案后,尝试杀掉该进程,杀了又起,杀了又起,抓麻了。

然后通过进程去找到了文件,


986840df791ac4fe192725fe1ea587f1.png


看这非主流的图标,中毒无疑了。

试着删除该文件,当然是失败了,不过,也知晓了该进程是通过.net服务托管着的,那我就把.net停掉呗,反正没用这个服务。


ae5958014a194eb714b222a048825538.png


停掉过后,确实可以杀该进程,而且也没有再启动了,连接也少了。

BUT,不要那么乐观......

病毒还是在的,只是没起了而已,仅此而已。

所以只有借助杀毒软件了,下了一个火绒,居然发现17个风险项目。


4288c45ecb3f39c12bcdc01693293d3d.png


先通过杀毒软件把这个病毒干掉,具体有没有干干净我也不知道了(菜是原罪)。

业务现在可以正常使用,socket连接也是正常的,没再发现可疑进程 。

但是,心里总是没底,最好的办法还是重装,这还需要评估下迁移和安装成本,主要不是咱们自己安装,也不知道.....

通过这个经历,发现自己还是太菜:
1、没有做好系统安全加固,没有安装杀毒软件啥的,主要是阿里云的云盾太贵.....
2、没有经常检查服务器,没做好日常巡检
3、开放了没必要开放的端口(银行开的,我也不敢关,咋办?)
4、对Windows服务器天生逆反之心

相关文章
|
2月前
|
安全 数据安全/隐私保护 数据中心
服务器中毒怎么办?企业数据安全需重视
互联网企业包括基础层、服务层和终端层,后者涉及网络服务、内容提供、应用服务等。随着业务发展,企业积累了大量数据,数据安全成为关注焦点,尤其是防范服务器中毒导致的数据泄露。中毒迹象包括文件消失、程序异常、启动项可疑、运行缓慢、杀毒软件失效、系统语言改变、蓝屏或黑屏、主页篡改、广告弹窗、程序图标篡改等。中毒原因可能源自源程序漏洞、FTP漏洞、不安全的上网行为和弱后台口令。处理中毒需断网、备份重要文件、运行杀毒软件、在DOS下杀毒、恢复系统并更改网络密码。预防措施包括打补丁、安装杀毒软件、定期扫描、谨慎点击链接和下载、不随意执行附件程序等。
|
2月前
|
存储 安全 网络安全
怎么看服务器是中毒了还是被攻击?以及后续处理方案
怎么看服务器是中毒了还是被攻击?以及后续处理方案
|
安全 Windows
简单快速诊断Windows服务器是否中毒或被入侵
Windows 系统中毒或被入侵后,可能会导致系统报错、系统进程 CPU 或内存使用异常、无法远程等诸多问题。遇到这类问题后往往都比较急躁,不知如何下手,今天技术专家五贤来教大家如何诊断你的服务器是否有病毒?
|
安全 NoSQL 网络协议
ECS被攻击中毒沦为矿机的修复过程
近期,登录阿里云官网购买的服务器,看到云安全中心分数非常低,查看了“安全告警处理”,发现疑似受到了攻击。 于是,跟挖矿病毒的一场博弈开始了。
1227 1
ECS被攻击中毒沦为矿机的修复过程
|
安全 网络安全 数据安全/隐私保护
|
安全 网络安全 数据库
阿里云区域服务内容:网站服务器中毒了,如何处理
 好不容易做好的网站,如果服务器经常中毒,网站打不开,岂不是令人十分头疼的事情。下面,阿里云区域服务商武汉捷讯小编为大家来支招。
3346 0
|
安全 网络安全 数据安全/隐私保护
|
2天前
|
弹性计算 安全 Shell
阿里云ECS安全加固:从访问控制到数据保护的全方位策略
【6月更文挑战第29天】阿里云ECS安全聚焦访问控制、系统加固及数据保护。安全组限定IP和端口访问,密钥对增强SSH登录安全;定期更新补丁,使用防病毒工具;数据备份与加密确保数据安全。多维度策略保障业务安全。
24 15
|
2天前
|
弹性计算
阿里云ECS使用体验
在申请高校学生免费体验阿里云ECS云服务器后的一些使用体验和感受。