我是来自于网络空间安全专业的一名大三学生,本学期选修了云计算课程,上课实践需要用到云服务器,因为看到其他学生在阿里云社区发布的ecs使用体验文章,就选择了阿里云服务器来完成作业。
我用阿里云的ecs主要是部署了hadoop的伪分布式模式来进行mapreduce实验,完成的任务是统计英文文章中前k多的词语。自己编写了mapper和reducer的python代码之后,用ftp发送到云服务器上,然后上传到hdfs上运行。在配置hadoop的过程中,顺便学习到了云服务器的linux操作系统的基本使用、ssh免密登录配置、vsftpd服务的配置和使用、linux系统的权限管理等等。
本次ecs使用过程中尤其值得一提的是,我的云服务器遭受了两次黑客攻击,被下了矿机,而且两次被攻击的漏洞都不同。第一次是犯了很低级的错误,配置vsftpd服务的时候我为远程用户使用ftp新建了一个用户,而这个用户的密码非常简单,结果被黑客爆破了密码,用ssh远程登录了,就在云服务器上部署了挖矿程序。因为害怕自己没办法完全清除服务器上面的恶意文件和配置,我直接重装了一次系统。第二次则是我开启hadoop之后,开启了hadoop的webapp的两个端口,结果应该是这个端口开到公网上引起了漏洞,被感染了蠕虫病毒被获得了权限,又运行了挖矿脚本。而且我的几个在使用阿里云服务器的同学跟我经历了一样的被黑事件,可见这种事件真的非常普遍,我第一次这么直观地体会到了网络安全的重要性,黑客真的是无孔不入,尤其是当机器拥有了公网ip之后,几乎就成为了众矢之的,任何人都可以尝试去攻击你的服务器,我这一个私人用的小服务器都在短短两周内攻击了两次,可想而知商业服务的服务器都遭受了多少攻击压力,为了保证服务的正常运行,安全工程师又是做了多少努力。不过我这次被攻击的漏洞都是比较容易防止的,网络安全就是只要防护做到位了,黑客很难去攻克一个很安全的服务器。我也深深地感觉到我的网安知识过于浅薄了。
我的下一步目标是利用云服务器继续深入学习hadoop。
以下是我这次mapreduce统计词频的运行截图:
执行信息输出:
查看结果。