本人就读的专业是数据科学与大数据技术,目前大三。大二时学习了Hadoop、Hive、Hbase等一些需要在服务器集群上运行的大数据工具,在校学习时使用的是本地的三台Linux虚拟机搭建的集群。我一直想在真正的服务器上搭建一个hadoop集群,经同学介绍,了解了“飞天加速计划·高校学生在家实践”活动。
在使用服务器这段时间,我的操作系统是centOS7,我在服务器上安装了java8、python3.7和mysql,部署了一个自己写的密码管理系统的javaweb项目(本来是想把服务器和两台本地虚拟机共同搭建Hadoop集群,但尝试后发现服务器无法ping通虚拟机,终没能解决)。
在这期间,我找到了一些能够提高服务器使用效率的工具和方法。首先是一个我认为比较好用的远程控制终端的软件——finalshell。我以前一直在用xshell,但对于服务器的性能监控不了解,而在finalshell中,我可以直观的看到服务器的CPU占用、内存占用、网络等实时状况,也可以以树状图的形式看到文件分布。对于服务器的整体情况掌握有很大帮助。
其次是Linux上的会话控制软件——tmux。这个软件可以进行终端复用,也就是可以在一个终端窗口中开启多个会话。虽然在终端控制软件上双击即可开启一个新的窗口,但是如果直接操作服务器的话还是要用tmux。tmux还有一个我很喜欢的功能,就是可以在自己建的会话中看到以前执行的命令。在终端控制软件中如果关闭窗口再重新打开,你的历史命令就看不到了,而在tmux中可以复现。
再次是Mycli这款mysql辅助软件。它可以想idea一样提示mysql中的命令,以免我偶尔手残敲错。最后是大名鼎鼎的vim,它扩展了原本vi中没有的功能,配置各种软件的参数方便了许多。
在使用期间,我也遇到了一些问题。我在使用rm -rf命令时偶尔会一不小心手残删错,每次都要吓死。我以前也看过公司员工在生产环境中误删数据库的新闻。我想到的解决办法是仿照Windows上的回收站操作。我可以新建一个名为RecycleBin的文件夹作为回收站,写脚本将删除操作替换为将被删除的文件mv到RecycleBin文件夹下,然后对存放时间超过七天的文件使用定时脚本进行统一删除。后来我了解到也可以使用Linux的自定义命令实现。
在“高校学生在家实践”的活动中,我学到了许多东西。我体验到了真正的服务器与本地虚拟机之间的差异,真正的服务器需要你时刻关注其硬件使用状况,而本地虚拟机由于配置较高,就没有考虑过这些。我还感受到了服务器的延迟问题,我在使用本地Navacat与服务器上的mysql进行连接与数据读取写入时,有时需要加载好一会。这期间最让我难忘的是我写javaweb项目过程。这学期我有javaweb选修课,恰好也有服务器,所以我想在服务器上部署一个javaweb项目。但是服务器只有两周时间,而且我只有Java基础,所以我必须提前学习javaweb的相关知识。当时老师才刚刚讲到DAO层。于是我花了好几天把maven、springboot、mybatis、html、css、thymeleaf等的入门知识都自学了一遍,自己完成了Service层和Controller层还有前端的编写。在这期间遇到各种各样谜之错误,有的网上还找不到解决方法,只能自己翻源码,无数次想要放弃,但又觉得机会难得,不能白白浪费。最后功夫不负有心人,终于完成了一个十分简易的网站,但由于我的编写经验不足,网站的页面和逻辑方面的问题有很多,上线测了几把就匆匆下线。但是这个过程让我感到自己成长了许多,觉得以前看起来很高深的东西比如springboot,真正投入学习时其实也不是很难,只要肯坚持下去,总会有个名堂的。以后我也会继续我的大数据之路,如果能够成功免费续租服务器,我将会继续完善我的网站。