【自我介绍】
某不知名top大学经济管理学院边缘专业,研究生二年级,通过老师和学长、一些服务器的宣传界面了解到阿里的高校免费轻量级服务器计划
【用途】
主要用途:需要每天定时爬虫请求大量网站的数据,想着搞个服务器可以实现自动化爬虫,就先用这个免费的试了试~
次要用途:可以建立一个自己的博客网站,记录一下自己的发表和研究兴趣。。
【个人基础】
有一点点Linux命令基础(只上了一点点课,了解一些最基础的代码,大多数时候还是百度和谷歌查询面临的问题),但在计算机专业方面可以说是非常小白了,所以经常遇到一系列奇奇怪怪但其实很简单的问题。对于一些很计算机系统和数据库系统很底层的东西不是很了解,也遇到非常多的坑吧。。。
【使用感受】
阿里云ECS自己的ali linux系统已经集成了很多工具了,安装各种包的过程中也没有遇到什么问题,仅用了几个小时就搞定了自己爬虫所需要的selenium以及签名算法所依赖的一系列包,并成功运行上爬虫的代码。运行的速度还是挺快的,就是这个计划的时间好像有些过于短了hhhhh,不知道能否延长到like 半年??
【问题】
- mac终端ssh链接容易断开连接
尽管自己的爬虫程序不需要一直连接(设置了nohup &),但是我发现ssh连接上了之后如果不操作,很快就会断开连接,不知道这个问题该如何解决,或者在哪里可以设置??
- 学生计划能不能出更多配置,比如3年?
【总结收获】
挺好的一次尝试,准备买一个轻量级的服务器,搞个自己的小网站,并且常规的爬取一些数据,以后的研究可能会有用。
【爬虫显示截图】