[CentOS Python系列] 二.阿里云pscp上传下载服务器文件及phantomjs安装详解

简介: 本篇文章是作者学习部署阿里云服务器 CentOS环境,讲解pscp工具如何将Windows系统文件上传到云服务器中,同时将云服务器文件下载到本地;同时教大家如何安装phantomJS,它是一个无界面的浏览器,被广泛应用于Selenium自动化测试。基础性文章,希望您喜欢。

随着人工智能和深度学习的风暴来临,Python变得越来越火热,作者也准备从零学习这些知识,写相关文章。本篇文章是作者学习部署阿里云服务器 CentOS环境,讲解pscp工具如何将Windows系统文件上传到云服务器中,同时将云服务器文件下载到本地;同时教大家如何安装phantomJS,它是一个无界面的浏览器,被广泛应用于Selenium自动化测试和爬虫中。文章非常基础,希望这系列文章对您有所帮助,如果有错误或不足之处,还请海涵。

一. pscp上传下载文件

首先在Windows系统中下载pscp工具(pscp.exe),将其放置于putty软件目录下,然后输入Ctrl+R快捷键,打开CMD命令行模式,输入如下指令:

cd C:\Software\Programe Software\Putty
pscp ?
AI 代码解读

运行结果如下图所示,可以查看pscp命令的用法。

image.png

1.上传文件至云服务器

  • 命令:pscp 本地文件 用户名@ip地址:远端路径

比如将本地中文字体文件simsun.ttf上传到服务器中,调用指令为:

pscp C:\20180216\simsun.ttf root@39.107.105.166:/root/
AI 代码解读

image.png

将C盘20180216文件夹下的字体文件上传到服务器用户名为root的根目录下,注意需要输入服务器密码。

image.png

然后登陆云服务器,可以看到simsun.ttf文件已经上传。

image.png

2.下载文件至Windows系统

  • 命令:pscp 用户名@ip地址:远端路径 Windows文件路径

比如将阿里云服务器中的HelloWorld.py文件和test.py两个文件下载至本地C盘20180216文件夹,代码如下:

pscp root@39.107.105.166:/root/test.py C:\20180216
pscp root@39.107.105.166:/root/HelloWorld.py C:\20180216
AI 代码解读

image.png

Linux中cat命令用来查看源代码,rm命令用来删除文件(remove),如下图所示:

image.png

在CMD中执行该命令,如下所示:

image.png

可以看到Windows系统C:\20180216文件夹下已经成功下载了该文件,同时注意符号 \ 和 / 别写错。

image.png

3.上传文件夹至云服务器

  • 命令:pscp -r Windows文件夹 用户名@ip地址:远端路径

其中“-r”表示向下递归目录。现在需要将Windows系统的PhantomJS文件夹上传到云服务器root目录下,文件夹如下图:

image.png

CMD命令行中输入命令为:

pscp -r C:\phantomjs root@39.107.105.166:/root/
AI 代码解读

image.png

运行结果如下图所示,可以在服务器root目录下看到phantomjs文件夹,并包含各文件。

image.png

4.下载文件夹至Windows系统

  • 命令:pscp -r Windows文件夹 用户名@ip地址:远端路径

将云服务器中“root/eastmount”文件夹及文件下载至本地20180216文件夹,运行如下所示:

C:\Software\Program Software\Putty>pscp -r root@39.107.105.166:/root/eastmount C:\20180216\
root@39.107.105.166's password:
first.py                  | 0 kB |   0.1 kB/s | ETA: 00:00:00 | 100%
bsfirst.py                | 0 kB |   0.3 kB/s | ETA: 00:00:00 | 100%
AI 代码解读

本地显示结果如下图所示:

image.png

讲到这里pscp基本用法已经讲述结束,它主要用来Windows与Linux系统交互,但更多的可以在线下载安装。作者这里想上传Phantomjs来执行代码,但总是报错“Messag: phantomjs.exe executable may have wrong permissions.”。

下面详细讲解如何在Linux系统中下载Phantomjs并安装。


二. Phantomjs安装详解

PhantomJS是一个服务器端的 JavaScript API 的Webkit(开源的浏览器引擎)。其支持各种Web标准: DOM 处理, CSS 选择器, JSON, Canvas 和 SVG。PhantomJS可以用于页面自动化,网络监测,网页截屏,以及无界面测试等。

PhantomJS is a headless WebKit scriptable with a JavaScript API. It has fast and native support for various web standards: DOM handling, CSS selector, JSON, Canvas, and SVG. Full web stack No browser required.

首先补充下yum和apt-get的区别,一般来说Linux系统基本分为两大类:

  • RedHat系列:RedHat、CentOS、Fedora等,常见安装包格式命令为“rpm -参数”,包管理工具是yum,如“yum install xxx”,支持tar包。
  • Debian系列:Debian、Ubuntu等,常见安装包格式命令为“dpkg -参数”,包管理工具是apt-get,支持tar包。

当我们执行如下代码时,提示错误“-bash: phantomjs: command not found”,表示还未安装该包。

phantomjs -v
yum install phantomjs
AI 代码解读

同时,执行“yum install phantomjs”代码,没有可得到的扩展包,下面我们开始正式讲解吧。

image.png

作者准备将Phantomjs安装包下载至/root/eastmount文件夹下。

image.png

第一步 下载安装包

wget https://bitbucket.org/ariya/phantomjs/downloads/phantomjs-1.9.7-linux-x86_64.tar.bz2
AI 代码解读

image.png

第二步 解压文件

tar -xjvf phantomjs-1.9.7-linux-x86_64.tar.bz2
AI 代码解读

如下图所示:

image.png

解压后调用“ls”命令查看eastmount文件夹,包含了已经解压的phantomjs-1.9.7-linux-x86_64文件夹。

image.png

第三步 重命名文件夹并移动至/usr/local/phantomjs目录

mv phantomjs-1.9.7-linux-x86_64 /usr/local/phantomjs
AI 代码解读

调用“cd /usr/local/”命令去到指定目录下,在查看该目录所包含内容,可以看到已经解压的phantomjs文件夹。

image.png

第四步 建立连接,将可执行文件放入系统路径

去到“/usr/local/bin”文件夹下,可以看到此时还没有Phantomjs连接,接下来需要建立连接。

ln -s /usr/local/phantomjs/bin/phantomjs /usr/bin/
ln -s /usr/local/phantomjs/bin/phantomjs /usr/local/bin/
AI 代码解读

建立连接过程如下所示:

image.png

建立后的连接,可以看到phantomjs已经放入了系统文件夹,我的理解该步骤相当于Windows系统下的配置环境变量PATH。

image.png

image.png

第五步 安装依赖包

yum install fontconfig
yum install freetype2
AI 代码解读

image.png

第六步 检验Phantomjs是否安装成功

phantomjs -v
AI 代码解读

可以看到我们安装的版本为phantomjs 1.9.7。

image.png


三. Phantomjs基础代码

下面简单讲解Phantomjs基础代码。

1.Hello World

首先我们在root文件夹下创建一个test.js文件,命令如下:

ls
touch test.js --创建文件
vim test.js   --编辑文件
AI 代码解读

image.png

test.js代码如下:

console.log("Hello CSDN!!!");
phantomjs.exit();
AI 代码解读

image.png

输入“phantomjs test.js”执行代码输出“Hello CSDN!!!”。

image.png

2.获取网页标题

创建baidu.js文件,并编辑代码。

image.png

baidu.js代码:

var page = require('webpage').create();
page.open('http://www.baidu.com', function (status) {
     var title = page.evaluate(function () {
         return document.title;
     });
     console.log('Page title is ' + title);
     phantom.exit();
});
AI 代码解读

image.png

输出结果如下图所示“百度一下,你就知道”。

image.png

3.简单下载图片

同样的方法创建一个baidupic.js文件,代码如下:

var page = require('webpage').create();  
page.open('http://www.baidu.com', function () {  
    page.render('example.png');  
    phantom.exit();  
});
AI 代码解读

image.png

输出结果如下,可以看到“example.png”被下载至root目录下。

image.png

讲到这篇文章就介绍结束了,本文的目的是为了后面的Selenium自动化测试及爬虫操作,希望文章对您有所帮助,同时会继续深入学习,包括爬虫过程、定时爬虫、数据库操作、服务器搭建等内容。

很高兴重回阿里云,开心能与大家在这里认识,希望能分享更高质量的文章帮助大家,且行且珍惜!

(By:Eastmount 2021-11-08 夜于武汉)

相关实践学习
借助OSS搭建在线教育视频课程分享网站
本教程介绍如何基于云服务器ECS和对象存储OSS,搭建一个在线教育视频课程分享网站。
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情: https://www.aliyun.com/product/ecs
目录
打赏
0
0
0
0
3
分享
相关文章
【解决方案】Building wheel for opencv-python:安装卡顿的原因与解决方案
当你安装OpenCV时,命令行停在Building wheel for opencv-python (PEP 517) ... -似乎卡住了。这并非程序假死,而是其编译耗时巨大。本文将揭示原因,并提供优化安装体验的实用方法。
87 1
|
8天前
|
使用SCP命令在CentOS 7上向目标服务器传输文件
以上步骤是在CentOS 7系统上使用SCP命令进行文件传输的基础,操作简洁,易于理解。务必在执行命令前确认好各项参数,尤其是目录路径和文件名,以避免不必要的传输错误。
86 17
如何利用Python批量重命名PDF文件
本文介绍了如何使用Python提取PDF内容并用于文件重命名。通过安装Python环境、PyCharm编译器及Jupyter Notebook,结合tabula库实现PDF数据读取与处理,并提供代码示例与参考文献。
如何利用Python批量重命名文件
本文介绍了如何使用Python和PyCharm对文件进行批量重命名,包括文件名前后互换、按特定字符调整顺序等实用技巧,并提供了完整代码示例。同时推荐了第三方工具Bulk Rename Utility,便于无需编程实现高效重命名。适用于需要处理大量文件命名的场景,提升工作效率。
当Python同时操作1000个文件时,为什么你的CPU只用了10%?
本文介绍如何构建一个高效的文件处理系统,解决单线程效率低、多线程易崩溃的矛盾。通过异步队列与多线程池结合,实现任务调度优化,提升I/O密集型操作的性能。
44 4
Jupyter MCP服务器部署实战:AI模型与Python环境无缝集成教程
Jupyter MCP服务器基于模型上下文协议(MCP),实现大型语言模型与Jupyter环境的无缝集成。它通过标准化接口,让AI模型安全访问和操作Jupyter核心组件,如内核、文件系统和终端。本文深入解析其技术架构、功能特性及部署方法。MCP服务器解决了传统AI模型缺乏实时上下文感知的问题,支持代码执行、变量状态获取、文件管理等功能,提升编程效率。同时,严格的权限控制确保了安全性。作为智能化交互工具,Jupyter MCP为动态计算环境与AI模型之间搭建了高效桥梁。
217 2
Jupyter MCP服务器部署实战:AI模型与Python环境无缝集成教程
[oeasy]python094_使用python控制音符列表_midi_文件制作
本文介绍了如何使用Python控制音符列表制作MIDI文件。首先回顾了列表下标索引(正数和负数)的用法,接着通过`mido`库实现MIDI文件生成。以《两只老虎》为例,详细解析了代码逻辑:定义音高映射、构建旋律列表、创建MIDI文件框架,并将音符插入音轨。还探讨了音符时值与八度扩展的实现方法。最终生成的MIDI文件可通过不同平台播放或编辑。总结中提到,此技术可用于随机生成符合调性的旋律,同时引发对列表其他实际应用的思考。
50 5
Python文件与目录比较全攻略:从基础操作到性能优化
文件比较的核心在于数据指纹校验,通过逐字节比对生成唯一标识,确保内容一致性。从标准库的os与filecmp到高性能第三方库如pydiffx,再到分布式与量子加密技术的未来趋势,文件比较广泛应用于数据备份、代码审查与系统监控等领域,是保障数据完整性的关键技术手段。
41 0
Python爬虫结合API接口批量获取PDF文件
Python爬虫结合API接口批量获取PDF文件
Python 文件操作进阶|使用 shutil 实现高效文件复制
在开发和运维中,处理大量文件是常见需求,如备份配置、归档日志或构建部署包。手动复制粘贴已无法满足高效需求!Python 的 `shutil` 模块提供了强大的文件操作功能,支持单文件复制、目录树迁移及自动化任务构建。本文详解 `shutil.copy()` 基础用法与进阶技巧,如批量复制、自动路径检测、时间戳命名备份等,助你实现高效自动化。结合实战案例(如自动备份系统),让你的代码更专业!学习后,欢迎交流心得,一起精进 Python 技能。关注我,获取更多编程技巧与源码分享!

热门文章

最新文章

AI助理
登录插画

登录以查看您的控制台资源

管理云资源
状态一览
快捷访问

你好,我是AI助理

可以解答问题、推荐解决方案等