Python操作FTP服务器实现文件和文件夹的上传与下载,python清理ftp目录下的所有文件和非空文件夹

简介: Python操作FTP服务器实现文件和文件夹的上传与下载,python清理ftp目录下的所有文件和非空文件夹

第一章:连接 FTP 服务器并实现文件夹上传

① 连接 FTP 服务器

如果 FTP 不用用户名密码就直接可以访问,那就是用的默认用户名 Anonymous,密码为空。

# -*- coding: UTF8 -*-
# 2022-3-10
# 作者:小蓝枣
# python连接ftp服务器
from ftplib import FTP
def conn_ftp():
    '''
     作用:连接ftp服务器
     参数:无
     返回:ftp服务器连接的对象
    '''
    # FTP连接信息
    ftp_ip = "xx.xx.xx.xx"
    # 默认端口21
    ftp_port = 21
    # 如果未指定,使用默认用户名为Anonymous,密码为空
    ftp_user = "Anonymous"
    ftp_password = ""
    ftp = FTP()
    # 连接ftp
    ftp.connect(ftp_ip, ftp_port)
    # ftp登录
    ftp.login(ftp_user, ftp_password)
    # 查看欢迎信息
    print(ftp.getwelcome())
    return ftp
ftp = conn_ftp()

② 区分文件和文件夹名

从方法 ftp.dir() 返回结果可以看到包含 <DIR> 标识的为文件夹,我们根据这个特征来进行文件夹区分。

def diff_dir(ftp, path):
    '''
     作用:区分文件和文件夹
     参数1:ftp连接对象
     参数2:要展示的目录
     返回:无
    '''
    # 进入指定目录
    ftp.cwd(path)
    # 显示当前所在位置
    print("当前所在位置为:")
    print(ftp.pwd())
    # 展示目录内容
    print("\n显示目录内容:")
    dirs = []
    ftp.dir(".", dirs.append)
    for i in dirs:
        # 区分文件和文件夹
        if("<DIR>" in i):
            print("目录为:" + i.split(" ")[-1])
        else:
            print("文件为:" + i.split(" ")[-1])
path = "/CaseData/nc.vo.sdp.testcase.testcase.TestcaseHVO/"
diff_dir(ftp, path)

f0075898e81d432fadd3f6f3c05ea1e0.png

③ 文件夹名包含空格处理

split(" ")[-1] 方法有个缺陷,如果文件或文件夹名里包含空格,得到到的文件夹名就不对了,下面的方法可以有效的解决这个问题

def get_dir_name(s):
    '''
     作用:需要文件或文件夹名
     参数1:需要截取的字符串
     返回:文件或文件夹名
    '''
    dir_name = ""
    k = 0
    record = ""
    for i in s:
        if(record == " " and i != " "):
            k = k + 1;
        if(k >= 3):
            dir_name = dir_name + i;
        record = i
    print(dir_name)
    return dir_name
# 测试两条数据
get_dir_name("03-08-22  09:52AM       <DIR>          C2021.11_ZDHJC_004a")
get_dir_name("03-08-25  10:32AM                89098 hello .exe")

d102afdc90b148df9b00042d1e43fac8.png

④ 使用递归实现:清理指定目录下所有的文件和非空文件夹

为什么强调非空呢,因为如果文件夹非空是没法直接删除的,只有当文件夹里的所有内容都删掉,文件夹为空时才可以删除。

import os
def dir_clear(ftp, dir_name):
    '''
     作用: 目录清空处理
     参数1:ftp连接对象
     参数2:目录或文件名
     返回:无
    '''
    # 进入指定目录
    ftp.cwd(dir_name)
    dirs = []
    ftp.dir(".", dirs.append)
    for i in dirs:
        try:
            if("<DIR>" in i):
                new_dir_name = get_dir_name(i)
                # 非空目录还删不了,先删除目录里的文件
                dir_clear(ftp, new_dir_name)
                ftp.rmd(new_dir_name)
            elif("<DIR>" not in i):
                new_file_name = get_dir_name(i)
                ftp.delete(new_file_name)
        except Exception as e:
            print("删除失败脚本:" + get_dir_name(i))
            print("失败原因:" + e)
    # 退出当前目录
    ftp.cwd("..")
path = "/CaseData/nc.vo.sdp.testcase.testcase.TestcaseHVO/"
# 文件清空
dir_clear(ftp, path)

执行后可以看到所有的文件和文件夹都被清空了:

591a82bc971c41faa461103a087e22e7.png


⑤ 使用递归实现:本地文件上传FTP服务器里的文件夹


思路:

1、并判断是否是目录,如果是目录的话,本地根据目录结构进行递归,同时在 FTP 服务器的对应位置创建文件夹。

2、需要判断原来的目录下是否存在同名的文件或文件夹,是的话要进行删除,这里用 delete_dir() 方法来实现,非空文件夹不能直接删除,还要进行递归处理,用上面的 dir_clear() 方法来实现。

3、由于文件和文件夹可以同名,但是不是同一种类型,怕误删,这里根据同名并同种类型来判断,如果原来列表里的文件较多,判断同类型的方法需要列表遍历,再加上上传的文件较多就会反复遍历列表影响效率,所以加个 current_dir 字符串的变量,可以先检查是否有同名的,如果没有直接跳过,提升效率,有的话再进行二次遍历。


注意:由于是一个 ftp 连接对象,递归过程中进去某个目录下,递归结束要回到之前的目录。

import pathlib
def delete_dir(ftp, isdir, dir_name, current_dir):
    '''
     作用: 判断目录或文件是否存在,存在的话删除
     参数1:ftp连接对象
     参数2:是否为目录,是的话为目录,不是的话为文件
     参数3:目录或文件名
     参数4:当前目录下的列表文件名集
     返回:无
    '''
    # 先初步判断下,不然直接循环遍历量大的影响效率
    if(dir_name not in current_dir):
        return
    dirs = []
    ftp.dir(".", dirs.append)
    for i in dirs:
        if(isdir == True and "<DIR>" in i):
            if(dir_name == get_dir_name(i)):
                # 非空目录还删不了,先删除目录里的文件
                dir_clear(ftp, dir_name)
                ftp.rmd(dir_name)
        elif(isdir == False and "<DIR>" not in i):
            if(dir_name == get_dir_name(i)):
                ftp.delete(dir_name)
def upload_dir(ftp, path, local_path):
    '''
     作用: 上传目录
     参数1:ftp连接对象
     参数2:远程路径
     参数3:本地存放路径
     返回:无
    '''
    print(path)
    # 进入指定目录
    ftp.cwd(path)
    # 获取当前目录的一个列表
    current_dir = ""
    for i in ftp.nlst():
        current_dir = current_dir + " " + i
    # 遍历本地路径
    for i in os.listdir(local_path):
        new_local_path = local_path + '/' + i
        # 判断为文件
        if(os.path.isfile(new_local_path)):
            # 如果有同名文件,删除
            delete_dir(ftp, False, i, current_dir)
            f = open(new_local_path, 'rb')
            # 上传文件
            ftp.storbinary("STOR " + i, f)
            f.close()
        # 判断为文件夹
        elif(os.path.isdir(new_local_path)):
            # 如果有同名文件夹,删除
            delete_dir(ftp, True, i, current_dir)
            # 创建目录
            print(i)
            try:
                ftp.mkd(i)
                upload_dir(ftp, i, new_local_path);
            except Exception as e:
                print("文件夹上传失败:" + get_dir_name(i))
                print("失败原因:" + e)
    # 退出当前目录
    ftp.cwd("..")
# 设置编码,解决上传的文件包含中文的问题
ftp.encoding = 'GBK'
path = "/CaseData/nc.vo.sdp.testcase.testcase.TestcaseHVO/"
local_path = "D:/ftp上传"
upload_dir(ftp, path, local_path)

这是本地的路径。


510c596cdd5944a3bcb19b9e0530cc85.png

这里服务器路径,可以看到里面的嵌套目录也同步被上传了。


b9984bffd2624f519b718d2087116a56.png


第二章:相关问题

① 上传的文件名包含中文【‘utf-8’ codec can’t decode byte …】

设置下 FTP 对象的编码为 GBK 即可。

ftp.encoding = 'GBK'

不然会报如下错误:UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd7 in position 114: invalid continuation byte

② 指定的路径存在问题【550 The system cannot find the file specified.】

开始我用 split(" ")[-1] 方法截取文件名,由于有的文件含有中文,截取后的文件名称不对了。

就报了 ftplib.error_perm: 550 The system cannot find the file specified. 的错误。

③ 上传文件前未加STOR标识【500 Command not understood.】

上传文件时 FTP 路径前要加个 'STOR ',不然就会报 500 错误,注意后面还跟了个空格。

# 上传文件
ftp.storbinary("STOR " + i, f)


不然就报 ftplib.error_perm: 500 Command not understood. 错误了。

④ 上传文件夹包含中文名【暂未解决】


目前 ftp.mkd(i) 方法创建文件夹时如果包含中文名时会报错,暂未找到解决方法。

喜欢的点个赞❤吧!


目录
相关文章
|
3天前
|
安全 编译器 Linux
深入解析与防范:基于缓冲区溢出的FTP服务器攻击及调用计算器示例
本文深入解析了利用缓冲区溢出漏洞对FTP服务器进行远程攻击的技术,通过分析FreeFlow FTP 1.75版本的漏洞,展示了如何通过构造过长的用户名触发缓冲区溢出并调用计算器(`calc.exe`)。文章详细介绍了攻击原理、关键代码组件及其实现步骤,并提出了有效的防范措施,如输入验证、编译器保护和安全编程语言的选择,以保障系统的安全性。环境搭建基于Windows XP SP3和Kali Linux,使用Metasploit Framework进行攻击演示。请注意,此内容仅用于教育和研究目的。
22 4
|
6天前
|
计算机视觉 Python
如何使用Python将TS文件转换为MP4
本文介绍了如何使用Python和FFmpeg将TS文件转换为MP4文件。首先需要安装Python和FFmpeg,然后通过`subprocess`模块调用FFmpeg命令,实现文件格式的转换。代码示例展示了具体的操作步骤,包括检查文件存在性、构建FFmpeg命令和执行转换过程。
29 7
|
9天前
|
弹性计算 安全 开发工具
灵码评测-阿里云提供的ECS python3 sdk做安全组管理
批量变更阿里云ECS安全组策略(批量变更)
|
1月前
|
缓存 监控 Linux
Python 实时获取Linux服务器信息
Python 实时获取Linux服务器信息
|
2月前
|
安全 Linux 数据安全/隐私保护
python知识点100篇系列(15)-加密python源代码为pyd文件
【10月更文挑战第5天】为了保护Python源码不被查看,可将其编译成二进制文件(Windows下为.pyd,Linux下为.so)。以Python3.8为例,通过Cython工具,先写好Python代码并加入`# cython: language_level=3`指令,安装easycython库后,使用`easycython *.py`命令编译源文件,最终生成.pyd文件供直接导入使用。
python知识点100篇系列(15)-加密python源代码为pyd文件
|
1月前
|
开发者 Python
Python中__init__.py文件的作用
`__init__.py`文件在Python包管理中扮演着重要角色,通过标识目录为包、初始化包、控制导入行为、支持递归包结构以及定义包的命名空间,`__init__.py`文件为组织和管理Python代码提供了强大支持。理解并正确使用 `__init__.py`文件,可以帮助开发者更好地组织代码,提高代码的可维护性和可读性。
44 2
|
1月前
|
中间件 Docker Python
【Azure Function】FTP上传了Python Function文件后,无法在门户页面加载函数的问题
通过FTP上传Python Function至Azure云后,出现函数列表无法加载的问题。经排查,发现是由于`requirements.txt`中的依赖包未被正确安装。解决方法为:在本地安装依赖包到`.python_packages/lib/site-packages`目录,再将该目录内容上传至云上的`wwwroot`目录,并重启应用。最终成功加载函数列表。
|
2月前
|
Java Python
> python知识点100篇系列(19)-使用python下载文件的几种方式
【10月更文挑战第7天】本文介绍了使用Python下载文件的五种方法,包括使用requests、wget、线程池、urllib3和asyncio模块。每种方法适用于不同的场景,如单文件下载、多文件并发下载等,提供了丰富的选择。
|
2月前
|
数据安全/隐私保护 流计算 开发者
python知识点100篇系列(18)-解析m3u8文件的下载视频
【10月更文挑战第6天】m3u8是苹果公司推出的一种视频播放标准,采用UTF-8编码,主要用于记录视频的网络地址。HLS(Http Live Streaming)是苹果公司提出的一种基于HTTP的流媒体传输协议,通过m3u8索引文件按序访问ts文件,实现音视频播放。本文介绍了如何通过浏览器找到m3u8文件,解析m3u8文件获取ts文件地址,下载ts文件并解密(如有必要),最后使用ffmpeg合并ts文件为mp4文件。
|
2月前
|
IDE 网络安全 开发工具
IDE之pycharm:专业版本连接远程服务器代码,并配置远程python环境解释器(亲测OK)。
本文介绍了如何在PyCharm专业版中连接远程服务器并配置远程Python环境解释器,以便在服务器上运行代码。
447 0
IDE之pycharm:专业版本连接远程服务器代码,并配置远程python环境解释器(亲测OK)。
下一篇
DataWorks