Python操作FTP服务器实现文件和文件夹的上传与下载,python清理ftp目录下的所有文件和非空文件夹

简介: Python操作FTP服务器实现文件和文件夹的上传与下载,python清理ftp目录下的所有文件和非空文件夹

第一章:连接 FTP 服务器并实现文件夹上传

① 连接 FTP 服务器

如果 FTP 不用用户名密码就直接可以访问,那就是用的默认用户名 Anonymous,密码为空。

# -*- coding: UTF8 -*-
# 2022-3-10
# 作者:小蓝枣
# python连接ftp服务器
from ftplib import FTP
def conn_ftp():
    '''
     作用:连接ftp服务器
     参数:无
     返回:ftp服务器连接的对象
    '''
    # FTP连接信息
    ftp_ip = "xx.xx.xx.xx"
    # 默认端口21
    ftp_port = 21
    # 如果未指定,使用默认用户名为Anonymous,密码为空
    ftp_user = "Anonymous"
    ftp_password = ""
    ftp = FTP()
    # 连接ftp
    ftp.connect(ftp_ip, ftp_port)
    # ftp登录
    ftp.login(ftp_user, ftp_password)
    # 查看欢迎信息
    print(ftp.getwelcome())
    return ftp
ftp = conn_ftp()

② 区分文件和文件夹名

从方法 ftp.dir() 返回结果可以看到包含 <DIR> 标识的为文件夹,我们根据这个特征来进行文件夹区分。

def diff_dir(ftp, path):
    '''
     作用:区分文件和文件夹
     参数1:ftp连接对象
     参数2:要展示的目录
     返回:无
    '''
    # 进入指定目录
    ftp.cwd(path)
    # 显示当前所在位置
    print("当前所在位置为:")
    print(ftp.pwd())
    # 展示目录内容
    print("\n显示目录内容:")
    dirs = []
    ftp.dir(".", dirs.append)
    for i in dirs:
        # 区分文件和文件夹
        if("<DIR>" in i):
            print("目录为:" + i.split(" ")[-1])
        else:
            print("文件为:" + i.split(" ")[-1])
path = "/CaseData/nc.vo.sdp.testcase.testcase.TestcaseHVO/"
diff_dir(ftp, path)

f0075898e81d432fadd3f6f3c05ea1e0.png

③ 文件夹名包含空格处理

split(" ")[-1] 方法有个缺陷,如果文件或文件夹名里包含空格,得到到的文件夹名就不对了,下面的方法可以有效的解决这个问题

def get_dir_name(s):
    '''
     作用:需要文件或文件夹名
     参数1:需要截取的字符串
     返回:文件或文件夹名
    '''
    dir_name = ""
    k = 0
    record = ""
    for i in s:
        if(record == " " and i != " "):
            k = k + 1;
        if(k >= 3):
            dir_name = dir_name + i;
        record = i
    print(dir_name)
    return dir_name
# 测试两条数据
get_dir_name("03-08-22  09:52AM       <DIR>          C2021.11_ZDHJC_004a")
get_dir_name("03-08-25  10:32AM                89098 hello .exe")

d102afdc90b148df9b00042d1e43fac8.png

④ 使用递归实现:清理指定目录下所有的文件和非空文件夹

为什么强调非空呢,因为如果文件夹非空是没法直接删除的,只有当文件夹里的所有内容都删掉,文件夹为空时才可以删除。

import os
def dir_clear(ftp, dir_name):
    '''
     作用: 目录清空处理
     参数1:ftp连接对象
     参数2:目录或文件名
     返回:无
    '''
    # 进入指定目录
    ftp.cwd(dir_name)
    dirs = []
    ftp.dir(".", dirs.append)
    for i in dirs:
        try:
            if("<DIR>" in i):
                new_dir_name = get_dir_name(i)
                # 非空目录还删不了,先删除目录里的文件
                dir_clear(ftp, new_dir_name)
                ftp.rmd(new_dir_name)
            elif("<DIR>" not in i):
                new_file_name = get_dir_name(i)
                ftp.delete(new_file_name)
        except Exception as e:
            print("删除失败脚本:" + get_dir_name(i))
            print("失败原因:" + e)
    # 退出当前目录
    ftp.cwd("..")
path = "/CaseData/nc.vo.sdp.testcase.testcase.TestcaseHVO/"
# 文件清空
dir_clear(ftp, path)

执行后可以看到所有的文件和文件夹都被清空了:

591a82bc971c41faa461103a087e22e7.png


⑤ 使用递归实现:本地文件上传FTP服务器里的文件夹


思路:

1、并判断是否是目录,如果是目录的话,本地根据目录结构进行递归,同时在 FTP 服务器的对应位置创建文件夹。

2、需要判断原来的目录下是否存在同名的文件或文件夹,是的话要进行删除,这里用 delete_dir() 方法来实现,非空文件夹不能直接删除,还要进行递归处理,用上面的 dir_clear() 方法来实现。

3、由于文件和文件夹可以同名,但是不是同一种类型,怕误删,这里根据同名并同种类型来判断,如果原来列表里的文件较多,判断同类型的方法需要列表遍历,再加上上传的文件较多就会反复遍历列表影响效率,所以加个 current_dir 字符串的变量,可以先检查是否有同名的,如果没有直接跳过,提升效率,有的话再进行二次遍历。


注意:由于是一个 ftp 连接对象,递归过程中进去某个目录下,递归结束要回到之前的目录。

import pathlib
def delete_dir(ftp, isdir, dir_name, current_dir):
    '''
     作用: 判断目录或文件是否存在,存在的话删除
     参数1:ftp连接对象
     参数2:是否为目录,是的话为目录,不是的话为文件
     参数3:目录或文件名
     参数4:当前目录下的列表文件名集
     返回:无
    '''
    # 先初步判断下,不然直接循环遍历量大的影响效率
    if(dir_name not in current_dir):
        return
    dirs = []
    ftp.dir(".", dirs.append)
    for i in dirs:
        if(isdir == True and "<DIR>" in i):
            if(dir_name == get_dir_name(i)):
                # 非空目录还删不了,先删除目录里的文件
                dir_clear(ftp, dir_name)
                ftp.rmd(dir_name)
        elif(isdir == False and "<DIR>" not in i):
            if(dir_name == get_dir_name(i)):
                ftp.delete(dir_name)
def upload_dir(ftp, path, local_path):
    '''
     作用: 上传目录
     参数1:ftp连接对象
     参数2:远程路径
     参数3:本地存放路径
     返回:无
    '''
    print(path)
    # 进入指定目录
    ftp.cwd(path)
    # 获取当前目录的一个列表
    current_dir = ""
    for i in ftp.nlst():
        current_dir = current_dir + " " + i
    # 遍历本地路径
    for i in os.listdir(local_path):
        new_local_path = local_path + '/' + i
        # 判断为文件
        if(os.path.isfile(new_local_path)):
            # 如果有同名文件,删除
            delete_dir(ftp, False, i, current_dir)
            f = open(new_local_path, 'rb')
            # 上传文件
            ftp.storbinary("STOR " + i, f)
            f.close()
        # 判断为文件夹
        elif(os.path.isdir(new_local_path)):
            # 如果有同名文件夹,删除
            delete_dir(ftp, True, i, current_dir)
            # 创建目录
            print(i)
            try:
                ftp.mkd(i)
                upload_dir(ftp, i, new_local_path);
            except Exception as e:
                print("文件夹上传失败:" + get_dir_name(i))
                print("失败原因:" + e)
    # 退出当前目录
    ftp.cwd("..")
# 设置编码,解决上传的文件包含中文的问题
ftp.encoding = 'GBK'
path = "/CaseData/nc.vo.sdp.testcase.testcase.TestcaseHVO/"
local_path = "D:/ftp上传"
upload_dir(ftp, path, local_path)

这是本地的路径。


510c596cdd5944a3bcb19b9e0530cc85.png

这里服务器路径,可以看到里面的嵌套目录也同步被上传了。


b9984bffd2624f519b718d2087116a56.png


第二章:相关问题

① 上传的文件名包含中文【‘utf-8’ codec can’t decode byte …】

设置下 FTP 对象的编码为 GBK 即可。

ftp.encoding = 'GBK'

不然会报如下错误:UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd7 in position 114: invalid continuation byte

② 指定的路径存在问题【550 The system cannot find the file specified.】

开始我用 split(" ")[-1] 方法截取文件名,由于有的文件含有中文,截取后的文件名称不对了。

就报了 ftplib.error_perm: 550 The system cannot find the file specified. 的错误。

③ 上传文件前未加STOR标识【500 Command not understood.】

上传文件时 FTP 路径前要加个 'STOR ',不然就会报 500 错误,注意后面还跟了个空格。

# 上传文件
ftp.storbinary("STOR " + i, f)


不然就报 ftplib.error_perm: 500 Command not understood. 错误了。

④ 上传文件夹包含中文名【暂未解决】


目前 ftp.mkd(i) 方法创建文件夹时如果包含中文名时会报错,暂未找到解决方法。

喜欢的点个赞❤吧!


目录
打赏
0
0
0
0
15
分享
相关文章
解锁文件共享软件背后基于 Python 的二叉搜索树算法密码
文件共享软件在数字化时代扮演着连接全球用户、促进知识与数据交流的重要角色。二叉搜索树作为一种高效的数据结构,通过有序存储和快速检索文件,极大提升了文件共享平台的性能。它依据文件名或时间戳等关键属性排序,支持高效插入、删除和查找操作,显著优化用户体验。本文还展示了用Python实现的简单二叉搜索树代码,帮助理解其工作原理,并展望了该算法在分布式计算和机器学习领域的未来应用前景。
Python中的Paramiko与FTP文件夹及文件检测技巧
通过使用 Paramiko 和 FTP 库,开发者可以方便地检测远程服务器上的文件和文件夹是否存在。Paramiko 提供了通过 SSH 协议进行远程文件管理的能力,而 `ftplib` 则提供了通过 FTP 协议进行文件传输和管理的功能。通过理解和应用这些工具,您可以更加高效地管理和监控远程服务器上的文件系统。
46 20
如何在Python中高效地读写大型文件?
大家好,我是V哥。上一篇介绍了Python文件读写操作,今天聊聊如何高效处理大型文件。主要方法包括:逐行读取、分块读取、内存映射(mmap)、pandas分块处理CSV、numpy处理二进制文件、itertools迭代处理及linecache逐行读取。这些方法能有效节省内存,提升效率。关注威哥爱编程,学习更多Python技巧。
如何使用 Python 进行文件读写操作?
大家好,我是V哥。本文介绍Python中文件读写操作的方法,包括文件读取、写入、追加、二进制模式、JSON、CSV和Pandas模块的使用,以及对象序列化与反序列化。通过这些方法,你可以根据不同的文件类型和需求,灵活选择合适的方式进行操作。希望对正在学习Python的小伙伴们有所帮助。欢迎关注威哥爱编程,全栈路上我们并肩前行。
剖析文件共享工具背后的Python哈希表算法奥秘
在数字化时代,文件共享工具不可或缺。哈希表算法通过将文件名或哈希值映射到存储位置,实现快速检索与高效管理。Python中的哈希表可用于创建简易文件索引,支持快速插入和查找文件路径。哈希表不仅提升了文件定位速度,还优化了存储管理和多节点数据一致性,确保文件共享工具高效运行,满足多用户并发需求,推动文件共享领域向更高效、便捷的方向发展。
深入解析与防范:基于缓冲区溢出的FTP服务器攻击及调用计算器示例
本文深入解析了利用缓冲区溢出漏洞对FTP服务器进行远程攻击的技术,通过分析FreeFlow FTP 1.75版本的漏洞,展示了如何通过构造过长的用户名触发缓冲区溢出并调用计算器(`calc.exe`)。文章详细介绍了攻击原理、关键代码组件及其实现步骤,并提出了有效的防范措施,如输入验证、编译器保护和安全编程语言的选择,以保障系统的安全性。环境搭建基于Windows XP SP3和Kali Linux,使用Metasploit Framework进行攻击演示。请注意,此内容仅用于教育和研究目的。
92 4
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等