Python 连接FTP服务器并实现文件夹下载实例演示,python区分ftp目录下文件和文件夹方法,ftp目录下包含中文名问题处理

简介: Python 连接FTP服务器并实现文件夹下载实例演示,python区分ftp目录下文件和文件夹方法,ftp目录下包含中文名问题处理

第一章:连接 FTP 服务器并实现文件夹下载

① 连接 FTP 服务器

如果 FTP 不用用户名密码就直接可以访问,那就是用的默认用户名 Anonymous,密码为空。

# -*- coding: UTF8 -*-
# 2022-3-8
# 作者:小蓝枣
# python连接ftp服务器
from ftplib import FTP
def conn_ftp():
    '''
     作用:连接ftp服务器
     参数:无
     返回:ftp服务器连接的对象
    '''
    # FTP连接信息
    ftp_ip = "xx.xx.xx.xx"
    # 默认端口21
    ftp_port = 21
    # 如果未指定,使用默认用户名为Anonymous,密码为空
    ftp_user = "Anonymous"
    ftp_password = ""
    ftp = FTP()
    # 连接ftp
    ftp.connect(ftp_ip, ftp_port)
    # ftp登录
    ftp.login(ftp_user, ftp_password)
    # 查看欢迎信息
    print(ftp.getwelcome())
    return ftp
ftp = conn_ftp()


2c6d863db8d748b899ac6b1832d099ca.png

② 进入指定目录并显示文件信息

方法 ftp.dir() 返回结果的结尾会默认带个 None,目录下没有内容的话直接会返回个 None


def display_dir(ftp, path):
    '''
     作用:进入并展示指定的目录内容
     参数1:ftp连接对象
     参数2:要展示的目录
     返回:无
    '''
    # 进入指定目录
    ftp.cwd(path)
    # 显示当前所在位置
    print("当前所在位置为:")
    print(ftp.pwd())
    # 展示目录内容
    print("\n显示目录内容:")
    print(ftp.dir())
    # 展示目录下的文件名,*文件夹和文件都会显示
    print("\n文件和文件夹名为:")
    for i in ftp.nlst():
        print(i)
path = "/CaseData/nc.vo.sdp.testcase.testcase.TestcaseHVO/"
display_dir(ftp, path)

这是原始目录。

513a9b2fb18941aca653c41aa43824db.png

32cd365b9fb64664bf4d1e406cc2ee9a.png

③ 区分文件和文件夹名

从上面方法 ftp.dir() 返回结果可以看到包含 <DIR> 标识的为文件夹,我们根据这个特征来进行文件夹区分。

def diff_dir(ftp, path):
    '''
     作用:区分文件和文件夹
     参数1:ftp连接对象
     参数2:要展示的目录
     返回:无
    '''
    # 进入指定目录
    ftp.cwd(path)
    # 显示当前所在位置
    print("当前所在位置为:")
    print(ftp.pwd())
    # 展示目录内容
    print("\n显示目录内容:")
    dirs = []
    ftp.dir(".", dirs.append)
    for i in dirs:
        # 区分文件和文件夹
        if("<DIR>" in i):
            print("目录为:" + i.split(" ")[-1])
        else:
            print("文件为:" + i.split(" ")[-1])
path = "/CaseData/nc.vo.sdp.testcase.testcase.TestcaseHVO/"
diff_dir(ftp, path)

f0075898e81d432fadd3f6f3c05ea1e0.png

④ 文件夹名包含空格处理

split(" ")[-1] 方法有个缺陷,如果文件或文件夹名里包含空格,得到到的文件夹名就不对了,下面的方法可以有效的解决这个问题

def get_dir_name(s):
    '''
     作用:需要文件或文件夹名
     参数1:需要截取的字符串
     返回:文件或文件夹名
    '''
    dir_name = ""
    k = 0
    record = ""
    for i in s:
        if(record == " " and i != " "):
            k = k + 1;
        if(k >= 3):
            dir_name = dir_name + i;
        record = i
    print(dir_name)
    return dir_name
# 测试两条数据
get_dir_name("03-08-22  09:52AM       <DIR>          C2021.11_ZDHJC_004a")
get_dir_name("03-08-25  10:32AM                89098 hello .exe")

d102afdc90b148df9b00042d1e43fac8.png

⑤ 使用递归实现:FTP服务器里的文件夹下载到本地

思路:首先是看目录或文件里是否包含关键词,包含关键词进行下载。

并判断是否是目录,如果是目录的话,本地根据目录结构进行递归,同时本地创建文件夹。

使用了 2 个方法,下面的方法用来判断是否包含关键词,上面的方法就是目录结构下的递归。


注意:由于是一个 ftp 连接对象,递归过程中进去某个目录下,递归结束要回到之前的目录。

import pathlib
def download_dir(ftp, path, local_path):
    '''
     作用: 下载目录
     参数1:ftp连接对象
     参数2:要展示的目录
     参数3:本地存放路径
     返回:无
    '''
    # 进入指定目录
    ftp.cwd(path)
    # 区分文件和文件夹
    dirs = []
    ftp.dir(".", dirs.append)
    for i in dirs:
        try:
            # 识别为目录进行递归
            if("<DIR>" in i):
                dir_name = get_dir_name(i)
                local_path_new = local_path + "/" + dir_name
                # 本地创建文件夹
                pathlib.Path(local_path_new).mkdir(parents=True, exist_ok=True)
                # 调用下载目录方法
                download_dir(ftp, dir_name, local_path_new)
            # 识别为文件进行下载
            else:
                file_name = get_dir_name(i)
                local_filename = local_path + "/" + file_name
                f = open(local_filename, "wb")
                # 下载ftp文件
                ftp.retrbinary('RETR ' + file_name, f.write)
                f.close()
        except Exception as e:
            print(e)
    # 退出当前目录
    ftp.cwd("..")
def download_file(ftp, key, path, local_path):
    '''
     作用: 根据关键词下载文件
     参数1:ftp连接对象
     参数2:下载的关键词
     参数3:要展示的目录
     参数4:本地存放路径
     返回:无
    '''
    # 进入指定目录
    ftp.cwd(path)
    # 区分文件和文件夹
    dirs = []
    ftp.dir(".", dirs.append)
    for i in dirs:
        if(key in i):
            try:
                # 识别为目录进行递归
                if("<DIR>" in i):
                    dir_name = get_dir_name(i)
                    local_path_new = local_path + "/" + dir_name
                    # 本地创建文件夹
                    pathlib.Path(local_path_new).mkdir(parents=True, exist_ok=True)
                    # 调用下载目录方法
                    download_dir(ftp, dir_name, local_path_new)
                else:
                    file_name = get_dir_name(i)
                    local_filename = local_path + "/" + file_name
                    f = open(local_filename, "wb")
                    # 下载ftp文件
                    ftp.retrbinary('RETR ' + file_name, f.write)
                    f.close()
            except Exception as e:
                print(e)
# 设置编码,解决上传的文件包含中文的问题
ftp.encoding = 'GBK'
key = "C2021.11_ZDHJC"
path = "/CaseData/nc.vo.sdp.testcase.testcase.TestcaseHVO/"
local_path = "D:/ftp下载"
download_file(ftp, key, path, local_path)

可以看到符合关键词的目录被下载到本地了。

68cff65cbf5b49ff982e10a3fee800df.png

并且里面的嵌套目录也同步被下载了。

87cc753a731e407bbaba68f0737eeafc.png

第二章:问题解决

① 下载的文件名包含中文【‘utf-8’ codec can’t decode byte …】

设置下 FTP 对象的编码为 GBK 即可。

ftp.encoding = 'GBK'

不然会报如下错误:UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd7 in position 114: invalid continuation byte

② 指定的路径存在问题【550 The system cannot find the file specified.】

开始我用 split(" ")[-1] 方法截取文件名,由于有的文件含有中文,截取后的文件名称不对了。

就报了 ftplib.error_perm: 550 The system cannot find the file specified. 的错误。


③ 下载文件前未加RETR标识【500 Command not understood.】

下载文件时 FTP 路径前要加个 'RETR ',不然就会报 500 错误,注意后面还跟了个空格

# 下载ftp文件
ftp.retrbinary('RETR ' + file_name, f.write)

不然就报 ftplib.error_perm: 500 Command not understood. 错误了。

喜欢的点个赞❤吧!

目录
相关文章
|
4月前
|
弹性计算 ice
阿里云4核8g服务器多少钱一年?1个月和1小时价格,省钱购买方法分享
阿里云4核8G服务器价格因实例类型而异,经济型e实例约159元/月,计算型c9i约371元/月,按小时计费最低0.45元。实际购买享折扣,1年最高可省至1578元,附主流ECS实例及CPU型号参考。
554 8
|
4月前
|
弹性计算 定位技术 数据中心
阿里云服务器配置选择方法:付费类型、地域及CPU内存配置全解析
阿里云服务器怎么选?2025最新指南:就近选择地域,降低延迟;长期使用选包年包月,短期灵活选按量付费;企业选2核4G5M仅199元/年,个人选2核2G3M低至99元/年,高性价比爆款推荐,轻松上云。
391 11
|
4月前
|
弹性计算
阿里云8核16G云服务器收费标准:最新价格及省钱购买方法整理
阿里云8核16G云服务器价格因实例类型而异。计算型c9i约743元/月,一年6450元(7折);通用算力型u1约673元/月,一年仅需4225元(5.1折)。实际价格享时长折扣,详情见ECS官网。
|
4月前
|
域名解析 弹性计算 负载均衡
给阿里云服务器加速的方法有哪些?
本文介绍如何通过阿里云CDN加速、ECS网络优化及SLB负载均衡三种方法提升服务器响应速度。涵盖具体操作步骤,助力用户优化访问性能。
|
6月前
|
弹性计算 小程序 容灾
2025购买阿里云服务器配置选择方法:企业+个人+学生攻略
2025年阿里云服务器购买省钱攻略,涵盖个人、中小企业及高性能配置推荐。个人用户优选38元轻量或99元ECS,企业用户选199元2核4G服务器,游戏用户适合4核16G或8核32G配置,详情请参考最新活动及攻略。
1291 11
|
5月前
|
弹性计算 定位技术 数据中心
阿里云服务器选择方法:配置、地域及付费模式全解析
2025阿里云服务器选购指南:就近选择地域以降低延迟,企业用户优选2核4G5M带宽u1实例,仅199元/年;个人用户可选2核2G3M带宽ECS,99元/年起。长期稳定业务选包年包月,短期或波动场景用按量付费,轻松搭建网站首选高性价比配置。
|
6月前
|
人工智能 自然语言处理 安全
Python构建MCP服务器:从工具封装到AI集成的全流程实践
MCP协议为AI提供标准化工具调用接口,助力模型高效操作现实世界。
1217 1
|
4月前
|
弹性计算 运维 安全
阿里云轻量应用服务器与云服务器ECS啥区别?新手帮助教程
阿里云轻量应用服务器适合个人开发者搭建博客、测试环境等低流量场景,操作简单、成本低;ECS适用于企业级高负载业务,功能强大、灵活可扩展。二者在性能、网络、镜像及运维管理上差异显著,用户应根据实际需求选择。
385 10
|
4月前
|
运维 安全 Ubuntu
阿里云渠道商:服务器操作系统怎么选?
阿里云提供丰富操作系统镜像,涵盖Windows与主流Linux发行版。选型需综合技术兼容性、运维成本、安全稳定等因素。推荐Alibaba Cloud Linux、Ubuntu等用于Web与容器场景,Windows Server支撑.NET应用。建议优先选用LTS版本并进行测试验证,通过标准化镜像管理提升部署效率与一致性。
|
4月前
|
存储 监控 安全
阿里云渠道商:云服务器价格有什么变动?
阿里云带宽与存储费用呈基础资源降价、增值服务差异化趋势。企业应结合业务特点,通过阶梯计价、智能分层、弹性带宽等策略优化成本,借助云监控与预算预警机制,实现高效、可控的云资源管理。

推荐镜像

更多