将源目录中的文件按照前缀分发到不同目录中的算法设计及C代码实现

简介: 一、需求描述 在Linux系统的某个源目录中有一批后缀相同的文件,编写程序将这些文件按照前缀分发到不同的目录中。

一、需求描述
在Linux系统的某个源目录中有一批后缀相同的文件,编写程序将这些文件按照前缀分发到不同的目录中。

例如,源目录SourceDir中存放有三个后缀相同的文件File1_1.txt、File2_1.txt和File3_1.txt,按照前缀File1_、File2_和File3_将它们分别移动(分发)到目录FileDir1、FileDir2和FileDir3中。

二、算法设计
基于需求,可以采用如图1所示的程序流程:
这里写图片描述
图1 程序总体流程

三、特殊流程考虑
在编写程序的过程中,对于某些特殊流程的考虑如下:
1.如果扫描源目录出错,则直接停止程序的运行,而不用继续扫描下一个目录。

2.对于某些空文件(即文件的大小为0),直接在源目录中将其删除,而不用进行分发。

3.为了随时能够处理放到源目录中的文件,程序每隔一段时间(如一分钟)扫描一次源目录。也就是说,如果不人为操作,程序启动之后会不停地运行。

四、程序代码

/**********************************************************************
* 版权所有 (C)2016, Zhou Zhaoxiong。
*
* 文件名称:FileDistribute.c
* 文件标识:无
* 内容摘要:将某个目录中的文件按照前缀分发到对应的目录中
* 其它说明:无
* 当前版本:V1.0
* 作    者:Zhou Zhaoxiong
* 完成日期:20160517
*
**********************************************************************/
#include <stdio.h>
#include <string.h>
#include <dirent.h>
#include <ftw.h>
#include <time.h>

// 重定义数据类型
typedef signed   int        INT32;
typedef unsigned int        UINT32;
typedef unsigned char       UINT8;

// 全局变量定义
UINT8  g_szSourceDir[256] = {0};     // 源文件的目录

// 函数声明
INT32 SelectFlies(struct dirent *pDir);
void ScanDirAndDistribute(void);
void Sleep(UINT32 iCountMs);


/****************************************************************
* 功能描述: 主函数
* 输入参数: 无
* 输出参数: 无
* 返 回 值: 0-执行完成
* 其他说明: 无
* 修改日期       版本号        修改人        修改内容
* -------------------------------------------------------------
* 20160517        V1.0     Zhou Zhaoxiong     创建
****************************************************************/
INT32 main(void)
{
    // 源文件的目录
    snprintf(g_szSourceDir, sizeof(g_szSourceDir)-1, "%s/zhouzx/TestDir/SourceDir", getenv("HOME"));

    // 调用函数执行文件的分发
    while (1)
    {
        ScanDirAndDistribute();

        Sleep(60 * 1000);    // 每一分钟执行一次文件的分发
    }

    return 0;
}


/**********************************************************************
* 功能描述:根据后缀选择文件
* 输入参数:dir-目录
* 输出参数:无
* 返 回 值:0-失败   1-成功
* 其它说明:一个形如test.txt的文件要被扫描出来, 而形如test的文件不符合条件
* 修改日期         版本号      修改人          修改内容
* --------------------------------------------------------------------
* 20160517         V1.0    ZhouZhaoxiong        创建
***********************************************************************/
INT32 SelectFlies(struct dirent *pDir)
{
    if (pDir == NULL)
    {
        printf("SelectFlies:input parameter is NULL!\n");
        return 0;
    }

    // 根据.txt(后缀)选择文件
    if (strstr(pDir->d_name, ".txt") != NULL)
    {
        return 1;         // 找到了满足条件的文件
    }
    else
    {
        return 0;
    }
}


/**********************************************************************
* 功能描述:扫描目录并分发文件
* 输入参数:无
* 输出参数:无
* 返 回 值:无
* 其它说明:无
* 修改日期         版本号      修改人          修改内容
* --------------------------------------------------------------------
* 20160517         V1.0    ZhouZhaoxiong        创建
***********************************************************************/
void ScanDirAndDistribute(void)
{
    INT32  iScanDirRet           = 0;
    UINT32 iFileIdx              = 0;
    UINT32 iFileCount            = 0;
    UINT32 iFileSize             = 0;
    UINT8  szFileDir[256]        = {0};
    UINT8  szScanedFile[512]     = {0};
    UINT8  szCmdBuf[256]         = {0};
    FILE  *fp                    = NULL;
    struct dirent **ppDirEnt     = NULL;

    // 扫描源目录, 并分发文件
    iScanDirRet = scandir(g_szSourceDir, &ppDirEnt, SelectFlies, alphasort);
    if (iScanDirRet < 0)   // 扫描目录出错
    {
        printf("ScanDirAndDistribute:exec scandir failed, path=%s\n", g_szSourceDir);
        return;
    }
    else if (iScanDirRet == 0)   // 目录下无文件
    {
        printf("ScanDirAndDistribute:no satisfied file in directory %s\n", g_szSourceDir);
    }
    else          // 将满足条件的文件移动到对应的目录中
    {
        for (iFileIdx = 0; iFileIdx < iScanDirRet; iFileIdx ++)
        {
            // 先判断扫描到的文件是否为空文件, 是则直接删除, 不是才执行移动的操作
            memset(szScanedFile, 0x00, sizeof(szScanedFile));
            snprintf(szScanedFile, sizeof(szScanedFile) - 1, "%s/%s", g_szSourceDir, ppDirEnt[iFileIdx]->d_name);
            fp = fopen(szScanedFile, "r");
            if (fp == NULL)          // 打开文件失败, 直接返回
            {
                printf("ScanDirAndDistribute:open file %s failed, please check!\n", szScanedFile);
                return;
            }
            fseek(fp, 0, SEEK_END);
            iFileSize = ftell(fp);
            if (iFileSize == 0)     // 该文件为空文件
            {
                printf("ScanDirAndDistribute:%s is an empty file, so delete it directly!\n", szScanedFile);
                memset(szCmdBuf, 0x00, sizeof(szCmdBuf));
                snprintf(szCmdBuf, sizeof(szCmdBuf) - 1, "rm %s", szScanedFile);
                system(szCmdBuf);
            }
            else   // 根据前缀将文件移动(分发)到对应的目录中
            {
                if (strncmp(ppDirEnt[iFileIdx]->d_name, "File1_", strlen("File1_")) == 0)    // 移动到FileDir1
                {
                    memset(szFileDir, 0x00, sizeof(szFileDir));
                    snprintf(szFileDir, sizeof(szFileDir)-1, "%s/zhouzx/TestDir/FileDir1", getenv("HOME"));
                }
                else if (strncmp(ppDirEnt[iFileIdx]->d_name, "File2_", strlen("File2_")) == 0)    // 移动到FileDir2
                {
                    memset(szFileDir, 0x00, sizeof(szFileDir));
                    snprintf(szFileDir, sizeof(szFileDir)-1, "%s/zhouzx/TestDir/FileDir2", getenv("HOME"));
                }
                else if (strncmp(ppDirEnt[iFileIdx]->d_name, "File3_", strlen("File3_")) == 0)    // 移动到FileDir3
                {
                    memset(szFileDir, 0x00, sizeof(szFileDir));
                    snprintf(szFileDir, sizeof(szFileDir)-1, "%s/zhouzx/TestDir/FileDir3", getenv("HOME"));
                }
                else    // 前缀不满足, 直接将该文件删掉
                {
                    memset(szCmdBuf, 0x00, sizeof(szCmdBuf));
                    snprintf(szCmdBuf, sizeof(szCmdBuf) - 1, "rm %s", szScanedFile);
                    system(szCmdBuf);

                    printf("ScanDirAndDistribute:now, %s\n", szCmdBuf);

                    continue;  // 继续判断下一个
                }

                memset(szCmdBuf, 0x00, sizeof(szCmdBuf));
                snprintf(szCmdBuf, sizeof(szCmdBuf) - 1, "mv %s %s", szScanedFile, szFileDir);
                system(szCmdBuf);

                printf("ScanDirAndDistribute:now, %s\n", szCmdBuf);

                iFileCount ++;
            }
        }
    }

    printf("ScanDirAndDistribute:this time,totally moved %d file(s).\n", iFileCount);

    return;
}


/**********************************************************************
* 功能描述: 程序休眠
* 输入参数: iCountMs-休眠时间(单位:ms)
* 输出参数: 无
* 返 回 值: 无
* 其它说明: 无
* 修改日期      版本号       修改人        修改内容
* ------------------------------------------------------------------
* 20160517       V1.0     Zhou Zhaoxiong     创建
********************************************************************/ 
void Sleep(UINT32 iCountMs)
{
    struct timeval t_timeout = {0};

    if (iCountMs < 1000)
    {
        t_timeout.tv_sec  = 0;
        t_timeout.tv_usec = iCountMs * 1000;
    }
    else
    {
        t_timeout.tv_sec  = iCountMs / 1000;
        t_timeout.tv_usec = (iCountMs % 1000) * 1000;
    }
    select(0, NULL, NULL, NULL, &t_timeout);    // 调用select函数阻塞程序
}

五、程序测试
将编写好的程序“FileDistribute.c”上传到Linux机器,并使用“gcc -g -o FileDistribute FileDistribute.c”命令对该程序进行编译,生成“FileDistribute”文件。下面对程序进行详细的测试。

1.在启动程序之前,在源目录SourceDir中放入文件File1_1.txt、File2_1.txt和File3_1.txt,程序运行情况如下:

ScanDirAndDistribute:now, mv /home/zhou/zhouzx/TestDir/SourceDir/File1_1.txt /home/zhou/zhouzx/TestDir/FileDir1
ScanDirAndDistribute:now, mv /home/zhou/zhouzx/TestDir/SourceDir/File2_1.txt /home/zhou/zhouzx/TestDir/FileDir2
ScanDirAndDistribute:now, mv /home/zhou/zhouzx/TestDir/SourceDir/File3_1.txt /home/zhou/zhouzx/TestDir/FileDir3
ScanDirAndDistribute:this time,totally moved 3 file(s).

可以看到,源目录中的三个文件已经没有了,它们被分别移动到了结果目录FileDir1、FileDir2和FileDir3中:

~/zhouzx/TestDir/SourceDir> ll
total 0

~/zhouzx/TestDir/FileDir1> ll
-rw-------  1 zhou users 12 2016-05-17 18:58 File1_1.txt

~/zhouzx/TestDir/FileDir2> ll
-rw-------  1 zhou users 12 2016-05-17 18:58 File2_1.txt

~/zhouzx/TestDir/FileDir3> ll
-rw-------  1 zhou users 12 2016-05-17 18:58 File3_1.txt

2.一段时间之后,在源目录SourceDir中放入文件File4_1.txt,程序运行情况如下:

ScanDirAndDistribute:now, rm /home/zhou/zhouzx/TestDir/SourceDir/File4_1.txt
ScanDirAndDistribute:this time,totally moved 0 file(s).

可以看到,因为前缀不匹配,File4_1.txt文件直接被删除掉了。

~/zhouzx/TestDir/SourceDir> ll
total 0

3.一段时间之后,在源目录SourceDir中放入空文件File_7.txt、File_8.txt和File_9.txt,程序运行情况如下:

ScanDirAndDistribute:/home/zhou/zhouzx/TestDir/SourceDir/File_7.txt is an empty file, so delete it directly!
ScanDirAndDistribute:/home/zhou/zhouzx/TestDir/SourceDir/File_8.txt is an empty file, so delete it directly!
ScanDirAndDistribute:/home/zhou/zhouzx/TestDir/SourceDir/File_9.txt is an empty file, so delete it directly!
ScanDirAndDistribute:this time,totally moved 0 file(s).

可以看到,源目录SourceDir中的空文件已经被全部删除掉了。

~/zhouzx/TestDir/SourceDir> ll
total 0

六、需求扩展
基于本文中的需求和程序,可考虑对需求进行以下扩展:
1.在移动(分发)文件之前,先查看相同文件名的文件在对应结果目录中是否存在,如果存在,则直接将该文件在源目录中删除掉;如果不存在,才将该文件移动到对应结果目录中。

2.为避免结果目录中的文件过多,可以在程序中添加清理机制,即将存放时间超过一定时长的文件删除掉。

3.为了体现程序的灵活性,可将部分文件信息(如文件前缀、后缀、存放目录、扫描间隔时长等)存放到配置文件中,程序在启动时读取相关的配置项的值来执行后续目录扫描和文件分发的操作。

目录
相关文章
|
12天前
|
存储 算法 程序员
C 语言递归算法:以简洁代码驾驭复杂逻辑
C语言递归算法简介:通过简洁的代码实现复杂的逻辑处理,递归函数自我调用解决分层问题,高效而优雅。适用于树形结构遍历、数学计算等领域。
|
13天前
|
并行计算 算法 测试技术
C语言因高效灵活被广泛应用于软件开发。本文探讨了优化C语言程序性能的策略,涵盖算法优化、代码结构优化、内存管理优化、编译器优化、数据结构优化、并行计算优化及性能测试与分析七个方面
C语言因高效灵活被广泛应用于软件开发。本文探讨了优化C语言程序性能的策略,涵盖算法优化、代码结构优化、内存管理优化、编译器优化、数据结构优化、并行计算优化及性能测试与分析七个方面,旨在通过综合策略提升程序性能,满足实际需求。
37 1
|
21天前
|
算法
优化策略:揭秘钢条切割与饼干分发的算法艺术
本文探讨了钢条切割与饼干分发两个经典算法问题,展示了算法在解决实际问题中的应用。钢条切割问题通过动态规划方法,计算出不同长度钢条的最大盈利切割方式,考虑焊接成本后问题更为复杂。饼干分发问题则采用贪心算法,旨在尽可能多的喂饱孩子,分别讨论了每个孩子一块饼干和最多两块饼干的情况。这些问题不仅体现了数学的精妙,也展示了工程师的智慧与创造力。
36 4
|
21天前
|
存储 缓存 算法
通过优化算法和代码结构来提升易语言程序的执行效率
通过优化算法和代码结构来提升易语言程序的执行效率
|
27天前
|
算法
分享一些提高二叉树遍历算法效率的代码示例
这只是简单的示例代码,实际应用中可能还需要根据具体需求进行更多的优化和处理。你可以根据自己的需求对代码进行修改和扩展。
|
1月前
|
算法 测试技术 开发者
在Python开发中,性能优化和代码审查至关重要。性能优化通过改进代码结构和算法提高程序运行速度,减少资源消耗
在Python开发中,性能优化和代码审查至关重要。性能优化通过改进代码结构和算法提高程序运行速度,减少资源消耗;代码审查通过检查源代码发现潜在问题,提高代码质量和团队协作效率。本文介绍了一些实用的技巧和工具,帮助开发者提升开发效率。
41 3
|
1月前
|
分布式计算 Java 开发工具
阿里云MaxCompute-XGBoost on Spark 极限梯度提升算法的分布式训练与模型持久化oss的实现与代码浅析
本文介绍了XGBoost在MaxCompute+OSS架构下模型持久化遇到的问题及其解决方案。首先简要介绍了XGBoost的特点和应用场景,随后详细描述了客户在将XGBoost on Spark任务从HDFS迁移到OSS时遇到的异常情况。通过分析异常堆栈和源代码,发现使用的`nativeBooster.saveModel`方法不支持OSS路径,而使用`write.overwrite().save`方法则能成功保存模型。最后提供了完整的Scala代码示例、Maven配置和提交命令,帮助用户顺利迁移模型存储路径。
|
2月前
|
缓存 分布式计算 监控
优化算法和代码需要注意什么
【10月更文挑战第20天】优化算法和代码需要注意什么
22 0
|
7天前
|
算法
基于WOA算法的SVDD参数寻优matlab仿真
该程序利用鲸鱼优化算法(WOA)对支持向量数据描述(SVDD)模型的参数进行优化,以提高数据分类的准确性。通过MATLAB2022A实现,展示了不同信噪比(SNR)下模型的分类误差。WOA通过模拟鲸鱼捕食行为,动态调整SVDD参数,如惩罚因子C和核函数参数γ,以寻找最优参数组合,增强模型的鲁棒性和泛化能力。
|
13天前
|
机器学习/深度学习 算法 Serverless
基于WOA-SVM的乳腺癌数据分类识别算法matlab仿真,对比BP神经网络和SVM
本项目利用鲸鱼优化算法(WOA)优化支持向量机(SVM)参数,针对乳腺癌早期诊断问题,通过MATLAB 2022a实现。核心代码包括参数初始化、目标函数计算、位置更新等步骤,并附有详细中文注释及操作视频。实验结果显示,WOA-SVM在提高分类精度和泛化能力方面表现出色,为乳腺癌的早期诊断提供了有效的技术支持。