公司项目申请软著,看到同事在一行一行的复制,用python2分钟帮了他

简介: 公司项目申请软著,看到同事在一行一行的复制,用python2分钟帮了他

前言

公司最近几个项目在申请软著和专利,申请过的小伙伴都知道,申请软著的时候,

需要提交一份word代码.

早上刚来的时候看到同事在:

Run_申请软著();

路过接水的时候看到同事依然在:

Run_申请软著();

路过上厕所的时候看到同事依然在:

Run_申请软著();

路过上开会的时候看到同事依然在:

Run_申请软著();

中午的时候看到同事依然在:

Run_申请软著();

省略99+次;

省略99+次;

晚上下班的时候看到同事竟然还在:

Run_申请软著();

为了简化说明,我提出来了公共部分:

Run_申请软著():{
  项目=项目0
  loop(1):
  {
  start:
    //1.打开[项目]源码目录;
    //2.打开[项目]源码中的其他子目录;
    //3.找到[项目]中:{.c,.cpp,.h,...}源码;
    //3-1.打开找到的{.c,.cpp,.h,...}源码;
    //3-2.复制找到的{.c,.cpp,.h,...}源码;
    //3-3.粘贴找到的{.c,.cpp,.h,...}源码 到 word中;
    //4.调整word格式;
    //5.挨个删除每一行回车换行符;
    //6.挨个删除每一行空白的行;
    //7.保存
  end:
    jump start;
  }
}

Python: 该我上场了

Python牛鼻.

我比较喜欢在做事情之前先分析一把,这样在真正做的时候,也能减小出错率;

其实流程就是下面这个:

Run_申请软著():{
  项目=项目0
  loop(1):
  {
  start:
    //1.打开[项目]源码目录;
    //2.打开[项目]源码中的其他子目录;
    //3.找到[项目]中:{.c,.cpp,.h,...}源码;
    //3-1.打开找到的{.c,.cpp,.h,...}源码;
    //3-2.复制找到的{.c,.cpp,.h,...}源码;
    //3-3.粘贴找到的{.c,.cpp,.h,...}源码 到 word中;
    //4.调整word格式;
    //5.挨个删除每一行回车换行符;
    //6.挨个删除每一行空白的行;
    //7.保存
  end:
    jump start;
  }
}

目录接口大概如下:

zhenghui@zh-pc:/软著代码$ tree ./ |grep -E -v ".txt|.c|.h"
./
├── 项目A
│   ├── master
│   │   ├── a.c
│   │   ├── a.h
│   │   ├── b.cpp
│   ├── slave
│   │   ├── a.c
│   │   ├── a.h
│   │   ├── b.cpp
│   └── ui
│   │   ├── a.c
│   │   ├── a.h
│   │   ├── b.cpp
├── 项目B
│   ├── master
│   │   ├── a.c
│   │   ├── a.h
│   │   ├── b.cpp
│   ├── slave
│   │   ├── a.c
│   │   ├── a.h
│   │   ├── b.cpp
│   └── ui
│   │   ├── a.c
│   │   ├── a.h
│   │   ├── b.cpp
├── 项目C
│   ├── master
│   │   ├── a.c
│   │   ├── a.h
│   │   ├── b.cpp
│   ├── slave
│   │   ├── a.c
│   │   ├── a.h
│   │   ├── b.cpp
│   └── ui
│   │   ├── a.c
│   │   ├── a.h
│   │   ├── b.cpp
└── └──

核心:

1、编码类型不一样,因为编码的风格以前没统一,导致了有的是UTF-8,GB2312,Windows-1254,Windows-1252,GBK等等各种编码格式都有,导致了有些数据python无法直接解析,需要手动指定编码格式才行.天呢,这么多代码,手动指定,不得累死,就查了下,可以这样做:

首先根据文件判断以下文件的编码类型:

# 获取文件类型
def get_files_encoding_type(file_dir):
    # 判断文件的编码类型
    enc = ""
    with open(file_dir, 'rb') as file:
        # 验证该文件的字符编码类型
        encoding_message = chardet.detect(file.read())
        enc = encoding_message['encoding']
        # GB2312,GBK,GB18030,是兼容的,包含的字符个数:GB2312 < GBK < GB18030
        # "Windows-1254" and  "Windows-1252" 也统一让gb18030处理,后面需要抑制一下报错
        if enc == "GB2312" or enc == "GBK" or enc == "Windows-1254" or enc == "Windows-1252":
            enc = "gb18030"
    return enc

然后在读取文件的时候,抑制以下error:

# 读源代码文件 errors='ignore':忽略报错
    file = open(read_dir, 'r', encoding=enc, errors='ignore')

2、源代码中可能存在一些.ini,.txt,makefile等类似的配置文件,我不需要,所以需要判断以下:

# 判断是否为想要的文件格式
def verify_file_type(file_path):
    flag = False
    # 判断文件后缀
    file_suffix = os.path.splitext(file_path)[-1]  # .c/.h/.cpp
    if file_suffix == ".h" or file_suffix == ".c" or file_suffix == ".cpp":
        flag = True
    return flag

全部代码:

```python
# -*- coding: UTF-8 -*-
import os
import chardet
# 是否输出文件名
# _printf_src_name = False
_printf_src_name = True
# 获取文件类型
def get_files_encoding_type(file_dir):
    # 判断文件的编码类型
    enc = ""
    with open(file_dir, 'rb') as file:
        # 验证该文件的字符编码类型
        encoding_message = chardet.detect(file.read())
        enc = encoding_message['encoding']
        # GB2312,GBK,GB18030,是兼容的,包含的字符个数:GB2312 < GBK < GB18030
        # "Windows-1254" and  "Windows-1252" 也统一让gb18030处理,后面需要抑制一下报错
        if enc == "GB2312" or enc == "GBK" or enc == "Windows-1254" or enc == "Windows-1252":
            enc = "gb18030"
    return enc
# 读取文件并写入新文件
def read_and_write_file(read_dir, enc, save_file):
    # 是否在首行写入源代码名字
    if _printf_src_name:
        dirarray = read_dir.split("/")
        curr_save_file_name = dirarray[len(dirarray) - 1]
        # 第一行写入源代码文件的名字
        save_file.write(("//"+ curr_save_file_name +":").encode())
        save_file.write("\n".encode())
    # 读源代码文件 errors='ignore':忽略报错
    file = open(read_dir, 'r', encoding=enc, errors='ignore')
    for line in file:
        if (len(line) > 0):
            # 跳过空行
            if line.isspace() == False:
                # 替换换行符
                res = line.replace('\n', '')
                # write file
                save_file.write(res.encode())
                save_file.write("\n".encode())
# 判断是否为想要的文件格式
def verify_file_type(file_path):
    flag = False
    # 判断文件后缀
    file_suffix = os.path.splitext(file_path)[-1]  # .c/.h/.cpp
    if file_suffix == ".h" or file_suffix == ".c" or file_suffix == ".cpp":
        flag = True
    return flag
# 递归遍历目录
def traversal_files_save_txt(dir_path, save_file):
    for dir in os.listdir(dir_path):
        dir = os.path.join(dir_path, dir)
        # 判断当前目录是否为文件
        if os.path.isfile(dir):
            # 判断文件后缀
            if verify_file_type(dir):
                # 判断文件的编码类型,
                enc = get_files_encoding_type(dir)
                if enc == "":
                    continue;
                # 写文件
                read_and_write_file(dir, enc, save_file)
            else:
                print(dir, "不支持,该文件不是源代码文件")
        # 判断当前目录是否为文件夹
        if os.path.isdir(dir):
            traversal_files_save_txt(dir, save_file)
def traversal_files_to_txt(dir_path):
    for dir in os.listdir(dir_path):
        # 如果是目录就以目录的名字创建一个txt文件存储这个目录中的代码
        save_file_name = dir + ".txt"
        if _printf_src_name:
            save_file_name = dir + "-首行带源文件名.txt"
        save_dir = os.path.join(dir_path, dir)
        if os.path.isdir(save_dir):
            save_txt_file = os.path.join(dir_path, save_file_name)
            print("save_path=", save_dir, save_txt_file)
            # open save file text
            save_file = open(save_txt_file, 'wb+')
            # write .c .cpp .h to txt file
            traversal_files_save_txt(save_dir, save_file)
if __name__ == '__main__':
    dir_path = r'./软著代码/'
    traversal_files_to_txt(dir_path)


目录
相关文章
|
5月前
|
异构计算 Python
ERROR: pip’s dependency resolver does not currently take into 报错-Python项目依赖冲突的解决方案-优雅草优雅草卓伊凡
ERROR: pip’s dependency resolver does not currently take into 报错-Python项目依赖冲突的解决方案-优雅草优雅草卓伊凡
449 1
|
5月前
|
API 语音技术 开发者
Python 项目打包,并上传到 PyPI,分享项目
本文介绍了如何使用 Poetry 打包并发布一个 Python 项目至 PyPI。内容包括:项目创建、配置 `pyproject.toml` 文件、构建软件包、上传至 PyPI、安装与使用。通过实例 iGTTS 展示了从开发到发布的完整流程,帮助开发者快速分享自己的 Python 工具。
|
5月前
|
人工智能 Shell Python
ERROR: pip’s dependency resolver does not currently take into 报错-Python项目依赖冲突的解决方案-优雅草优雅草卓伊凡
ERROR: pip’s dependency resolver does not currently take into 报错-Python项目依赖冲突的解决方案-优雅草优雅草卓伊凡
275 0
|
8月前
|
监控 大数据 API
Python 技术员实践指南:从项目落地到技术优化
本内容涵盖Python开发的实战项目、技术攻关与工程化实践,包括自动化脚本(日志分析系统)和Web后端(轻量化API服务)两大项目类型。通过使用正则表达式、Flask框架等技术,解决日志分析效率低与API服务性能优化等问题。同时深入探讨内存泄漏排查、CPU瓶颈优化,并提供团队协作规范与代码审查流程。延伸至AI、大数据及DevOps领域,如商品推荐系统、PySpark数据处理和Airflow任务编排,助力开发者全面提升从编码到架构的能力,积累高并发与大数据场景下的实战经验。
Python 技术员实践指南:从项目落地到技术优化
|
10月前
|
程序员 测试技术 开发工具
怎么开发Python第三方库?手把手教你参与开源项目!
大家好,我是程序员晚枫。本文将分享如何开发Python第三方库,并以我维护的开源项目 **popdf** 为例,指导参与开源贡献。Popdf是一个PDF操作库,支持PDF转Word、转图片、合并与加密等功能。文章涵盖从fork项目、本地开发、单元测试到提交PR的全流程,适合想了解开源贡献的开发者。欢迎访问[popdf](https://gitcode.com/python4office/popdf),一起交流学习!
328 21
怎么开发Python第三方库?手把手教你参与开源项目!
|
机器学习/深度学习 数据采集 数据可视化
Python 数据分析:从零开始构建你的数据科学项目
【10月更文挑战第9天】Python 数据分析:从零开始构建你的数据科学项目
279 2
|
测试技术 Python
【03】做一个精美的打飞机小游戏,规划游戏项目目录-分门别类所有的资源-库-类-逻辑-打包为可玩的exe-练习python打包为可执行exe-优雅草卓伊凡-持续更新-分享源代码和游戏包供游玩-1.0.2版本
【03】做一个精美的打飞机小游戏,规划游戏项目目录-分门别类所有的资源-库-类-逻辑-打包为可玩的exe-练习python打包为可执行exe-优雅草卓伊凡-持续更新-分享源代码和游戏包供游玩-1.0.2版本
627 31
【03】做一个精美的打飞机小游戏,规划游戏项目目录-分门别类所有的资源-库-类-逻辑-打包为可玩的exe-练习python打包为可执行exe-优雅草卓伊凡-持续更新-分享源代码和游戏包供游玩-1.0.2版本
|
11月前
|
Docker Python 容器
Docker——阿里云服务器使用Docker部署python项目全程小记
本文记录了我在阿里云服务器上使用Docker部署python项目(flask为例)的全过程,在这里记录和分享一下,希望可以给大家提供一些参考。
1422 1
|
监控 安全 测试技术
如何在实际项目中应用Python Web开发的安全测试知识?
如何在实际项目中应用Python Web开发的安全测试知识?
242 61

推荐镜像

更多