10w+播放!自动化办公,用到了哪些实用的Python技术?

本文涉及的产品
实时计算 Flink 版,5000CU*H 3个月
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
大数据开发治理平台 DataWorks,不限时长
简介: 10w+播放!自动化办公,用到了哪些实用的Python技术?

大家好,这里是程序员晚枫,小红薯也叫这个名字。

去年4月,我在Github和pypi同步发布了自动化办公的专用库:python-office,并且有幸得到了开源中国的推荐。

截至目前,在GitHub和Gitee获得的star⭐分别是:650、573,在小破站和百度发布的python-office的相关教程,都获得了10w+的播放。

Stargazers over time

作为初次使用这个项目的小白,经常会被这个项目可以用1行代码实现复杂的办公需求所吸引,但简单的操作背后,有哪些复杂的技术支撑呢?

今天就给大家揭秘5个在python-office这个库中使用到的实用编程技巧,帮助感兴趣的同学进一步提高编程技术~

内置函数

首先要说的是最基础,也最实用的python技巧:使用内置函数。

给大家举个例子,python-office这个库里有一个功能非常受欢迎:PDF转Word,这个功能,既可以单个处理,也可以批量处理。

在批量处理之前/之后,程序会给你报告一下,本次待处理/处理了多少个文件。

这时候就需要用到一个编程:统计列表里的文件总数。

如果你不用内置函数,以实现你会这么写代码:

file_list = [a.pdf,b.pdf,c.pdf...]
file_count = 0
for file in file_list:
    file_count += 1

如果使用内置函数,1行代码就搞定了:

file_list = [a.pdf,b.pdf,c.pdf...]
file_count = len(file_list)

使用内置函数除了代码简洁外,还有一个很明显的好处:代码速度更快!

装饰器

运行过代码的朋友还会发现:我们每个功能,都是自带视频教程的。

如何在不改变代码的情况下,给代码增加功能呢?这时候就可以用装饰器来实现了。

@instruction
def fake2excel(columns=['name'], rows=1, path='./fake2excel.xlsx', language='zh_CN'):
    """
    自动创建Excel,并且模拟数据
    Args:
        columns: 列名,可以模拟的列见源码。
        rows: 生成多少行数据。默认值:1
        path: 生成的Excel的位置和名称。
        language: 数据用什么语言,默认是中文,可以填english,

    Returns:

    """
    poexcel.fake2excel(columns, rows, path, language)

自定义装饰器的方法,之前在同名小破站给大家分享过:利用世界杯,读懂 Python 装饰器

类型提示(Type Hints)

类型提示可以帮助开发者更容易地理解代码,同时可以让一些工具(如IDE和静态类型检查器)提供更好的代码分析和自动补全功能。类型提示在Python 3.5及以后的版本中通过类型注解(Type Annotations)和typing模块得到支持。

对于写Java,尤其是写C++的程序员来说,Python中的类型定义用起来很难受。Type Hints可以提供一定程度的类型提示功能,但请注意,这个提示只对阅读代码有用,对于代码编译和运行没有任何作用。

举个例子:从100个Excel中,搜索包含'程序员晚枫'这几个字的Excel文件。

@instruction
def find_excel_data(search_key: str, target_dir: str):
    poexcel.find_excel_data(search_key, target_dir)

其中,search_key: str, target_dir: str表示:指定了参数的类型为str。

面向对象

这一点不用多说了,因为稍微懂一点专业开发的朋友,都知道什么是面向对象。而不懂面向对象的业余开发,也没有必要懂。

具体代码,大家可以去python-office的代码仓库查看,每个api都是基于对象实现的。

  • GitHub:python-office

Path

pathlib是跨平台的、面向对象的路径操作模块,可适用于不同的操作系统,其操作对象是各种操作系统中使用的路径(包括绝对路径和相对路径),pathlib有两个主要的类,分别为PurePath和Path。

python-office中主要使用的是Path,用起来真的很方便!

file_path = Path('./程序员晚枫的文件夹') / Path('./res')

使用Path方法,拼接路径的时候就不需要使用os.join了,可以直接用/你敢信吗?大大提高了代码的可读性~


大家学习 或 使用代码过程中,有任何问题,都可以加入评论区交流哟~👇

相关文章
|
19天前
|
数据采集 存储 API
网络爬虫与数据采集:使用Python自动化获取网页数据
【4月更文挑战第12天】本文介绍了Python网络爬虫的基础知识,包括网络爬虫概念(请求网页、解析、存储数据和处理异常)和Python常用的爬虫库requests(发送HTTP请求)与BeautifulSoup(解析HTML)。通过基本流程示例展示了如何导入库、发送请求、解析网页、提取数据、存储数据及处理异常。还提到了Python爬虫的实际应用,如获取新闻数据和商品信息。
|
10天前
|
缓存 NoSQL Redis
Python缓存技术(Memcached、Redis)面试题解析
【4月更文挑战第18天】本文探讨了Python面试中关于Memcached和Redis的常见问题,包括两者的基础概念、特性对比、客户端使用、缓存策略及应用场景。同时,文章指出了易错点,如数据不一致和缓存淘汰策略,并提供了实战代码示例,帮助读者掌握这两款内存键值存储系统的使用和优化技巧。通过理解其核心特性和避免常见错误,可以提升在面试中的表现。
20 2
|
1天前
|
机器学习/深度学习 算法 前端开发
【Python机器学习专栏】机器学习中的模型融合技术
【4月更文挑战第30天】模型融合,即集成学习,通过结合多个模型提升预测性能。常见方法包括:Bagging(如Random Forest)、Boosting(如AdaBoost、XGBoost)和Stacking。Python中可使用`scikit-learn`实现,例如BaggingClassifier示例。模型融合是机器学习中的强大工具,能提高整体性能并适应复杂问题。
|
1天前
|
机器学习/深度学习 算法 Python
【Python机器学习专栏】机器学习中的超参数调优技术
【4月更文挑战第30天】本文探讨了机器学习中超参数调优的重要性,介绍了网格搜索、随机搜索、贝叶斯优化和AutoML等调优方法,并提供了Python中使用`scikit-learn`进行网格搜索的示例。超参数的选择直接影响模型学习和泛化能力,而调优技术能帮助找到最佳组合,提升模型性能。随着AutoML的发展,自动化调参将成为更高效的选择。
|
1天前
|
机器学习/深度学习 算法 算法框架/工具
【Python机器学习专栏】深度学习中的正则化与优化技术
【4月更文挑战第30天】本文探讨了深度学习中的正则化和优化技术,以提升模型的泛化能力和训练效率。正则化包括L1和L2正则化以及Dropout,防止过拟合。优化技术涵盖梯度下降法、动量法和Adam优化器,加速模型收敛。Python示例展示了如何在Keras中应用这些技术,如L2正则化、Dropout及Adam优化器。
|
1天前
|
机器学习/深度学习 数据采集 算法
【Python机器学习专栏】数据标准化与归一化技术
【4月更文挑战第30天】在机器学习中,数据预处理的两大关键步骤是标准化和归一化,旨在调整数据范围以优化算法性能。标准化将数据缩放到特定区间,如[-1, 1]或[0, 1],适合基于距离的算法,如KNN、SVM。归一化则将数据线性变换到[0, 1],保持相对关系。Python中可使用`sklearn.preprocessing`的`MinMaxScaler`和`StandardScaler`实现这两种操作。选择哪种方法取决于数据分布和算法需求。预处理能提升模型理解和性能,增强预测准确性和可靠性。
|
1天前
|
机器学习/深度学习 算法 Python
【Python机器学习专栏】数据特征选择与降维技术
【4月更文挑战第30天】本文探讨了Python中数据特征选择与降维技术在机器学习和数据分析中的应用。特征选择包括单变量选择、递归特征消除(RFE)、树模型的特征重要性和相关性分析,有助于去除冗余和无关特征。降维技术涵盖PCA、LDA以及非线性方法如KPCA和ISOMAP,用于在低维空间保留信息。这些技术能简化数据、提升模型性能及可解释性。
|
1天前
|
前端开发 测试技术 持续交付
【Flutter 前端技术开发专栏】Flutter 中的 UI 测试与自动化测试
【4月更文挑战第30天】本文探讨了 Flutter 应用中UI测试和自动化测试的重要性,包括保障质量、提高效率和增强开发信心。Flutter提供`flutter_test`库进行Widget测试,以及`flutter_driver`进行集成测试。UI测试涵盖界面布局、交互和状态变化的验证,最佳实践建议尽早引入测试、保持用例简洁,并结合手动测试。未来,随着Flutter技术发展,UI测试和自动化测试将更加完善,助力开发高质量应用。
【Flutter 前端技术开发专栏】Flutter 中的 UI 测试与自动化测试
|
1天前
|
数据采集 Web App开发 iOS开发
爬取B站评论:Python技术实现详解
爬取B站评论:Python技术实现详解
|
2天前
|
数据采集 Web App开发 数据可视化
Python爬虫技术与数据可视化:Numpy、pandas、Matplotlib的黄金组合
Python爬虫技术与数据可视化:Numpy、pandas、Matplotlib的黄金组合