前言
PyHubWeekly每周定期更新,精选GitHub上优质的Python项目/小工具。
我把PyHubWeekly托管到了Github,感兴趣的可以搜索Github项目PyHubWeekly[1],如果喜欢,麻烦给个Star支持一下吧。此外,欢迎大家通过提交issue来投稿和推荐自己的项目~
本期为大家推荐GitHub上5个优质的Python项目,它们分别是:
•pre-commit•beets•Picard•pydantic•airflow
下面分别来介绍一下上述5个GitHub项目。
pre-commit
Star:4k
代码规范检查是项目上线过程中必不可少的一环,在大多数情况下,我们都是把代码提交到代码库再进行静态检查。但是,为什么不从最源头把这个问题解决呢?
pre-commit[2]是一款由Python开发的git hooks
工具,它能够在合入代码,提交commit
时对代码进行规范检查和格式化,这样就能够从根源上解决代码规范的问题,而不是把代码合入到代码库中再统一解决,这样不仅耗时,而且繁琐。
我们下面以Python项目中使用为例进行介绍,但是,它不仅适用于Python,它能够适用于所有编程语言。
安装
pip install pre-commit
配置文件
安装之后需要修改一下配置文件,.pre-commit-config.yaml
,
repos: - repo: https://github.com/pre-commit/pre-commit-hooks rev: v2.3.0 hooks: - id: check-yaml - id: end-of-file-fixer - id: trailing-whitespace - repo: https://github.com/psf/black rev: 19.3b0 hooks: - id: black
使用
pre-commit install git commit -m "Add super awesome feature"
提交commit
之后就可以看到,它会用到两个工具black和flake8。black我在第七期介绍过这款工具,它是一款高效的代码格式化工具,用于修改代码格式。flake8是一款格式检查工具。
beets
Star:9.2k
beets[3]是一款音乐收藏辅助工具,它能够让音乐收藏一劳永逸。它会对你的集合进行分类,并在此过程中自动增强其元数据。然后,它通过提供的一组工具来操作和访问你的音乐。
安装
pip install beets
具体使用教程可以查看文档[4]。
Picard
Star:2k
Picard[5]是一款由Python开发的跨平台音乐标记工具,它能够在Linux/Mac OS X/Windows多个平台上进行使用。
Picard支持大多数音频文件格式,能够使用音频AcoustIDs,执行CD查找和磁盘ID提交,并且具有出色的Unicode支持。
pydantic
Star:2.5k
使用过Python的应该都很清楚,Python是一种对数据类型非常弱化的一种编程语言。在编写Python程序时,你不需要去关心数据的类型。但是,这对于阅读代码和调试代码却带来了很多麻烦,因此,我们还是需要养成C++/Java那样的好习惯,应该关注数据类型。
pydantic[6]是一款使用Python类型提示对Python项目进行数据验证和设置管理的工具。
安装
pip install -U pydantic
示例
from datetime import datetime from typing import List, Optional from pydantic import BaseModel class User(BaseModel): id: int name = 'John Doe' signup_ts: Optional[datetime] = None friends: List[int] = [] external_data = {'id': '123', 'signup_ts': '2017-06-01 12:22', 'friends': [1, '2', b'3']} user = User(**external_data) print(user) #> User id=123 name='John Doe' signup_ts=datetime.datetime(2017, 6, 1, 12, 22) friends=[1, 2, 3] print(user.id) #> 123
通过上述示例我们可以看出,通过继承pydantic中的BaseModel,能够对传入的参数进行数据类型的校验和修正,这样能够避免开发过程中难以定位的问题。
airflow
Star:16k
airflow[7]一个通过编程方式编写、调度和监视工作流的平台。
为什么调度、监视工作流的方式有很多,却偏偏选择airflow呢?
因为,当工作流被定义为代码时,它们变得更加可维护、版本化、可测试性和协作性,通过定义airflow有向无环图工作流可以实现如下优点,
•动态•可扩展•简洁清晰