最简单 pandas 多进程 方法 pandarallel
虽然 Python 有自己专门实现多进程多线程的包,可是用于 pandas 中却不是很好用,其实 pandas 有自己实现多进程的包,超级好用。
一、初次见面
pandarallel 包
GitHub - nalepae/pandarallel at v1.5.2
A simple and efficient tool to parallelize Pandas operations on all available CPUs - GitHub - nalepae/pandarallel at v1.5.2
https://github.com/nalepae/pandarallel/tree/v1.5.2
二、安装方式
pip install pandarallel
三、初始化
from pandarallel import pandarallel pandarallel.initialize()
四、与普通 pandas 方法对比