Pandas 2.2 中文官方教程和指南（一）（1）-阿里云开发者社区

安装

原文：pandas.pydata.org/docs/getting_started/install.html

安装 pandas 的最简单方法是作为Anaconda发行版的一部分安装，这是一个用于数据分析和科学计算的跨平台发行版。Conda包管理器是大多数用户推荐的安装方法。

还提供了从源代码安装（#install-source）、从 PyPI 安装（#install-pypi）或安装开发版本（#install-dev）的说明。

Python 版本支持

官方支持 Python 3.9、3.10、3.11 和 3.12。

安装 pandas

使用 Anaconda 安装

对于新手用户，安装 Python、pandas 和构成PyData堆栈（SciPy、NumPy、Matplotlib等）的包的最简单方法是使用Anaconda，这是一个跨平台（Linux、macOS、Windows）的 Python 发行版，用于数据分析和科学计算。Anaconda 的安装说明在这里。 ### 使用 Miniconda 安装

对于有经验的 Python 用户，推荐使用Miniconda安装 pandas。Miniconda 允许您创建一个相对于 Anaconda 更小、独立的 Python 安装，并使用Conda包管理器安装其他包并为您的安装创建虚拟环境。Miniconda 的安装说明在这里。

下一步是创建一个新的 conda 环境。conda 环境类似于一个允许您指定特定版本的 Python 和一组库的虚拟环境。从终端窗口运行以下命令。

conda  create  -c  conda-forge  -n  name_of_my_env  python  pandas

这将创建一个仅安装了 Python 和 pandas 的最小环境。要进入这个环境，请运行。

source  activate  name_of_my_env
# On Windows
activate  name_of_my_env 
```### 从 PyPI 安装
可以通过 pip 从[PyPI](https://pypi.org/project/pandas)安装 pandas。
```py
pip  install  pandas

注意

您必须拥有pip>=19.3才能从 PyPI 安装。

注意

建议从虚拟环境中安装和运行 pandas，例如，使用 Python 标准库的venv

pandas 也可以安装带有可选依赖项集以启用某些功能。例如，要安装带有读取 Excel 文件的可选依赖项的 pandas。

pip  install  "pandas[excel]"

可以在依赖部分找到可以安装的全部额外功能列表。

处理 ImportError

如果遇到 ImportError，通常意味着 Python 在可用库列表中找不到 pandas。Python 内部有一个目录列表，用于查找软件包。您可以通过以下方式获取这些目录。

import sys
sys.path

您可能遇到此错误的一种方法是，如果您的系统上安装了多个 Python，并且您当前使用的 Python 安装中没有安装 pandas，则可能会遇到此错误。在 Linux/Mac 上，您可以在终端上运行 which python，它将告诉您当前正在使用哪个 Python 安装。如果是类似“/usr/bin/python”的东西，则表示您正在使用系统中的 Python，这是不推荐的。

强烈建议使用 conda，以便快速安装和更新软件包和依赖项。您可以在此文档中找到有关 pandas 的简单安装说明。

从源代码安装

请参阅贡献指南以获取有关从 git 源代码树构建的完整说明。此外，如果您希望创建 pandas 开发环境，请参阅创建开发环境。 ### 安装 pandas 的开发版本

安装开发版本是最快的方法：

尝试一个新功能，该功能将在下一个发布中发布（即，从最近合并到主分支的拉取请求中提取的功能）。
检查您遇到的错误是否在上次发布之后修复。

开发版本通常每天上传到 anaconda.org 的 PyPI 注册表的 scientific-python-nightly-wheels 索引中。您可以通过运行以下命令进行安装。

pip  install  --pre  --extra-index  https://pypi.anaconda.org/scientific-python-nightly-wheels/simple  pandas

请注意，您可能需要卸载现有版本的 pandas 才能安装开发版本。

pip  uninstall  pandas  -y

运行测试套件

pandas 配备有一套详尽的单元测试。运行测试所需的软件包可以使用 pip install "pandas[test]" 进行安装。要从 Python 终端运行测试。

>>> import pandas as pd
>>> pd.test()
running: pytest -m "not slow and not network and not db" /home/user/anaconda3/lib/python3.9/site-packages/pandas
============================= test session starts ==============================
platform linux -- Python 3.9.7, pytest-6.2.5, py-1.11.0, pluggy-1.0.0
rootdir: /home/user
plugins: dash-1.19.0, anyio-3.5.0, hypothesis-6.29.3
collected 154975 items / 4 skipped / 154971 selected
........................................................................ [  0%]
........................................................................ [ 99%]
.......................................                                  [100%]
==================================== ERRORS ====================================
=================================== FAILURES ===================================
=============================== warnings summary ===============================
=========================== short test summary info ============================
= 1 failed, 146194 passed, 7402 skipped, 1367 xfailed, 5 xpassed, 197 warnings, 10 errors in 1090.16s (0:18:10) =

注意

这只是显示的信息示例。测试失败并不一定表示 pandas 安装有问题。

依赖项

必需的依赖项

pandas 需要以下依赖项。

软件包	最低支持版本
NumPy	1.22.4
python-dateutil	2.8.2
pytz	2020.1

| tzdata | 2022.7 | ### 可选依赖项

pandas 有许多可选依赖项，仅用于特定方法。例如，pandas.read_hdf() 需要 pytables 包，而 DataFrame.to_markdown() 需要 tabulate 包。如果未安装可选依赖项，则在调用需要该依赖项的方法时，pandas 将引发 ImportError。

如果使用 pip，可选的 pandas 依赖项可以作为可选额外项（例如 pandas[performance, aws]）安装或在文件中管理（例如 requirements.txt 或 pyproject.toml）。所有可选依赖项都可以通过 pandas[all] 安装，特定的依赖项集在下面的各节中列出。

性能依赖项（推荐）

注意

鼓励您安装这些库，因为它们提供了速度改进，特别是在处理大型数据集时。

可通过 pip install "pandas[performance]" 进行安装。

依赖项	最低版本	pip 额外	注释
numexpr	2.8.4	性能	通过使用多个核心以及智能分块和缓存来加速某些数值运算
bottleneck	1.3.6	性能	通过使用专门的 cython 程序加速某些类型的 `nan`，从而实现大幅加速。
numba	0.56.4	性能	用��接受 `engine="numba"` 的操作的替代执行引擎，使用 JIT 编译器将 Python 函数转换为优化的机器代码，使用 LLVM 编译器实现大幅优化。

可视化

可通过 pip install "pandas[plot, output-formatting]" 进行安装。

依赖项	最低版本	pip 额外	注释
matplotlib	3.6.3	绘图	绘图库
Jinja2	3.1.2	输出格式化	与 DataFrame.style 一起使用的条件格式化
tabulate	0.9.0	输出格式化	以 Markdown 友好的格式打印（参见 tabulate）

计算

可通过 pip install "pandas[computation]" 进行安装。

依赖项	最低版本	pip 额外	注释
SciPy	1.10.0	计算	各种统计函数
xarray	2022.12.0	计算	用于 N 维数据的类似于 pandas 的 API

Excel 文件

可通过 pip install "pandas[excel]" 进行安装。

依赖项	最低版本	pip 额外	注释
xlrd	2.0.1	excel	读取 Excel
xlsxwriter	3.0.5	excel	写入 Excel
openpyxl	3.1.0	excel	读取/写入 xlsx 文件
pyxlsb	1.0.10	excel	读取 xlsb 文件
python-calamine	0.1.7	excel	读取 xls/xlsx/xlsb/ods 文件

HTML

可通过 pip install "pandas[html]" 进行安装。

依赖	最低版本	pip 额外组件	注释
BeautifulSoup4	4.11.2	html	用于 `read_html` 的 HTML 解析器
html5lib	1.1	html	用于 `read_html` 的 HTML 解析器
lxml	4.9.2	html	用于 `read_html` 的 HTML 解析器

使用顶层 read_html() 函数，需要以下库组合之一：

BeautifulSoup4 和 html5lib
BeautifulSoup4 和 lxml
BeautifulSoup4 和 html5lib 和 lxml
只需要 lxml，尽管请查看 HTML 表解析了解为什么你可能不应该采用这种方法。

警告

如果你安装了 BeautifulSoup4，你必须安装 lxml 或者 html5lib，或者两者都安装。只有安装了 BeautifulSoup4，read_html() 才会不起作用。
强烈建议阅读 HTML 表解析陷阱。它解释了上述三个库的安装和使用相关问题。

XML

通过 pip install "pandas[xml]" 安装。

依赖	最低版本	pip 额外组件	注释
lxml	4.9.2	xml	`read_xml` 的 XML 解析器和 `to_xml` 的树生成器

SQL 数据库

传统驱动可以通过 pip install "pandas[postgresql, mysql, sql-other]" 安装。

依赖	最低版本	pip 额外组件	注释
SQLAlchemy	2.0.0	postgresql, mysql, sql-other	除 sqlite 外其他数据库的 SQL 支持
psycopg2	2.9.6	postgresql	用于 sqlalchemy 的 PostgreSQL 引擎
pymysql	1.0.2	mysql	用于 sqlalchemy 的 MySQL 引擎
adbc-driver-postgresql	0.8.0	postgresql	PostgreSQL 的 ADBC 驱动程序
adbc-driver-sqlite	0.8.0	sql-other	SQLite 的 ADBC 驱动程序

其他数据源

通过 pip install "pandas[hdf5, parquet, feather, spss, excel]" 安装。

依赖	最低版本	pip 额外组件	注释
PyTables	3.8.0	hdf5	基于 HDF5 的读取 / 写入
blosc	1.21.3	hdf5	HDF5 压缩；仅适用于 `conda`
zlib		hdf5	HDF5 压缩
fastparquet	2022.12.0		Parquet 读取 / 写入（pyarrow 是默认）
pyarrow	10.0.1	parquet, feather	Parquet、ORC 和 feather 读取 / 写入
pyreadstat	1.2.0	spss	SPSS 文件（.sav）读取
odfpy	1.4.1	excel	Open document format (.odf, .ods, .odt) 读取 / 写入

警告

如果你想使用 read_orc()，强烈建议使用 conda 安装 pyarrow。如果 pyarrow 是从 pypi 安装的，可能会导致 read_orc() 失败，并且 read_orc() 与 Windows 操作系统不兼容。

访问云端数据

使用 pip install "pandas[fss, aws, gcp]" 可安装。

依赖	最低版本	pip 额外	注释
fsspec	2022.11.0	fss, gcp, aws	处理除简单本地和 HTTP 外的文件（s3fs、gcsfs 的必需依赖）。
gcsfs	2022.11.0	gcp	谷歌云存储访问
pandas-gbq	0.19.0	gcp	谷歌大数据查询访问
s3fs	2022.11.0	aws	亚马逊 S3 访问

剪贴板

使用 pip install "pandas[clipboard]" 可安装。

依赖	最低版本	pip 额外	注释
PyQt4/PyQt5	5.15.9	clipboard	剪贴板 I/O
qtpy	2.3.0	clipboard	剪贴板 I/O

注意

根据操作系统的不同，可能需要安装系统级软件包。在 Linux 上，要使剪贴板正常工作，必须安装其中一个命令行工具 xclip 或 xsel。

压缩

使用 pip install "pandas[compression]" 可安装。

依赖	最低版本	pip 额外	注释
Zstandard	0.19.0	compression	Zstandard 压缩

联盟标准

使用 pip install "pandas[consortium-standard]" 可安装。

依赖	最低版本	pip 额外	注释

官方支持 Python 3.9、3.10、3.11 和 3.12。

安装 pandas

使用 Anaconda 安装

对于新手用户，安装 Python、pandas 以及构成 PyData 栈（SciPy、NumPy、Matplotlib 等）的软件包最简单的方法是使用 Anaconda，这是一个跨平台（Linux、macOS、Windows）的数据分析和科学计算 Python 发行版。Anaconda 的安装说明可在此找到。 ### 使用 Miniconda 安装

对于有 Python 经验的用户，推荐使用Miniconda安装 pandas。Miniconda 允许您创建一个最小的、独立的 Python 安装，与 Anaconda 相比，并使用Conda包管理器安装其他包并为您的安装创建虚拟环境。有关 Miniconda 的安装说明可以在这里找到。

下一步是创建一个新的 conda 环境。conda 环境类似于一个允许您指定特定 Python 版本和一组库的虚拟环境。从终端窗口运行以下命令。

conda  create  -c  conda-forge  -n  name_of_my_env  python  pandas

这将创建一个只安装了 Python 和 pandas 的最小环境。要进入此环境，请运行。

source  activate  name_of_my_env
# On Windows
activate  name_of_my_env 
```### 从 PyPI 安装
可以通过 pip 从[PyPI](https://pypi.org/project/pandas)安装 pandas。
```py
pip  install  pandas

注意

您必须拥有pip>=19.3才能从 PyPI 安装。

注意

建议安装并从虚拟环境中运行 pandas，例如，使用 Python 标准库的venv。

pandas 也可以安装一组可选依赖项，以启用某些功能。例如，要安装带有可选依赖项以读取 Excel 文件的 pandas。

pip  install  "pandas[excel]"

可以在依赖部分找到可以安装的全部额外内容列表。

处理 ImportErrors

如果遇到ImportError，通常意味着 Python 在可用库列表中找不到 pandas。Python 内部有一个目录列表，用于查找包。您可以通过以下方式获取这些目录。

import sys
sys.path

您可能遇到此错误的一种方式是，如果您的系统上有多个 Python 安装，并且您当前使用的 Python 安装中没有安装 pandas。在 Linux/Mac 上，您可以在终端上运行which python，它会告诉您正在使用哪个 Python 安装。如果类似于“/usr/bin/python”，则您正在使用系统中的 Python，这是不推荐的。

强烈建议使用conda进行快速安装和包和依赖项更新。您可以在此文档中找到有关 pandas 的简单安装说明。

从源代码安装

请查看贡献指南以获取有关从 git 源代码树构建的完整说明。此外，如果您希望创建 pandas 开发环境，请查看创建开发环境。 ### 安装 pandas 的开发版本

安装开发版本是最快的方法：

尝试一个将在下一个发布中提供的新功能（即，最近合并到主分支的拉取请求中的功能）。
检查您遇到的错误是否在上一个版本中已修复。

开发版本通常每天上传到 anaconda.org 的 PyPI 注册表的 scientific-python-nightly-wheels 索引中。您可以通过运行来安装它。

pip  install  --pre  --extra-index  https://pypi.anaconda.org/scientific-python-nightly-wheels/simple  pandas

请注意，您可能需要卸载现有版本的 pandas 才能安装开发版本。

pip  uninstall  pandas  -y 
```### 使用 Anaconda 安装
对于新手用户，安装 Python、pandas 和构成[PyData](https://pydata.org/)堆栈（[SciPy](https://scipy.org/)、[NumPy](https://numpy.org/)、[Matplotlib](https://matplotlib.org/)等）的包最简单的方法是使用[Anaconda](https://docs.continuum.io/free/anaconda/)，这是一个跨平台（Linux、macOS、Windows）的用于数据分析和科学计算的 Python 发行版。有关 Anaconda 的安装说明[请参见此处](https://docs.continuum.io/free/anaconda/install/)。
### 使用 Miniconda 安装
对于有 Python 经验的用户，推荐使用[Miniconda](https://docs.conda.io/en/latest/miniconda.html)安装 pandas。Miniconda 允许您创建一个最小、独立的 Python 安装，与 Anaconda 相比，使用[Conda](https://conda.io/en/latest/)包管理器安装额外的包并为您的安装创建虚拟环境。有关 Miniconda 的安装说明[请参见此处](https://docs.conda.io/en/latest/miniconda.html)。
下一步是创建一个新的 conda 环境。conda 环境类似于一个允许您指定特定 Python 版本和一组库的虚拟环境。从终端窗口运行以下命令。
```py
conda  create  -c  conda-forge  -n  name_of_my_env  python  pandas

这将创建一个只安装了 Python 和 pandas 的最小环境。要进入此环境，请运行。

source  activate  name_of_my_env
# On Windows
activate  name_of_my_env

从 PyPI 安装

可以通过pip从 PyPI 安装 pandas。

pip  install  pandas

注意

您必须拥有pip>=19.3才能从 PyPI 安装。

注意

建议在虚拟环境中安装和运行 pandas，例如，使用 Python 标准库的venv。

pandas 也可以安装带有可选依赖项集合以启用某些功能。例如，要安装带有可选依赖项以读取 Excel 文件的 pandas。

pip  install  "pandas[excel]"

可以在依赖部分找到可以安装的全部额外功能列表。

处理 ImportErrors

如果遇到ImportError，通常意味着 Python 在可用库列表中找不到 pandas。Python 内部有一个目录列表，用于查找包。您可以通过以下方式获取这些目录。

import sys
sys.path

您可能遇到此错误的一种方式是，如果您的系统上有多个 Python 安装，并且您当前使用的 Python 安装中没有安装 pandas。在 Linux/Mac 上，您可以在终端上运行which python，它会告诉您当前使用的 Python 安装。如果显示类似“/usr/bin/python”的内容，则表示您正在使用系统中的 Python，这是不推荐的。

强烈建议使用conda，以快速安装和更新包和依赖项。您可以在此文档中找到 pandas 的简单安装说明。

从源代码安装

查看贡献指南以获取有关从 git 源代码树构建的完整说明。此外，如果您希望创建一个 pandas 开发环境，请查看创建开发环境。

安装 pandas 的开发版本

安装开发版本是最快的方式：

尝试一个将在下一个版本中发布的新功能（即，最近合并到主分支的拉取请求中的功能）。
检查您遇到的错误是否自上次发布以来已修复。

开发版本通常每天上传到 anaconda.org 的 PyPI 注册表的 scientific-python-nightly-wheels 索引中。您可以通过运行以下命令来安装。

pip  install  --pre  --extra-index  https://pypi.anaconda.org/scientific-python-nightly-wheels/simple  pandas

请注意，您可能需要卸载现有版本的 pandas 才能安装开发版本。

pip  uninstall  pandas  -y

运行测试套件

pandas 配备了一套详尽的单元测试。运行测试所需的包可以通过pip install "pandas[test]"安装。要从 Python 终端运行测试。

>>> import pandas as pd
>>> pd.test()
running: pytest -m "not slow and not network and not db" /home/user/anaconda3/lib/python3.9/site-packages/pandas
============================= test session starts ==============================
platform linux -- Python 3.9.7, pytest-6.2.5, py-1.11.0, pluggy-1.0.0
rootdir: /home/user
plugins: dash-1.19.0, anyio-3.5.0, hypothesis-6.29.3
collected 154975 items / 4 skipped / 154971 selected
........................................................................ [  0%]
........................................................................ [ 99%]
.......................................                                  [100%]
==================================== ERRORS ====================================
=================================== FAILURES ===================================
=============================== warnings summary ===============================
=========================== short test summary info ============================
= 1 failed, 146194 passed, 7402 skipped, 1367 xfailed, 5 xpassed, 197 warnings, 10 errors in 1090.16s (0:18:10) =

注意

这只是显示的信息示例。测试失败并不一定表示 pandas 安装有问题。

依赖关系

必需依赖

pandas 需要以下依赖项。

包	最低支持版本
NumPy	1.22.4
python-dateutil	2.8.2
pytz	2020.1

| tzdata | 2022.7 | ### 可选依赖

pandas 有许多可选依赖项，仅用于特定方法。例如，pandas.read_hdf()需要pytables包，而DataFrame.to_markdown()需要tabulate包。如果未安装可选依赖项，则在调用需要该依赖项的方法时，pandas 将引发ImportError。

如果使用 pip，可以将可选的 pandas 依赖项安装或管理到文件中（例如 requirements.txt 或 pyproject.toml），作为可选的额外功能（例如 pandas[performance, aws]）。所有可选依赖项均可使用 pandas[all] 安装，具体的依赖项集合列在下面的各个部分中。

性能依赖项（推荐）

注意

强烈建议您安装这些库，因为它们提供了速度改进，特别是在处理大数据集时。

使用 pip install "pandas[performance]" 进行安装

依赖项	最低版本	pip extra	注释
numexpr	2.8.4	performance	通过使用多个核心以及智能分块和缓存来加速某些数值运算。
bottleneck	1.3.6	performance	通过使用专门的 cython 程序加速某些类型的 `nan`，以实现大幅加速。
numba	0.56.4	performance	用于接受 `engine="numba"` 的操作的替代执行引擎，使用 JIT 编译器将 Python 函数转换为优化的机器码，使用 LLVM 编译器实现大幅度优化。

可视化

使用 pip install "pandas[plot, output-formatting]" 进行安装。

依赖项	最低版本	pip extra	注释
matplotlib	3.6.3	plot	绘图库
Jinja2	3.1.2	output-formatting	使用 DataFrame.style 进行条件格式化
tabulate	0.9.0	output-formatting	以 Markdown 友好的格式打印（参见 tabulate）

计算

使用 pip install "pandas[computation]" 进行安装。

依赖项	最低版本	pip extra	注释
SciPy	1.10.0	computation	杂项统计函数
xarray	2022.12.0	computation	用于 N 维数据的类似 pandas API

Excel 文件

使用 pip install "pandas[excel]" 进行安装。

依赖项	最低版本	pip extra	注释
xlrd	2.0.1	excel	读取 Excel
xlsxwriter	3.0.5	excel	写入 Excel
openpyxl	3.1.0	excel	用于读取 / 写入 xlsx 文件
pyxlsb	1.0.10	excel	用于读取 xlsb 文件
python-calamine	0.1.7	excel	用于读取 xls/xlsx/xlsb/ods 文件

HTML

使用 pip install "pandas[html]" 进行安装。

依赖项	最低版本	pip extra	注释
BeautifulSoup4	4.11.2	html	用于 read_html 的 HTML 解析器
html5lib	1.1	html	用于 read_html 的 HTML 解析器
lxml	4.9.2	html	用于 read_html 的 HTML 解析器

若要使用顶层 read_html() 函数，需要以下其中一种组合的库：

BeautifulSoup4 和 html5lib
BeautifulSoup4 和 lxml
BeautifulSoup4 和 html5lib 和 lxml
只有 lxml，尽管参阅 HTML 表格解析可了解为什么您可能 不应该 采用这种方法。

警告

如果安装了 BeautifulSoup4，您必须安装 lxml 或 html5lib 或两者都安装。只安装 BeautifulSoup4 将不会使 read_html() 正常工作。
强烈建议阅读 HTML 表格解析注意事项。它解释了关于上述三个库的安装和使用的问题。

XML

可通过 pip install "pandas[xml]" 进行安装。

依赖	最低版本	pip extra	注释
lxml	4.9.2	xml	用于 read_xml 的 XML 解析器，用于 to_xml 的树构建器

SQL 数据库

传统驱动程序可通过 pip install "pandas[postgresql, mysql, sql-other]" 进行安装。

依赖	最低版本	pip extra	注释
SQLAlchemy	2.0.0	postgresql, mysql, sql-other	除 sqlite 外的数据库的 SQL 支持
psycopg2	2.9.6	postgresql	SQLAlchemy 的 PostgreSQL 引擎
pymysql	1.0.2	mysql	SQLAlchemy 的 MySQL 引擎
adbc-driver-postgresql	0.8.0	postgresql	用于 PostgreSQL 的 ADBC 驱动程序
adbc-driver-sqlite	0.8.0	sql-other	用于 SQLite 的 ADBC 驱动程序

其他数据源

可通过 pip install "pandas[hdf5, parquet, feather, spss, excel]" 进行安装。

依赖	最低版本	pip extra	注释
PyTables	3.8.0	hdf5	基于 HDF5 的读取/写入
blosc	1.21.3	hdf5	HDF5 的压缩；仅在 `conda` 上可用
zlib		hdf5	HDF5 的压缩
fastparquet	2022.12.0		Parquet 的读取/写入（pyarrow 是默认值）
pyarrow	10.0.1	parquet, feather	Parquet、ORC 和 feather 的读取/写入
pyreadstat	1.2.0	spss	SPSS 文件（.sav）的读取
odfpy	1.4.1	excel	Open document format (.odf, .ods, .odt) 读取/写入

警告

如果您想使用 read_orc()，强烈建议使用 conda 安装 pyarrow。如果从 pypi 安装了 pyarrow，read_orc() 可能会失败，并且 read_orc() 不兼容 Windows 操作系统。

访问云中的数据

可通过 pip install "pandas[fss, aws, gcp]" 进行安装。

依赖	最低版本	pip extra	注释
fsspec	2022.11.0	fss, gcp, aws	处理除简单本地和 HTTP 之外的文件（s3fs、gcsfs 的必需依赖）。
gcsfs	2022.11.0	gcp	谷歌云存储访问
pandas-gbq	0.19.0	gcp	谷歌 Big Query 访问
s3fs	2022.11.0	aws	亚马逊 S3 访问

剪贴板

可通过 pip install "pandas[clipboard]" 进行安装。

依赖	最低版本	pip 额外	注释
PyQt4/PyQt5	5.15.9	clipboard	剪贴板 I/O
qtpy	2.3.0	clipboard	剪贴板 I/O

注意

根据操作系统的不同，可能需要安装系统级软件包。在 Linux 上，剪贴板要正常运行，系统必须安装 xclip 或 xsel 中的一个 CLI 工具。

压缩

可通过 pip install "pandas[compression]" 进行安装。

依赖	最低版本	pip 额外	注释
Zstandard	0.19.0	compression	Zstandard 压缩

联盟标准

可通过 pip install "pandas[consortium-standard]" 进行安装。

依赖	最低版本	pip 额外	注释

pandas 需要以下依赖。

包	最低支持版本
NumPy	1.22.4
python-dateutil	2.8.2
pytz	2020.1
tzdata	2022.7

可选依赖

pandas 有许多仅用于特定方法的可选依赖。例如，pandas.read_hdf() 需要 pytables 包，而 DataFrame.to_markdown() 需要 tabulate 包。如果未安装可选依赖，当调用需要该依赖的方法时，pandas 将引发 ImportError。

如果使用 pip，可选的 pandas 依赖可以作为可选额外项（例如 pandas[performance, aws]）安装或管理在文件中（例如 requirements.txt 或 pyproject.toml），所有可选依赖可以通过 pandas[all] 进行安装，特定的依赖集在下面的部分中列出。

Pandas 2.2 中文官方教程和指南（一）（2）https://developer.aliyun.com/article/1510593

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Pandas 2.2 中文官方教程和指南（一）（1）

安装

Python 版本支持

安装 pandas

使用 Anaconda 安装

处理 ImportError

从源代码安装

运行测试套件

依赖项

必需的依赖项

性能依赖项（推荐）

可视化

计算

Excel 文件

HTML

XML

SQL 数据库

其他数据源

访问云端数据

剪贴板

压缩

联盟标准

安装 pandas

使用 Anaconda 安装

处理 ImportErrors

从源代码安装

从 PyPI 安装

处理 ImportErrors

从源代码安装

安装 pandas 的开发版本

运行测试套件

依赖关系

必需依赖

性能依赖项（推荐）

可视化

计算

Excel 文件

HTML

XML

SQL 数据库

其他数据源

访问云中的数据

剪贴板

压缩

联盟标准

可选依赖

热门文章

最新文章

相关课程

相关电子书