Pandas 2.2 中文官方教程和指南(一)(1)

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云原生数据库 PolarDB MySQL 版,Serverless 5000PCU 100GB
RDS MySQL Serverless 高可用系列,价值2615元额度,1个月
简介: Pandas 2.2 中文官方教程和指南(一)

安装

原文:pandas.pydata.org/docs/getting_started/install.html

安装 pandas 的最简单方法是作为Anaconda发行版的一部分安装,这是一个用于数据分析和科学计算的跨平台发行版。Conda包管理器是大多数用户推荐的安装方法。

还提供了从源代码安装(#install-source)、从 PyPI 安装(#install-pypi)或安装开发版本(#install-dev)的说明。

Python 版本支持

官方支持 Python 3.9、3.10、3.11 和 3.12。

安装 pandas

使用 Anaconda 安装

对于新手用户,安装 Python、pandas 和构成PyData堆栈(SciPyNumPyMatplotlib等)的包的最简单方法是使用Anaconda,这是一个跨平台(Linux、macOS、Windows)的 Python 发行版,用于数据分析和科学计算。Anaconda 的安装说明在这里。 ### 使用 Miniconda 安装

对于有经验的 Python 用户,推荐使用Miniconda安装 pandas。Miniconda 允许您创建一个相对于 Anaconda 更小、独立的 Python 安装,并使用Conda包管理器安装其他包并为您的安装创建虚拟环境。Miniconda 的安装说明在这里

下一步是创建一个新的 conda 环境。conda 环境类似于一个允许您指定特定版本的 Python 和一组库的虚拟环境。从终端窗口运行以下命令。

conda  create  -c  conda-forge  -n  name_of_my_env  python  pandas 

这将创建一个仅安装了 Python 和 pandas 的最小环境。要进入这个环境,请运行。

source  activate  name_of_my_env
# On Windows
activate  name_of_my_env 
```### 从 PyPI 安装
可以通过 pip 从[PyPI](https://pypi.org/project/pandas)安装 pandas。
```py
pip  install  pandas 

注意

您必须拥有pip>=19.3才能从 PyPI 安装。

注意

建议从虚拟环境中安装和运行 pandas,例如,使用 Python 标准库的venv

pandas 也可以安装带有可选依赖项集以启用某些功能。例如,要安装带有读取 Excel 文件的可选依赖项的 pandas。

pip  install  "pandas[excel]" 

可以在依赖部分找到可以安装的全部额外功能列表。

处理 ImportError

如果遇到 ImportError,通常意味着 Python 在可用库列表中找不到 pandas。Python 内部有一个目录列表,用于查找软件包。您可以通过以下方式获取这些目录。

import sys
sys.path 

您可能遇到此错误的一种方法是,如果您的系统上安装了多个 Python,并且您当前使用的 Python 安装中没有安装 pandas,则可能会遇到此错误。在 Linux/Mac 上,您可以在终端上运行 which python,它将告诉您当前正在使用哪个 Python 安装。如果是类似“/usr/bin/python”的东西,则表示您正在使用系统中的 Python,这是不推荐的。

强烈建议使用 conda,以便快速安装和更新软件包和依赖项。您可以在此文档中找到有关 pandas 的简单安装说明。

从源代码安装

请参阅贡献指南以获取有关从 git 源代码树构建的完整说明。此外,如果您希望创建 pandas 开发环境,请参阅创建开发环境。 ### 安装 pandas 的开发版本

安装开发版本是最快的方法:

  • 尝试一个新功能,该功能将在下一个发布中发布(即,从最近合并到主分支的拉取请求中提取的功能)。
  • 检查您遇到的错误是否在上次发布之后修复。

开发版本通常每天上传到 anaconda.org 的 PyPI 注册表的 scientific-python-nightly-wheels 索引中。您可以通过运行以下命令进行安装。

pip  install  --pre  --extra-index  https://pypi.anaconda.org/scientific-python-nightly-wheels/simple  pandas 

请注意,您可能需要卸载现有版本的 pandas 才能安装开发版本。

pip  uninstall  pandas  -y 

运行测试套件

pandas 配备有一套详尽的单元测试。运行测试所需的软件包可以使用 pip install "pandas[test]" 进行安装。要从 Python 终端运行测试。

>>> import pandas as pd
>>> pd.test()
running: pytest -m "not slow and not network and not db" /home/user/anaconda3/lib/python3.9/site-packages/pandas
============================= test session starts ==============================
platform linux -- Python 3.9.7, pytest-6.2.5, py-1.11.0, pluggy-1.0.0
rootdir: /home/user
plugins: dash-1.19.0, anyio-3.5.0, hypothesis-6.29.3
collected 154975 items / 4 skipped / 154971 selected
........................................................................ [  0%]
........................................................................ [ 99%]
.......................................                                  [100%]
==================================== ERRORS ====================================
=================================== FAILURES ===================================
=============================== warnings summary ===============================
=========================== short test summary info ============================
= 1 failed, 146194 passed, 7402 skipped, 1367 xfailed, 5 xpassed, 197 warnings, 10 errors in 1090.16s (0:18:10) = 

注意

这只是显示的信息示例。测试失败并不一定表示 pandas 安装有问题。

依赖项

必需的依赖项

pandas 需要以下依赖项。

软件包 最低支持版本
NumPy 1.22.4
python-dateutil 2.8.2
pytz 2020.1

| tzdata | 2022.7 | ### 可选依赖项

pandas 有许多可选依赖项,仅用于特定方法。例如,pandas.read_hdf() 需要 pytables 包,而 DataFrame.to_markdown() 需要 tabulate 包。如果未安装可选依赖项,则在调用需要该依赖项的方法时,pandas 将引发 ImportError

如果使用 pip,可选的 pandas 依赖项可以作为可选额外项(例如 pandas[performance, aws])安装或在文件中管理(例如 requirements.txt 或 pyproject.toml)。所有可选依赖项都可以通过 pandas[all] 安装,特定的依赖项集在下面的各节中列出。

性能依赖项(推荐)

注意

鼓励您安装这些库,因为它们提供了速度改进,特别是在处理大型数据集时。

可通过 pip install "pandas[performance]" 进行安装。

依赖项 最低版本 pip 额外 注释
numexpr 2.8.4 性能 通过使用多个核心以及智能分块和缓存来加速某些数值运算
bottleneck 1.3.6 性能 通过使用专门的 cython 程序加速某些类型的 nan,从而实现大幅加速。
numba 0.56.4 性能 用��接受 engine="numba" 的操作的替代执行引擎,使用 JIT 编译器将 Python 函数转换为优化的机器代码,使用 LLVM 编译器实现大幅优化。
可视化

可通过 pip install "pandas[plot, output-formatting]" 进行安装。

依赖项 最低版本 pip 额外 注释
matplotlib 3.6.3 绘图 绘图库
Jinja2 3.1.2 输出格式化 与 DataFrame.style 一起使用的条件格式化
tabulate 0.9.0 输出格式化 以 Markdown 友好的格式打印(参见 tabulate
计算

可通过 pip install "pandas[computation]" 进行安装。

依赖项 最低版本 pip 额外 注释
SciPy 1.10.0 计算 各种统计函数
xarray 2022.12.0 计算 用于 N 维数据的类似于 pandas 的 API
Excel 文件

可通过 pip install "pandas[excel]" 进行安装。

依赖项 最低版本 pip 额外 注释
xlrd 2.0.1 excel 读取 Excel
xlsxwriter 3.0.5 excel 写入 Excel
openpyxl 3.1.0 excel 读取/写入 xlsx 文件
pyxlsb 1.0.10 excel 读取 xlsb 文件
python-calamine 0.1.7 excel 读取 xls/xlsx/xlsb/ods 文件
HTML

可通过 pip install "pandas[html]" 进行安装。

依赖 最低版本 pip 额外组件 注释
BeautifulSoup4 4.11.2 html 用于 read_html 的 HTML 解析器
html5lib 1.1 html 用于 read_html 的 HTML 解析器
lxml 4.9.2 html 用于 read_html 的 HTML 解析器

使用顶层 read_html() 函数,需要以下库组合之一:

警告

  • 如果你安装了 BeautifulSoup4,你必须安装 lxml 或者 html5lib,或者两者都安装。只有安装了 BeautifulSoup4read_html() 才会 起作用。
  • 强烈建议阅读 HTML 表解析陷阱。它解释了上述三个库的安装和使用相关问题。
XML

通过 pip install "pandas[xml]" 安装。

依赖 最低版本 pip 额外组件 注释
lxml 4.9.2 xml read_xml 的 XML 解析器和 to_xml 的树生成器
SQL 数据库

传统驱动可以通过 pip install "pandas[postgresql, mysql, sql-other]" 安装。

依赖 最低版本 pip 额外组件 注释
SQLAlchemy 2.0.0 postgresql, mysql, sql-other 除 sqlite 外其他数据库的 SQL 支持
psycopg2 2.9.6 postgresql 用于 sqlalchemy 的 PostgreSQL 引擎
pymysql 1.0.2 mysql 用于 sqlalchemy 的 MySQL 引擎
adbc-driver-postgresql 0.8.0 postgresql PostgreSQL 的 ADBC 驱动程序
adbc-driver-sqlite 0.8.0 sql-other SQLite 的 ADBC 驱动程序
其他数据源

通过 pip install "pandas[hdf5, parquet, feather, spss, excel]" 安装。

依赖 最低版本 pip 额外组件 注释
PyTables 3.8.0 hdf5 基于 HDF5 的读取 / 写入
blosc 1.21.3 hdf5 HDF5 压缩;仅适用于 conda
zlib hdf5 HDF5 压缩
fastparquet 2022.12.0 Parquet 读取 / 写入(pyarrow 是默认)
pyarrow 10.0.1 parquet, feather Parquet、ORC 和 feather 读取 / 写入
pyreadstat 1.2.0 spss SPSS 文件(.sav)读取
odfpy 1.4.1 excel Open document format (.odf, .ods, .odt) 读取 / 写入

警告

  • 如果你想使用 read_orc(),强烈建议使用 conda 安装 pyarrow。如果 pyarrow 是从 pypi 安装的,可能会导致 read_orc() 失败,并且 read_orc() 与 Windows 操作系统不兼容。
访问云端数据

使用 pip install "pandas[fss, aws, gcp]" 可安装。

依赖 最低版本 pip 额外 注释
fsspec 2022.11.0 fss, gcp, aws 处理除简单本地和 HTTP 外的文件(s3fs、gcsfs 的必需依赖)。
gcsfs 2022.11.0 gcp 谷歌云存储访问
pandas-gbq 0.19.0 gcp 谷歌大数据查询访问
s3fs 2022.11.0 aws 亚马逊 S3 访问
剪贴板

使用 pip install "pandas[clipboard]" 可安装。

依赖 最低版本 pip 额外 注释
PyQt4/PyQt5 5.15.9 clipboard 剪贴板 I/O
qtpy 2.3.0 clipboard 剪贴板 I/O

注意

根据操作系统的不同,可能需要安装系统级软件包。在 Linux 上,要使剪贴板正常工作,必须安装其中一个命令行工具 xclipxsel

压缩

使用 pip install "pandas[compression]" 可安装。

依赖 最低版本 pip 额外 注释
Zstandard 0.19.0 compression Zstandard 压缩
联盟标准

使用 pip install "pandas[consortium-standard]" 可安装。

依赖 最低版本 pip 额外 注释

| dataframe-api-compat | 0.1.7 | consortium-standard | 基于 pandas 的联盟标准兼容实现 | ## Python 版本支持

官方支持 Python 3.9、3.10、3.11 和 3.12。

安装 pandas

使用 Anaconda 安装

对于新手用户,安装 Python、pandas 以及构成 PyData 栈(SciPyNumPyMatplotlib 等)的软件包最简单的方法是使用 Anaconda,这是一个跨平台(Linux、macOS、Windows)的数据分析和科学计算 Python 发行版。Anaconda 的安装说明 可在此找到。 ### 使用 Miniconda 安装

对于有 Python 经验的用户,推荐使用Miniconda安装 pandas。Miniconda 允许您创建一个最小的、独立的 Python 安装,与 Anaconda 相比,并使用Conda包管理器安装其他包并为您的安装创建虚拟环境。有关 Miniconda 的安装说明可以在这里找到

下一步是创建一个新的 conda 环境。conda 环境类似于一个允许您指定特定 Python 版本和一组库的虚拟环境。从终端窗口运行以下命令。

conda  create  -c  conda-forge  -n  name_of_my_env  python  pandas 

这将创建一个只安装了 Python 和 pandas 的最小环境。要进入此环境,请运行。

source  activate  name_of_my_env
# On Windows
activate  name_of_my_env 
```### 从 PyPI 安装
可以通过 pip 从[PyPI](https://pypi.org/project/pandas)安装 pandas。
```py
pip  install  pandas 

注意

您必须拥有pip>=19.3才能从 PyPI 安装。

注意

建议安装并从虚拟环境中运行 pandas,例如,使用 Python 标准库的venv

pandas 也可以安装一组可选依赖项,以启用某些功能。例如,要安装带有可选依赖项以读取 Excel 文件的 pandas。

pip  install  "pandas[excel]" 

可以在依赖部分找到可以安装的全部额外内容列表。

处理 ImportErrors

如果遇到ImportError,通常意味着 Python 在可用库列表中找不到 pandas。Python 内部有一个目录列表,用于查找包。您可以通过以下方式获取这些目录。

import sys
sys.path 

您可能遇到此错误的一种方式是,如果您的系统上有多个 Python 安装,并且您当前使用的 Python 安装中没有安装 pandas。在 Linux/Mac 上,您可以在终端上运行which python,它会告诉您正在使用哪个 Python 安装。如果类似于“/usr/bin/python”,则您正在使用系统中的 Python,这是不推荐的。

强烈建议使用conda进行快速安装和包和依赖项更新。您可以在此文档中找到有关 pandas 的简单安装说明。

从源代码安装

请查看贡献指南以获取有关从 git 源代码树构建的完整说明。此外,如果您希望创建 pandas 开发环境,请查看创建开发环境。 ### 安装 pandas 的开发版本

安装开发版本是最快的方法:

  • 尝试一个将在下一个发布中提供的新功能(即,最近合并到主分支的拉取请求中的功能)。
  • 检查您遇到的错误是否在上一个版本中已修复。

开发版本通常每天上传到 anaconda.org 的 PyPI 注册表的 scientific-python-nightly-wheels 索引中。您可以通过运行来安装它。

pip  install  --pre  --extra-index  https://pypi.anaconda.org/scientific-python-nightly-wheels/simple  pandas 

请注意,您可能需要卸载现有版本的 pandas 才能安装开发版本。

pip  uninstall  pandas  -y 
```### 使用 Anaconda 安装
对于新手用户,安装 Python、pandas 和构成[PyData](https://pydata.org/)堆栈([SciPy](https://scipy.org/)、[NumPy](https://numpy.org/)、[Matplotlib](https://matplotlib.org/)等)的包最简单的方法是使用[Anaconda](https://docs.continuum.io/free/anaconda/),这是一个跨平台(Linux、macOS、Windows)的用于数据分析和科学计算的 Python 发行版。有关 Anaconda 的安装说明[请参见此处](https://docs.continuum.io/free/anaconda/install/)。
### 使用 Miniconda 安装
对于有 Python 经验的用户,推荐使用[Miniconda](https://docs.conda.io/en/latest/miniconda.html)安装 pandas。Miniconda 允许您创建一个最小、独立的 Python 安装,与 Anaconda 相比,使用[Conda](https://conda.io/en/latest/)包管理器安装额外的包并为您的安装创建虚拟环境。有关 Miniconda 的安装说明[请参见此处](https://docs.conda.io/en/latest/miniconda.html)。
下一步是创建一个新的 conda 环境。conda 环境类似于一个允许您指定特定 Python 版本和一组库的虚拟环境。从终端窗口运行以下命令。
```py
conda  create  -c  conda-forge  -n  name_of_my_env  python  pandas 

这将创建一个只安装了 Python 和 pandas 的最小环境。要进入此环境,请运行。

source  activate  name_of_my_env
# On Windows
activate  name_of_my_env 

从 PyPI 安装

可以通过pip从 PyPI 安装 pandas。

pip  install  pandas 

注意

您必须拥有pip>=19.3才能从 PyPI 安装。

注意

建议在虚拟环境中安装和运行 pandas,例如,使用 Python 标准库的venv

pandas 也可以安装带有可选依赖项集合以启用某些功能。例如,要安装带有可选依赖项以读取 Excel 文件的 pandas。

pip  install  "pandas[excel]" 

可以在依赖部分找到可以安装的全部额外功能列表。

处理 ImportErrors

如果遇到ImportError,通常意味着 Python 在可用库列表中找不到 pandas。Python 内部有一个目录列表,用于查找包。您可以通过以下方式获取这些目录。

import sys
sys.path 

您可能遇到此错误的一种方式是,如果您的系统上有多个 Python 安装,并且您当前使用的 Python 安装中没有安装 pandas。在 Linux/Mac 上,您可以在终端上运行which python,它会告诉您当前使用的 Python 安装。如果显示类似“/usr/bin/python”的内容,则表示您正在使用系统中的 Python,这是不推荐的。

强烈建议使用conda,以快速安装和更新包和依赖项。您可以在此文档中找到 pandas 的简单安装说明。

从源代码安装

查看贡献指南以获取有关从 git 源代码树构建的完整说明。此外,如果您希望创建一个 pandas 开发环境,请查看创建开发环境。

安装 pandas 的开发版本

安装开发版本是最快的方式:

  • 尝试一个将在下一个版本中发布的新功能(即,最近合并到主分支的拉取请求中的功能)。
  • 检查您遇到的错误是否自上次发布以来已修复。

开发版本通常每天上传到 anaconda.org 的 PyPI 注册表的 scientific-python-nightly-wheels 索引中。您可以通过运行以下命令来安装。

pip  install  --pre  --extra-index  https://pypi.anaconda.org/scientific-python-nightly-wheels/simple  pandas 

请注意,您可能需要卸载现有版本的 pandas 才能安装开发版本。

pip  uninstall  pandas  -y 

运行测试套件

pandas 配备了一套详尽的单元测试。运行测试所需的包可以通过pip install "pandas[test]"安装。要从 Python 终端运行测试。

>>> import pandas as pd
>>> pd.test()
running: pytest -m "not slow and not network and not db" /home/user/anaconda3/lib/python3.9/site-packages/pandas
============================= test session starts ==============================
platform linux -- Python 3.9.7, pytest-6.2.5, py-1.11.0, pluggy-1.0.0
rootdir: /home/user
plugins: dash-1.19.0, anyio-3.5.0, hypothesis-6.29.3
collected 154975 items / 4 skipped / 154971 selected
........................................................................ [  0%]
........................................................................ [ 99%]
.......................................                                  [100%]
==================================== ERRORS ====================================
=================================== FAILURES ===================================
=============================== warnings summary ===============================
=========================== short test summary info ============================
= 1 failed, 146194 passed, 7402 skipped, 1367 xfailed, 5 xpassed, 197 warnings, 10 errors in 1090.16s (0:18:10) = 

注意

这只是显示的信息示例。测试失败并不一定表示 pandas 安装有问题。

依赖关系

必需依赖

pandas 需要以下依赖项。

最低支持版本
NumPy 1.22.4
python-dateutil 2.8.2
pytz 2020.1

| tzdata | 2022.7 | ### 可选依赖

pandas 有许多可选依赖项,仅用于特定方法。例如,pandas.read_hdf()需要pytables包,而DataFrame.to_markdown()需要tabulate包。如果未安装可选依赖项,则在调用需要该依赖项的方法时,pandas 将引发ImportError

如果使用 pip,可以将可选的 pandas 依赖项安装或管理到文件中(例如 requirements.txt 或 pyproject.toml),作为可选的额外功能(例如 pandas[performance, aws])。所有可选依赖项均可使用 pandas[all] 安装,具体的依赖项集合列在下面的各个部分中。

性能依赖项(推荐)

注意

强烈建议您安装这些库,因为它们提供了速度改进,特别是在处理大数据集时。

使用 pip install "pandas[performance]" 进行安装

依赖项 最低版本 pip extra 注释
numexpr 2.8.4 performance 通过使用多个核心以及智能分块和缓存来加速某些数值运算。
bottleneck 1.3.6 performance 通过使用专门的 cython 程序加速某些类型的 nan,以实现大幅加速。
numba 0.56.4 performance 用于接受 engine="numba" 的操作的替代执行引擎,使用 JIT 编译器将 Python 函数转换为优化的机器码,使用 LLVM 编译器实现大幅度优化。
可视化

使用 pip install "pandas[plot, output-formatting]" 进行安装。

依赖项 最低版本 pip extra 注释
matplotlib 3.6.3 plot 绘图库
Jinja2 3.1.2 output-formatting 使用 DataFrame.style 进行条件格式化
tabulate 0.9.0 output-formatting 以 Markdown 友好的格式打印(参见 tabulate
计算

使用 pip install "pandas[computation]" 进行安装。

依赖项 最低版本 pip extra 注释
SciPy 1.10.0 computation 杂项统计函数
xarray 2022.12.0 computation 用于 N 维数据的类似 pandas API
Excel 文件

使用 pip install "pandas[excel]" 进行安装。

依赖项 最低版本 pip extra 注释
xlrd 2.0.1 excel 读取 Excel
xlsxwriter 3.0.5 excel 写入 Excel
openpyxl 3.1.0 excel 用于读取 / 写入 xlsx 文件
pyxlsb 1.0.10 excel 用于读取 xlsb 文件
python-calamine 0.1.7 excel 用于读取 xls/xlsx/xlsb/ods 文件
HTML

使用 pip install "pandas[html]" 进行安装。

依赖项 最低版本 pip extra 注释
BeautifulSoup4 4.11.2 html 用于 read_html 的 HTML 解析器
html5lib 1.1 html 用于 read_html 的 HTML 解析器
lxml 4.9.2 html 用于 read_html 的 HTML 解析器

若要使用顶层 read_html() 函数,需要以下其中一种组合的库:

警告

  • 如果安装了 BeautifulSoup4,您必须安装 lxmlhtml5lib 或两者都安装。只安装 BeautifulSoup4不会 使 read_html() 正常工作。
  • 强烈建议阅读 HTML 表格解析注意事项。它解释了关于上述三个库的安装和使用的问题。
XML

可通过 pip install "pandas[xml]" 进行安装。

依赖 最低版本 pip extra 注释
lxml 4.9.2 xml 用于 read_xml 的 XML 解析器,用于 to_xml 的树构建器
SQL 数据库

传统驱动程序可通过 pip install "pandas[postgresql, mysql, sql-other]" 进行安装。

依赖 最低版本 pip extra 注释
SQLAlchemy 2.0.0 postgresql, mysql, sql-other 除 sqlite 外的数据库的 SQL 支持
psycopg2 2.9.6 postgresql SQLAlchemy 的 PostgreSQL 引擎
pymysql 1.0.2 mysql SQLAlchemy 的 MySQL 引擎
adbc-driver-postgresql 0.8.0 postgresql 用于 PostgreSQL 的 ADBC 驱动程序
adbc-driver-sqlite 0.8.0 sql-other 用于 SQLite 的 ADBC 驱动程序
其他数据源

可通过 pip install "pandas[hdf5, parquet, feather, spss, excel]" 进行安装。

依赖 最低版本 pip extra 注释
PyTables 3.8.0 hdf5 基于 HDF5 的读取/写入
blosc 1.21.3 hdf5 HDF5 的压缩;仅在 conda 上可用
zlib hdf5 HDF5 的压缩
fastparquet 2022.12.0 Parquet 的读取/写入(pyarrow 是默认值)
pyarrow 10.0.1 parquet, feather Parquet、ORC 和 feather 的读取/写入
pyreadstat 1.2.0 spss SPSS 文件(.sav)的读取
odfpy 1.4.1 excel Open document format (.odf, .ods, .odt) 读取/写入

警告

  • 如果您想使用 read_orc(),强烈建议使用 conda 安装 pyarrow。如果从 pypi 安装了 pyarrow,read_orc() 可能会失败,并且 read_orc() 不兼容 Windows 操作系统。
访问云中的数据

可通过 pip install "pandas[fss, aws, gcp]" 进行安装。

依赖 最低版本 pip extra 注释
fsspec 2022.11.0 fss, gcp, aws 处理除简单本地和 HTTP 之外的文件(s3fs、gcsfs 的必需依赖)。
gcsfs 2022.11.0 gcp 谷歌云存储访问
pandas-gbq 0.19.0 gcp 谷歌 Big Query 访问
s3fs 2022.11.0 aws 亚马逊 S3 访问
剪贴板

可通过 pip install "pandas[clipboard]" 进行安装。

依赖 最低版本 pip 额外 注释
PyQt4/PyQt5 5.15.9 clipboard 剪贴板 I/O
qtpy 2.3.0 clipboard 剪贴板 I/O

注意

根据操作系统的不同,可能需要安装系统级软件包。在 Linux 上,剪贴板要正常运行,系统必须安装 xclipxsel 中的一个 CLI 工具。

压缩

可通过 pip install "pandas[compression]" 进行安装。

依赖 最低版本 pip 额外 注释
Zstandard 0.19.0 compression Zstandard 压缩
联盟标准

可通过 pip install "pandas[consortium-standard]" 进行安装。

依赖 最低版本 pip 额外 注释

| dataframe-api-compat | 0.1.7 | consortium-standard | 基于 pandas 的联盟标准兼容实现 | ### 必需依赖

pandas 需要以下依赖。

最低支持版本
NumPy 1.22.4
python-dateutil 2.8.2
pytz 2020.1
tzdata 2022.7

可选依赖

pandas 有许多仅用于特定方法的可选依赖。例如,pandas.read_hdf() 需要 pytables 包,而 DataFrame.to_markdown() 需要 tabulate 包。如果未安装可选依赖,当调用需要该依赖的方法时,pandas 将引发 ImportError

如果使用 pip,可选的 pandas 依赖可以作为可选额外项(例如 pandas[performance, aws])安装或管理在文件中(例如 requirements.txt 或 pyproject.toml),所有可选依赖可以通过 pandas[all] 进行安装,特定的依赖集在下面的部分中列出。


Pandas 2.2 中文官方教程和指南(一)(2)https://developer.aliyun.com/article/1510593

相关实践学习
基于CentOS快速搭建LAMP环境
本教程介绍如何搭建LAMP环境,其中LAMP分别代表Linux、Apache、MySQL和PHP。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
11天前
|
数据采集 存储 数据可视化
Pandas高级教程:数据清洗、转换与分析
Pandas是Python的数据分析库,提供Series和DataFrame数据结构及数据分析工具,便于数据清洗、转换和分析。本教程涵盖Pandas在数据清洗(如缺失值、重复值和异常值处理)、转换(数据类型转换和重塑)和分析(如描述性统计、分组聚合和可视化)的应用。通过学习Pandas,用户能更高效地处理和理解数据,为数据分析任务打下基础。
32 3
|
1月前
|
索引 Python
Pandas 2.2 中文官方教程和指南(一)(4)
Pandas 2.2 中文官方教程和指南(一)
26 0
|
1月前
|
存储 SQL JSON
Pandas 2.2 中文官方教程和指南(一)(3)
Pandas 2.2 中文官方教程和指南(一)
30 0
|
1月前
|
XML 关系型数据库 PostgreSQL
Pandas 2.2 中文官方教程和指南(一)(2)
Pandas 2.2 中文官方教程和指南(一)
35 0
|
1月前
|
C++ 索引 Python
Pandas 2.2 中文官方教程和指南(五)(4)
Pandas 2.2 中文官方教程和指南(五)
22 0
|
1月前
|
索引 Python
Pandas 2.2 中文官方教程和指南(五)(3)
Pandas 2.2 中文官方教程和指南(五)
23 0
|
1月前
|
SQL API 数据格式
Pandas 2.2 中文官方教程和指南(五)(2)
Pandas 2.2 中文官方教程和指南(五)
23 0
|
1月前
|
SQL API 数据格式
Pandas 2.2 中文官方教程和指南(五)(1)
Pandas 2.2 中文官方教程和指南(五)
31 0
|
1月前
|
索引 Python
Pandas 2.2 中文官方教程和指南(四)(4)
Pandas 2.2 中文官方教程和指南(四)
19 0
|
1月前
|
索引 Python
Pandas 2.2 中文官方教程和指南(四)(3)
Pandas 2.2 中文官方教程和指南(四)
23 0