Pandas Series 和 DataFrame 常用属性详解及实例

简介: Pandas 是 Python 数据分析的重要工具,其核心数据结构 Series 和 DataFrame 广泛应用。本文详细介绍了这两种结构的常用属性,如 `index`、`values`、`dtype` 等,并通过具体示例帮助读者更好地理解和使用这些属性,提升数据分析效率。

Pandas Series 和 DataFrame 常用属性详解及实例

Pandas 是 Python 中用于数据分析和处理的强大库,其核心数据结构包括 Series 和 DataFrame。本文将详细介绍这两种数据结构的常用属性,并通过示例进行说明,帮助您更好地理解和使用 Pandas。

1. 什么是 Series 和 DataFrame?

  • Series:一维数组,能够存储任何类型的数据(整数、字符串、浮点数等)。每个元素都有一个标签(索引)。
  • DataFrame:二维表格型数据结构,每列可以是不同的值类型(数值、字符串等),每一列都是一个 Series。

2. Series 的常用属性

2.1 index

index 属性返回 Series 的索引。

import pandas as pd

# 创建一个 Series
data = [1, 2, 3, 4, 5]
series = pd.Series(data, index=['a', 'b', 'c', 'd', 'e'])
print(series.index)

输出:

Index(['a', 'b', 'c', 'd', 'e'], dtype='object')
2.2 values

values 属性返回 Series 的值作为 NumPy 数组。

print(series.values)

输出:

[1 2 3 4 5]
2.3 dtype

dtype 属性返回 Series 中元素的数据类型。

print(series.dtype)

输出:

int64
2.4 name

name 属性返回或设置 Series 的名称。

series.name = 'My Series'
print(series.name)

输出:

My Series
2.5 shape

shape 属性返回 Series 的形状,对于一维数组,它是一个元组 (n,),其中 n 是元素的数量。

print(series.shape)

输出:

(5,)

3. DataFrame 的常用属性

3.1 index

index 属性返回 DataFrame 的行索引。

data = {
   
    'Name': ['Alice', 'Bob', 'Charlie'],
    'Age': [25, 30, 35],
    'City': ['New York', 'Los Angeles', 'Chicago']
}
df = pd.DataFrame(data, index=['a', 'b', 'c'])
print(df.index)

输出:

Index(['a', 'b', 'c'], dtype='object')
3.2 columns

columns 属性返回 DataFrame 的列名。

print(df.columns)

输出:

Index(['Name', 'Age', 'City'], dtype='object')
3.3 dtypes

dtypes 属性返回 DataFrame 每列的数据类型。

print(df.dtypes)

输出:

Name     object
Age       int64
City    object
dtype: object
3.4 shape

shape 属性返回 DataFrame 的形状,形式为 (行数, 列数)。

print(df.shape)

输出:

(3, 3)
3.5 size

size 属性返回 DataFrame 中元素的总数。

print(df.size)

输出:

9
3.6 values

values 属性返回 DataFrame 的值作为 NumPy 数组。

print(df.values)

输出:

[['Alice' '25' 'New York']
 ['Bob' '30' 'Los Angeles']
 ['Charlie' '35' 'Chicago']]
3.7 T

T 属性返回 DataFrame 的转置。

print(df.T)

输出:

      a         b          c
Name  Alice     Bob        Charlie
Age   25        30         35
City  New York  Los Angeles Chicago
3.8 ndim

ndim 属性返回 DataFrame 的维度数。

print(df.ndim)

输出:

2
3.9 axes

axes 属性返回一个包含 DataFrame 行和列轴的列表。

print(df.axes)

输出:

[Index(['a', 'b', 'c'], dtype='object'), Index(['Name', 'Age', 'City'], dtype='object')]

4. 总结

通过以上示例,我们可以看到 Pandas 提供了多种有用的属性来获取 Series 和 DataFrame 的相关信息。这些属性可以帮助我们更方便地操作和理解数据。希望本文对您理解和使用 Pandas 的核心数据结构有所帮助!

如果您有任何问题或需要进一步的帮助,请随时留言讨论。祝您在数据分析的道路上越走越远!

欢迎点赞、关注、收藏、转发!!!

相关文章
|
7月前
|
存储 数据挖掘 数据处理
掌握Pandas核心数据结构:Series与DataFrame的四种创建方式
本文介绍了 Pandas 库中核心数据结构 Series 和 DataFrame 的四种创建方法,包括从列表、字典、标量和 NumPy 数组创建 Series,以及从字典、列表的列表、NumPy 数组和 Series 字典创建 DataFrame,通过示例详细说明了每种创建方式的具体应用。
415 67
|
7月前
|
存储 数据挖掘 索引
Pandas数据结构:Series与DataFrame
本文介绍了 Python 的 Pandas 库中两种主要数据结构 `Series` 和 ``DataFrame`,从基础概念入手,详细讲解了它们的创建、常见问题及解决方案,包括数据缺失处理、数据类型转换、重复数据删除、数据筛选、排序、聚合和合并等操作。同时,还提供了常见报错及解决方法,帮助读者更好地理解和使用 Pandas 进行数据分析。
493 10
|
8月前
|
数据采集 存储 数据挖掘
Python数据分析:Pandas库的高效数据处理技巧
【10月更文挑战第27天】在数据分析领域,Python的Pandas库因其强大的数据处理能力而备受青睐。本文介绍了Pandas在数据导入、清洗、转换、聚合、时间序列分析和数据合并等方面的高效技巧,帮助数据分析师快速处理复杂数据集,提高工作效率。
245 0
|
10月前
|
机器学习/深度学习 数据处理 Python
从NumPy到Pandas:轻松转换Python数值库与数据处理利器
从NumPy到Pandas:轻松转换Python数值库与数据处理利器
217 1
|
数据挖掘 Python
【Python】已解决:Python pandas读取Excel表格某些数值字段结果为NaN问题
【Python】已解决:Python pandas读取Excel表格某些数值字段结果为NaN问题
982 0
|
8月前
|
存储 数据挖掘 数据处理
Python数据分析:Pandas库的高效数据处理技巧
【10月更文挑战第26天】Python 是数据分析领域的热门语言,Pandas 库以其高效的数据处理功能成为数据科学家的利器。本文介绍 Pandas 在数据读取、筛选、分组、转换和合并等方面的高效技巧,并通过示例代码展示其实际应用。
164 2
|
9月前
|
机器学习/深度学习 并行计算 大数据
【Python篇】深入挖掘 Pandas:机器学习数据处理的高级技巧
【Python篇】深入挖掘 Pandas:机器学习数据处理的高级技巧
234 3
|
9月前
|
数据采集 数据挖掘 API
Python数据分析加速器:深度挖掘Pandas与NumPy的高级功能
在Python数据分析的世界里,Pandas和NumPy无疑是两颗璀璨的明星,它们为数据科学家和工程师提供了强大而灵活的工具集,用于处理、分析和探索数据。今天,我们将一起深入探索这两个库的高级功能,看看它们如何成为数据分析的加速器。
101 1
|
10月前
|
机器学习/深度学习 数据采集 监控
Pandas与Matplotlib:Python中的动态数据可视化
Pandas与Matplotlib:Python中的动态数据可视化
|
10月前
|
Python
Python:Pandas实现批量删除Excel中的sheet
Python:Pandas实现批量删除Excel中的sheet
353 0

热门文章

最新文章