Python 教程之 Pandas(2)—— 创建 Pandas 数据框

简介: Python 教程之 Pandas(2)—— 创建 Pandas 数据框

在现实世界中,将通过从现有存储中加载数据集来创建 Pandas DataFrame,存储可以是 SQL 数据库、CSV 文件和 Excel 文件。Pandas DataFrame 可以从列表、字典和字典列表等中创建。

Dataframe 是一种二维数据结构,即数据在行和列中以表格方式对齐。在按行和列排列的数据帧数据集中,我们可以在数据帧中存储任意数量的数据集。我们可以对这些数据集执行许多操作,例如算术运算、列/行选择、列/行加法等。

Pandas DataFrame 可以通过多种方式创建。让我们一一讨论创建DataFrame的不同方法。

创建空数据 

框:可以创建的基本数据框是空数据框。只需调用数据框构造函数即可创建空数据框。

# import pandas as pd
import pandas as pd
# 调用 DataFrame 构造函数
df = pd.DataFrame()
print(df)

输出 : 

Empty DataFrame
Columns: []
Index: []

使用 List 创建数据框:

可以使用单个列表或列表列表创建数据框。

# import pandas as pd
import pandas as pd
# 字符串列表
lst = ['Geeks', 'For', 'Geeks', 'is',
      'portal', 'for', 'Geeks']
# 在列表中调用 DataFrame 构造函数
df = pd.DataFrame(lst)
print(df)

输出: 

image.png

从 ndarray/lists 的 dict创建 DataFrame : 

要从 narray/list 的 dict 创建 DataFrame,所有的 narray 必须具有相同的长度。如果传递了索引,则长度索引应等于数组的长度。如果没有传递索引,则默认情况下,索引将是 range(n),其中 n 是数组长度。

# Python 代码演示了从 dict narray / lists 默认地址创建 DataFrame。
import pandas as pd
# 初始化列表的数据。
data = {'Name':['Tom', 'nick', 'krish', 'jack'], 'Age':[20, 21, 19, 18]}
# 创建数据框
df = pd.DataFrame(data)
# 打印输出。
print(df)

输出: 

image.png

使用字典从列表中创建熊猫数据框:  使用字典从列表中创建熊猫数据框可以通过不同的方式实现。我们可以使用 pandas.DataFrame 使用字典从列表中创建 pandas 数据框。通过 Pandas 中的这种方法,我们可以将列表字典转换为数据框。

# importing pandas as pd
import pandas as pd
# 列表字典
dict = {'name':["aparna", "pankaj", "sudhir", "Geeku"],
    'degree': ["MBA", "BCA", "M.Tech", "MBA"],
    'score':[90, 40, 80, 98]}
df = pd.DataFrame(dict)
print(df)

输出: 

image.png

目录
相关文章
|
3天前
|
数据可视化 DataX Python
Seaborn 教程-绘图函数
Seaborn 教程-绘图函数
30 8
|
3天前
Seaborn 教程-主题(Theme)
Seaborn 教程-主题(Theme)
21 7
|
3天前
|
Python
Seaborn 教程-模板(Context)
Seaborn 教程-模板(Context)
22 4
|
3天前
|
数据可视化 Python
Seaborn 教程
Seaborn 教程
20 5
|
26天前
|
Python
SciPy 教程 之 Scipy 显著性检验 9
SciPy 教程之 Scipy 显著性检验第9部分,介绍了显著性检验的基本概念、作用及原理,通过样本信息判断假设是否成立。着重讲解了使用scipy.stats模块进行显著性检验的方法,包括正态性检验中的偏度和峰度计算,以及如何利用normaltest()函数评估数据是否符合正态分布。示例代码展示了如何计算一组随机数的偏度和峰度。
24 1
|
26天前
|
BI Python
SciPy 教程 之 Scipy 显著性检验 8
本教程介绍SciPy中显著性检验的应用,包括如何利用scipy.stats模块进行显著性检验,以判断样本与总体假设间的差异是否显著。通过示例代码展示了如何使用describe()函数获取数组的统计描述信息,如观测次数、最小最大值、均值、方差等。
27 1
|
27天前
|
数据采集 数据可视化 数据处理
Python数据科学:Pandas库入门与实践
Python数据科学:Pandas库入门与实践
|
27天前
|
数据采集 数据可视化 数据挖掘
Python数据分析:Pandas库实战指南
Python数据分析:Pandas库实战指南
|
7月前
|
数据处理 Python
如何使用Python的Pandas库进行数据排序和排名
【4月更文挑战第22天】Pandas Python库提供数据排序和排名功能。使用`sort_values()`按列进行升序或降序排序,如`df.sort_values(by='A', ascending=False)`。`rank()`函数用于计算排名,如`df['A'].rank(ascending=False)`。多列操作可传入列名列表,如`df.sort_values(by=['A', 'B'], ascending=[True, False])`和分别对'A'、'B'列排名。
102 2
|
7月前
|
索引 Python
如何使用Python的Pandas库进行数据合并和拼接?
Pandas的`merge()`函数用于数据合并,如示例所示,根据'key'列对两个DataFrame执行内连接。`concat()`函数用于数据拼接,沿轴0(行)拼接两个DataFrame,并忽略原索引。
122 2