在现实世界中,将通过从现有存储中加载数据集来创建 Pandas DataFrame,存储可以是 SQL 数据库、CSV 文件和 Excel 文件。Pandas DataFrame 可以从列表、字典和字典列表等中创建。
Dataframe 是一种二维数据结构,即数据在行和列中以表格方式对齐。在按行和列排列的数据帧数据集中,我们可以在数据帧中存储任意数量的数据集。我们可以对这些数据集执行许多操作,例如算术运算、列/行选择、列/行加法等。
Pandas DataFrame 可以通过多种方式创建。让我们一一讨论创建DataFrame的不同方法。
创建空数据
框:可以创建的基本数据框是空数据框。只需调用数据框构造函数即可创建空数据框。
# import pandas as pd import pandas as pd # 调用 DataFrame 构造函数 df = pd.DataFrame() print(df)
输出 :
Empty DataFrame Columns: [] Index: []
使用 List 创建数据框:
可以使用单个列表或列表列表创建数据框。
# import pandas as pd import pandas as pd # 字符串列表 lst = ['Geeks', 'For', 'Geeks', 'is', 'portal', 'for', 'Geeks'] # 在列表中调用 DataFrame 构造函数 df = pd.DataFrame(lst) print(df)
输出:
从 ndarray/lists 的 dict创建 DataFrame :
要从 narray/list 的 dict 创建 DataFrame,所有的 narray 必须具有相同的长度。如果传递了索引,则长度索引应等于数组的长度。如果没有传递索引,则默认情况下,索引将是 range(n),其中 n 是数组长度。
# Python 代码演示了从 dict narray / lists 默认地址创建 DataFrame。 import pandas as pd # 初始化列表的数据。 data = {'Name':['Tom', 'nick', 'krish', 'jack'], 'Age':[20, 21, 19, 18]} # 创建数据框 df = pd.DataFrame(data) # 打印输出。 print(df)
输出:
使用字典从列表中创建熊猫数据框: 使用字典从列表中创建熊猫数据框可以通过不同的方式实现。我们可以使用 pandas.DataFrame 使用字典从列表中创建 pandas 数据框。通过 Pandas 中的这种方法,我们可以将列表字典转换为数据框。
# importing pandas as pd import pandas as pd # 列表字典 dict = {'name':["aparna", "pankaj", "sudhir", "Geeku"], 'degree': ["MBA", "BCA", "M.Tech", "MBA"], 'score':[90, 40, 80, 98]} df = pd.DataFrame(dict) print(df)
输出: