Pandas之DataFrame

简介: 笔记
import pandas as pd;
'''
总结:pd.DataFrame()可以放一个列表或者放一个嵌套列表(里面可以是列表也可以是元祖),也可以是个元祖,但不可不可放一个嵌套元祖
'''
# 创建一个DataFrame
# 传入一个列表
df1 = pd.DataFrame(['a','b','c','d'])
print(df1)
# 传入一个嵌套列表
print('................')
df2 =pd.DataFrame([['a','A'],['b','B'],['c','C'],['e','E']]) #或者df2 =pd.DataFrame([('a','A'),('b','B'),('c','C'),('e','E')])
print(df2)
# 指定行,列索引
# 设置列索引
print('................')
df3 =pd.DataFrame([['a','A'],['b','B'],['c','C'],['e','E']],columns=['小写','大写'])
print(df3)
# 设置行索引
print('................')
df3 =pd.DataFrame([['a','A'],['b','B'],['c','C'],['e','E']],index=['一','二','三','四'])
print(df3)
# 行列索引同时设置
print('................')
df4 =pd.DataFrame([['a','A'],['b','B'],['c','C'],['e','E']],columns=['小写','大写'],index=['一','二','三','四'])
print(df4)
# 传入一个字典
print('................')
data = {'小写':('a','b','c','d'),'大写':['A','B','C','D']}  #或者data = {'小写':('a','b','c','d'),'大写':('A','B','C','D')}
df5 =pd.DataFrame(data,index=['一','二','三','四'])
print(df5)
# 获取DataFrame的行,列索引
print(df3.columns)
print(df4.index)
# 传入一个元祖
print(pd.DataFrame((1,2,3,4)))
print('................')
# 传入一个集合
print(pd.DataFrame({1,2,3,4}))

输出如下结果:

   0
0  a
1  b
2  c
3  d
................
   0  1
0  a  A
1  b  B
2  c  C
3  e  E
................
  小写 大写
0  a  A
1  b  B
2  c  C
3  e  E
................
   0  1
一  a  A
二  b  B
三  c  C
四  e  E
................
  小写 大写
一  a  A
二  b  B
三  c  C
四  e  E
................
  小写 大写
一  a  A
二  b  B
三  c  C
四  d  D
RangeIndex(start=0, stop=2, step=1)
Index(['一', '二', '三', '四'], dtype='object')
   0
0  1
1  2
2  3
3  4
................
   0
0  1
1  2
2  3
3  4
相关文章
|
6月前
|
Java 数据处理 索引
(Pandas)Python做数据处理必选框架之一!(二):附带案例分析;刨析DataFrame结构和其属性;学会访问具体元素;判断元素是否存在;元素求和、求标准值、方差、去重、删除、排序...
DataFrame结构 每一列都属于Series类型,不同列之间数据类型可以不一样,但同一列的值类型必须一致。 DataFrame拥有一个总的 idx记录列,该列记录了每一行的索引 在DataFrame中,若列之间的元素个数不匹配,且使用Series填充时,在DataFrame里空值会显示为NaN;当列之间元素个数不匹配,并且不使用Series填充,会报错。在指定了index 属性显示情况下,会按照index的位置进行排序,默认是 [0,1,2,3,...] 从0索引开始正序排序行。
450 0
|
SQL 索引 Python
Pandas中DataFrame合并的几种方法
Pandas中DataFrame合并的几种方法
2434 1
|
存储 数据挖掘 数据处理
掌握Pandas核心数据结构:Series与DataFrame的四种创建方式
本文介绍了 Pandas 库中核心数据结构 Series 和 DataFrame 的四种创建方法,包括从列表、字典、标量和 NumPy 数组创建 Series,以及从字典、列表的列表、NumPy 数组和 Series 字典创建 DataFrame,通过示例详细说明了每种创建方式的具体应用。
1130 67
|
存储 数据挖掘 索引
Pandas数据结构:Series与DataFrame
本文介绍了 Python 的 Pandas 库中两种主要数据结构 `Series` 和 ``DataFrame`,从基础概念入手,详细讲解了它们的创建、常见问题及解决方案,包括数据缺失处理、数据类型转换、重复数据删除、数据筛选、排序、聚合和合并等操作。同时,还提供了常见报错及解决方法,帮助读者更好地理解和使用 Pandas 进行数据分析。
997 11
|
SQL 数据采集 数据可视化
Pandas 数据结构 - DataFrame
10月更文挑战第26天
872 2
Pandas 数据结构 - DataFrame
|
存储 数据挖掘 索引
Pandas Series 和 DataFrame 常用属性详解及实例
Pandas 是 Python 数据分析的重要工具,其核心数据结构 Series 和 DataFrame 广泛应用。本文详细介绍了这两种结构的常用属性,如 `index`、`values`、`dtype` 等,并通过具体示例帮助读者更好地理解和使用这些属性,提升数据分析效率。
845 4
|
索引 Python
Pandas学习笔记之Dataframe
Pandas学习笔记之Dataframe
2085 2
|
数据挖掘 大数据 数据处理
数据分析师的秘密武器:精通Pandas DataFrame合并与连接技巧
【8月更文挑战第22天】在数据分析中,Pandas库的DataFrame提供高效的数据合并与连接功能。本文通过实例展示如何按员工ID合并基本信息与薪资信息,并介绍如何基于多列(如员工ID与部门ID)进行更复杂的连接操作。通过调整`merge`函数的`how`参数(如'inner'、'outer'等),可实现不同类型的连接。此外,还介绍了使用`join`方法根据索引快速连接数据,这对于处理大数据集尤其有用。掌握这些技巧能显著提升数据分析的能力。
434 1
【Pandas+Python】初始化一个全零的Dataframe
初始化一个100*3的0矩阵,变为Dataframe类型,并为每列赋值一个属性。
355 2
|
数据采集 机器学习/深度学习 数据可视化
了解数据科学面试中的Python数据分析重点,包括Pandas(DataFrame)、NumPy(ndarray)和Matplotlib(图表绘制)。
【7月更文挑战第5天】了解数据科学面试中的Python数据分析重点,包括Pandas(DataFrame)、NumPy(ndarray)和Matplotlib(图表绘制)。数据预处理涉及缺失值(dropna(), fillna())和异常值处理。使用describe()进行统计分析,通过Matplotlib和Seaborn绘图。回归和分类分析用到Scikit-learn,如LinearRegression和RandomForestClassifier。
351 3