1.8 创建 DataFrame 对象时指定行索引
- index:指定行索引
l = [ ['zs', 12, 'm'], ['ls', 23, 'm'], ['ww', 22, 'm'] ] df1 = pd.DataFrame( l, columns=['name', 'age', 'gender'], index=['a', 'b', 'c'] ) print(df1) print() print(type(df1)) print()
1.9 创建 DataFrame 对象时指定元素的数据类型
- dtype:指定元素的数据类型
字符串数据类型的数据元素会被忽略
l = [ ['zs', 12, 'm'], ['ls', 23, 'm'], ['ww', 22, 'm'] ] df1 = pd.DataFrame( l, columns=['name', 'age', 'gender'], index=['a', 'b', 'c'], dtype='float64' ) print(df1) print() print(type(df1)) print()
1.10 创建 DataFrame 对象的注意点
使用列表创建 DataFrame 对象时,不同列表的长度不同会报错。
data = { 'one': [1,2,3], 'two': [1,2,3,4], } df = pd.DataFrame(data)
ValueError: All arrays must be of the same length
使用 Series 对象创建 DataFrame 对象,不同长度不同会报错。
data = { 'one': pd.Series([1,2,3]), 'two': pd.Series([1,2,3,4]), } df = pd.DataFrame(data) print(df)
Series 可以保证列数据个数不一样的不同列的各行数据元素位置相对应
data = { 'one': pd.Series([1, 2, 3], index=['a', 'b', 'd']), 'two': pd.Series([1, 2, 3, 4], index=['a', 'b', 'c', 'd']), } df = pd.DataFrame(data) print(df)
data = { 'one': pd.Series([1, 2, 3], index=['a', 'b', 'd']), 'two': pd.Series([1, 2, 3, 4], index=['e', 'f', 'g', 'h']), } df = pd.DataFrame(data) print(df)
2. DataFrame 的属性
2.1 axes ---- 返回行/列标签列表
l = [ ['zs', 12, 'm'], ['ls', 23, 'm'], ['ww', 22, 'm'] ] df1 = pd.DataFrame( l, columns=['name', 'age', 'gender'], index=['a', 'b', 'c'] ) print(df1) print() print(df1.axes)
2.2 columns ---- 返回列标签列表
l = [ ['zs', 12, 'm'], ['ls', 23, 'm'], ['ww', 22, 'm'] ] df1 = pd.DataFrame( l, columns=['name', 'age', 'gender'], index=['a', 'b', 'c'] ) print(df1) print() print(df1.columns)
2.3 index ---- 返回行标签列表
l = [ ['zs', 12, 'm'], ['ls', 23, 'm'], ['ww', 22, 'm'] ] df1 = pd.DataFrame( l, columns=['name', 'age', 'gender'], index=['a', 'b', 'c'] ) print(df1) print() print(df1.index)
2.4 dtypes ---- 返回数据类型
l = [ ['zs', 12, 'm'], ['ls', 23, 'm'], ['ww', 22, 'm'] ] df1 = pd.DataFrame( l, columns=['name', 'age', 'gender'], index=['a', 'b', 'c'] ) print(df1) print() print(df1.dtypes)
2.5 empty ---- 返回 DataFrame 对象是否为空
l = [ ['zs', 12, 'm'], ['ls', 23, 'm'], ['ww', 22, 'm'] ] df1 = pd.DataFrame( l, columns=['name', 'age', 'gender'], index=['a', 'b', 'c'] ) print(df1) print() print(df1.empty) print() df2 = pd.DataFrame() print(df2) print() print(df2.empty)
2.6 ndim ---- 返回 DateFrame 对象的维数
l = [ ['zs', 12, 'm'], ['ls', 23, 'm'], ['ww', 22, 'm'] ] df1 = pd.DataFrame( l, columns=['name', 'age', 'gender'], index=['a', 'b', 'c'] ) print(df1) print() print(df1.ndim)
2.7 size ---- 返回DateFrame 对象中的数据元素个数
l = [ ['zs', 12, 'm'], ['ls', 23, 'm'], ['ww', 22, 'm'] ] df1 = pd.DataFrame( l, columns=['name', 'age', 'gender'], index=['a', 'b', 'c'] ) print(df1) print() print(df1.size)
2.8 values ---- 返回数据元素组成的 ndarray 数组
l = [ ['zs', 12, 'm'], ['ls', 23, 'm'], ['ww', 22, 'm'] ] df1 = pd.DataFrame( l, columns=['name', 'age', 'gender'], index=['a', 'b', 'c'] ) print(df1) print() print(df1.values)