DataFrame(4):DataFrame的创建方式

简介: DataFrame(4):DataFrame的创建方式

1、利用字典生成DataFrame

① 第一种方式:列表组成的字典

stu = {
       "name":["张三","李四","王燕"],
       "age":[18,20,22],
       "sex":["男","男","女"]
}
df = pd.DataFrame(stu)
display(df)


结果如下:

image.png


② 第二种方式:上述方式的一般形式

person = {
          "name":"Tom",
          "age":20,
          "subject":["Python","Java","Excel"]
}
df = pd.DataFrame(person)
display(df)


结果如下:


image.png

③ 列表组成的列表

x = [[1,2,3,4],[5,6,7,8],[9,10,11,12]]
df = pd.DataFrame(data)
display(df)


结果如下:

image.png


④ 字典组成的列表

data = [
        {"one":1,"two":2},
        {"one":5,"two":10,"three":15}
]
df = pd.DataFrame(data)
display(df)


结果如下:

image.png


⑤ 字典组成的字典

data = {
    "张三":{"Java":90, "Python":89, "Hive":78},
    "李四":{"Java":82, "Python":95, "Hive":96},
    "王五":{"Java":85, "Python":94}
}
df = pd.DataFrame(data)
display(df)
data = {
    "Java":{"张三":90,"李四":82,"王五":85},
    "Python":{"张三":89,"李四":95,"王五":94},
    "Hive":{"张三":78,"李四":96}
}
df = pd.DataFrame(data)
display(df)


结果如下:

image.png

注意:对于上述两个DataFrame,我们直接可以使用data.T进行DataFrame行、列之间的转换。


⑥ 由Series或ndarray组成的字典

data = {
    "Java":pd.Series(np.random.randint(70,100,5)),
    "Python":np.random.randint(80,100,5)
}
df = pd.DataFrame(data)
display(df)


结果如下:

image.png


2、自定义列、索引、数据生成DataFrame

column = ["Python","Java","Excel"]
dates = pd.date_range("20200202",periods=5)
df = pd.DataFrame(np.random.randint(low=70,high=100,size=(5,3)),
                  index=dates,columns=column)
display(df)


结果如下:

image.png

注意:这里有两个知识点需要掌握,一个是pd.date_range(),一个np.random.randint(),知道怎么用就行了,详细说明请自行百度。


3、利用二维数组生成DataFrame(常用)

x = np.arange(1,21).reshape(4,5)
index = list("abcde")
df = pd.DataFrame(x,index=index)
display(df)


结果如下:

image.png


4、将不同的列表转化为tuple,生成DataFrame

movie = ["战狼2","哪吒之魔童降世","流浪地球","红海行动"]
piapofang = [str(x)+"亿" for x in [56.39,49.34,46.18,36.22]]
list_to_tuple = list(zip(movie,piaofang))
df = pd.DataFrame(list_to_tuple,columns=["movies","piaofang"])
display(df)


结果如下:

image.png


5、通过读取sql,csv,excel等文件生成DataFrame

 以后工作中都是利用已有的文件,进行数据分析。最好的方式就是将文件读取成DataFrame方式,然后利用各种方式进行数据处理。由于文件格式众多,这里不细说,你需要读取哪一种文件,就自行百度学习一下,即可。


相关文章
|
SQL 存储 分布式计算
DataFrame 介绍_ DataFrame 是什么 | 学习笔记
快速学习 DataFrame 介绍_ DataFrame 是什么
1169 0
DataFrame 介绍_ DataFrame 是什么 | 学习笔记
|
4月前
|
数据采集 机器学习/深度学习 数据处理
DataFrame 操作
DataFrame 操作
198 1
|
4月前
|
SQL JSON 数据库
如何创建DataFrame?
如何创建DataFrame?
154 1
|
8月前
|
SQL 数据采集 数据挖掘
Pandas DataFrame 基本操作实例100个
Pandas DataFrame 基本操作实例100个
258 1
|
SQL JSON 分布式计算
|
分布式计算 大数据 API
DataFrame 介绍_创建_toDF | 学习笔记
快速学习 DataFrame 介绍_创建_toDF
401 0
DataFrame 介绍_创建_toDF | 学习笔记
|
SQL 分布式计算 大数据
DataFrame 介绍_操作 | 学习笔记
快速学习 DataFrame 介绍_操作
177 0
DataFrame 介绍_操作 | 学习笔记
|
Serverless 索引 Python
如何查看 Series、DataFrame 对象的数据
我们可以使用 head() 和 tail() 方法来查看 Series 对象或 DataFrame 对象的一小部分数据,默认查看的元素个数为 5 个,head() 展示头部的 5 个元素,tail() 展示尾部的 5 个元素,也可以自定义展示的元素个数。当 Series 对象或 DataFrame 对象包含的数据较多时,使用 head() 或 tail() 查看数据的结构会非常方便。
141 0
DataFrame(5):DataFrame元素的获取方式(很重要)(二)
DataFrame(5):DataFrame元素的获取方式(很重要)(二)
DataFrame(5):DataFrame元素的获取方式(很重要)(二)
Pandas 已有 DataFrame,给其加列名
Pandas 已有 DataFrame,给其加列名