Dataset:数据生成之利用pandas自定义生成随机各自类型(离散型和连续型)的dataframe数据

简介: Dataset:数据生成之利用pandas自定义生成随机各自类型(离散型和连续型)的dataframe数据


目录

数据生成之利用pandas自定义生成随机数据

输出结果

实现代码


数据生成之利用pandas自定义生成随机数

输出结果

1.          date  gender  grade  weight/kg  height/cm
2. 0  2021-01-01       1      2         40        175
3. 1  2021-01-02       0      2         44        161
4. 2  2021-01-03       1      2         42        158
5. 3  2021-01-04       0      3         48        158
6. 4  2021-01-05       1      2         47        173
7. 5  2021-01-06       0      1         44        160
8. 6  2021-01-07       1      1         44        170
9. 7  2021-01-08       1      2         40        174
10. 8  2021-01-09       0      3         40        160
11. 9  2021-01-10       1      1         44        165
12. 10 2021-01-11       0      1         40        155
13. 11 2021-01-12       1      3         45        171
14. 12 2021-01-13       0      1         40        152
15. 13 2021-01-14       1      1         42        157
16. 14 2021-01-15       0      4         42        177
17. 15 2021-01-16       1      3         49        176
18. 16 2021-01-17       1      1         48        175
19. 17 2021-01-18       1      4         42        169
20. 18 2021-01-19       0      2         43        159
21. 19 2021-01-20       1      2         44        173

实现代码

1. # encoding: utf-8
2. 
3. import pandas as pd
4. import numpy as np
5. 
6. dict_data={
7. 'date':  pd.date_range('20210101',periods=20),  #'用pd.date_range函数生成连续指定天数的的日期'
8. 'gender':np.random.randint(0,2,size=20),
9. 'grade': np.random.randint(1,5,size=20),
10. 'weight/kg':np.random.randint(40,50,size=20),
11. 'height/cm':np.random.randint(150,180,size=20)
12.     }
13. dataframe01 = pd.DataFrame(dict_data)
14. print(dataframe01)


相关文章
|
6天前
|
数据处理 Python
如何使用Python的Pandas库进行数据排序和排名
【4月更文挑战第22天】Pandas Python库提供数据排序和排名功能。使用`sort_values()`按列进行升序或降序排序,如`df.sort_values(by='A', ascending=False)`。`rank()`函数用于计算排名,如`df['A'].rank(ascending=False)`。多列操作可传入列名列表,如`df.sort_values(by=['A', 'B'], ascending=[True, False])`和分别对'A'、'B'列排名。
18 2
|
5天前
|
数据挖掘 数据处理 索引
如何使用Python的Pandas库进行数据筛选和过滤?
Pandas是Python数据分析的核心库,提供DataFrame数据结构。基本步骤包括导入库、创建DataFrame及进行数据筛选。示例代码展示了如何通过布尔索引、`query()`和`loc[]`方法筛选`Age`大于19的记录。
12 0
|
5天前
|
索引 Python
如何使用Pandas进行数据合并?
Pandas提供`merge()`, `join()`, `concat()`等方法进行数据合并。基本步骤包括导入pandas库、创建或加载DataFrame,然后调用这些方法合并数据。示例中展示了如何使用`merge()`和`join()`:创建两个DataFrame `df1`和`df2`,通过`merge()`基于索引合并,以及`join()`进行外连接合并。
14 0
|
7天前
|
Python
如何使用Python的Pandas库进行数据缺失值处理?
Pandas在Python中提供多种处理缺失值的方法:1) 使用`isnull()`检查;2) `dropna()`删除含缺失值的行或列;3) `fillna()`用常数、前后值填充;4) `interpolate()`进行插值填充。根据需求选择合适的方法处理数据缺失。
40 9
|
9天前
|
索引 Python
如何使用Python的Pandas库进行数据透视表(pivot table)操作?
使用Pandas在Python中创建数据透视表的步骤包括:安装Pandas库,导入它,创建或读取数据(如DataFrame),使用`pd.pivot_table()`指定数据框、行索引、列索引和值,计算聚合函数(如平均分),并可打印或保存结果到文件。这允许对数据进行高效汇总和分析。
10 2
|
12天前
|
数据挖掘 数据处理 索引
数据合并与连接:Pandas中的强大数据整合功能
【4月更文挑战第16天】Pandas是Python数据分析的库,提供数据合并与连接功能。本文聚焦于`merge`和`concat`函数。`merge`基于键合并DataFrame,如示例中`df1`和`df2`按'key'列合并,支持多种连接方式。`concat`则沿轴堆叠DataFrame,如`df3`和`df4`沿行连接。注意合并连接时键的一致性、选择合适连接方式及处理索引和数据结构,以确保数据准确一致。学习这些方法能有效整合多数据源,便于分析。
|
12天前
|
存储 数据库连接 数据处理
数据加载与保存:Pandas中的数据输入输出操作
【4月更文挑战第16天】Pandas是Python数据分析的强大工具,支持多种数据加载和保存方法。本文介绍了如何使用Pandas读写CSV和Excel文件,以及与数据库交互。`read_csv`和`to_csv`用于CSV操作,`read_excel`和`to_excel`处理Excel文件,而`read_sql`和`to_sql`则用于数据库的读写。了解这些基本操作能提升数据处理的效率和灵活性。
|
5天前
|
数据挖掘 数据处理 索引
python常用pandas函数nlargest / nsmallest及其手动实现
python常用pandas函数nlargest / nsmallest及其手动实现
20 0
|
1月前
|
数据格式 Python
如何使用Python的Pandas库进行数据透视图(melt/cast)操作?
Pandas的`melt()`和`pivot()`函数用于数据透视。基本步骤:导入pandas,创建DataFrame,然后使用这两个函数转换数据格式。示例代码展示了如何通过`melt()`转为长格式,再用`pivot()`恢复为宽格式。输入数据是包含'Name'和'Age'列的DataFrame,最终结果经过转换后呈现出不同的布局。
41 6
|
1月前
|
数据处理 Python
如何使用Python的Pandas库进行数据排序和排名?
Pandas在Python中提供数据排序和排名功能。使用`sort_values()`进行排序,如`df.sort_values(by='A', ascending=False)`进行降序排序;用`rank()`进行排名,如`df['A'].rank(ascending=False)`进行降序排名。多列操作可传入列名列表,如`df.sort_values(by=['A', 'B'], ascending=[True, False])`。
25 6