数据分析 | Pandas 200道练习题,每日10道题,学完必成大神(2)

简介: 数据分析 | Pandas 200道练习题,每日10道题,学完必成大神(2)

前期准备


准备后期要使用的数据,使用字典创建DataFrame对象


import pandas as pd
import numpy as np
data = {
    'grammer':['python','java','go',np.nan,'python','C','C++'],
    'popularity':[1,np.nan,np.nan,4,5,7,8]
}
df = pd.DataFrame(data)
df


ac10baf7c5614290b84667da48df7282.png


1.通过DataFrame保存为EXCEL


保存文件的函数一般是 to_xxx


# 保存为EXCEL文件
df.to_excel('text.xlsx')
# 保存为csv文件
df.to_csv('text.csv')


2.查看数据行列数


通过DataFrame的对象的属性查看数据行列数

也可以通过其他的方式进行查询,但是这种是最便捷的


# .shape是属性 不用加括号
df.shape 


3.提取popularity列中值大于3小于7的行


使用的是布尔值索引还有进行合取操作


df[(df['popularity']>3) & (df['popularity']<7)]


5ecb651320c34300bdea19b272b6b86a.png


4.交换两列的位置


其实这个交换位置,内在的逻辑就是先取出交换后的数据,再将交换后的数据重新赋值给df


df = df[['popularity','grammer']]
df


4ab5dbefc9424172b48a8fe57d0838fb.png


5.提取popularity列最大的行所在行


使用到了max函数同样还有min函数,

使用这个方法避免了数据中出现两个最大值而而只取出一个的情况。


df[df['popularity']== df['popularity'].max()]


c48256ff2e4b4c5b8535bfcc56697422.png


6.查看最后3行数据


使用的是tail()函数,默认是最后5行,在括号里面传入X就会返回最后X

同样还用head() 用法是一样的


# 查看最后3行的数据
df.tail(3)


536b40e7ae074294a6d7c514ebf13d6b.png


7.删除最后一行数据


主要的思路是选中最后一行,然后删除,这种方式还可以删除多行


# 方式1
df.drop([len(df)-1],inplace=True)
# 方式2
df.drop([df.shape[0]-1],inplace=True)
df


8dd1e67849b049c7a08f0135e32862b3.png


8.添加一行数据


append() 添加数据,使用字典添加,字典的键是列名,值是要添加的数据,如果字典的键在DataFrame

中不存在,则会新建一列,其余的行设置为NaN


row = {'grammer':'Perl','popularity':6.6}
df.append(row,ignore_index=True)   # 忽略行索引


f518d2ef3a3f4f2a95b1da7125c75f96.png


9.队数据按照popularity列的值的大小进行排序


使用sort_values函数,按值排序,默认是升序 添加参数ascending=False可以变为降序


df.sort_values('popularity')  # 不会修改原数据
df.sort_values('popularity',inplace=True)  # 修改原数据


6084683610b74bd1afb468cb872ddea7.png


10.统计grammer列每个字符串的长度


因为计算字符的长度,不能为NaN不然会报错,所以我们在计算字符串的长度的时候可以选择先将孔空缺的数据填充上去,然后在计算长度


df['grammer'] = df['grammer'].fillna("R")   # 将空缺的数据填充为R 也可以填充为一个空字符
df['len_str'] = df['grammer'].map(len)     # 使用map函数,map函数传入一个函数,每一行的数据会依次调用这个函数
df


6aff744d115e4fc39d1efcdd35673134.png


今天这10道题还是比较轻松的,希望大家能够多多拓展,拓宽自己的思路,尝试一些新的方法。

这里我推荐大家去 牛客网 继续练习,牛客网里面有相应题目的专项突破


69adff8ba4e84b2e91ded84094eb6334.png


相关文章
|
16天前
|
数据采集 存储 数据挖掘
Python数据分析:Pandas库的高效数据处理技巧
【10月更文挑战第27天】在数据分析领域,Python的Pandas库因其强大的数据处理能力而备受青睐。本文介绍了Pandas在数据导入、清洗、转换、聚合、时间序列分析和数据合并等方面的高效技巧,帮助数据分析师快速处理复杂数据集,提高工作效率。
45 0
|
11天前
|
机器学习/深度学习 数据采集 数据挖掘
解锁 Python 数据分析新境界:Pandas 与 NumPy 高级技巧深度剖析
Pandas 和 NumPy 是 Python 中不可或缺的数据处理和分析工具。本文通过实际案例深入剖析了 Pandas 的数据清洗、NumPy 的数组运算、结合两者进行数据分析和特征工程,以及 Pandas 的时间序列处理功能。这些高级技巧能够帮助我们更高效、准确地处理和分析数据,为决策提供支持。
26 2
|
17天前
|
存储 数据挖掘 数据处理
Python数据分析:Pandas库的高效数据处理技巧
【10月更文挑战第26天】Python 是数据分析领域的热门语言,Pandas 库以其高效的数据处理功能成为数据科学家的利器。本文介绍 Pandas 在数据读取、筛选、分组、转换和合并等方面的高效技巧,并通过示例代码展示其实际应用。
30 2
|
8天前
|
并行计算 数据挖掘 大数据
Python数据分析实战:利用Pandas处理大数据集
Python数据分析实战:利用Pandas处理大数据集
|
8天前
|
数据采集 数据可视化 数据挖掘
利用Python进行数据分析:Pandas库实战指南
利用Python进行数据分析:Pandas库实战指南
|
1月前
|
机器学习/深度学习 数据采集 算法
探索Python科学计算的边界:NumPy、Pandas与SciPy在大规模数据分析中的高级应用
【10月更文挑战第5天】随着数据科学和机器学习领域的快速发展,处理大规模数据集的能力变得至关重要。Python凭借其强大的生态系统,尤其是NumPy、Pandas和SciPy等库的支持,在这个领域占据了重要地位。本文将深入探讨这些库如何帮助科学家和工程师高效地进行数据分析,并通过实际案例来展示它们的一些高级应用。
49 0
探索Python科学计算的边界:NumPy、Pandas与SciPy在大规模数据分析中的高级应用
|
1月前
|
数据采集 数据挖掘 API
Python数据分析加速器:深度挖掘Pandas与NumPy的高级功能
在Python数据分析的世界里,Pandas和NumPy无疑是两颗璀璨的明星,它们为数据科学家和工程师提供了强大而灵活的工具集,用于处理、分析和探索数据。今天,我们将一起深入探索这两个库的高级功能,看看它们如何成为数据分析的加速器。
40 1
|
1月前
|
数据采集 数据可视化 数据挖掘
Python 数据分析实战:使用 Pandas 进行数据清洗与可视化
【10月更文挑战第3天】Python 数据分析实战:使用 Pandas 进行数据清洗与可视化
91 0
|
2月前
|
数据挖掘 Python
Pandas数据分析实战(2):2023美国财富1000强公司情况
Pandas数据分析实战(2):2023美国财富1000强公司情况
44 0
|
2月前
|
机器学习/深度学习 数据处理 Python
从NumPy到Pandas:轻松转换Python数值库与数据处理利器
从NumPy到Pandas:轻松转换Python数值库与数据处理利器
76 0