数据分析 | Pandas 200道练习题,每日10道题,学完必成大神(2)

简介: 数据分析 | Pandas 200道练习题,每日10道题,学完必成大神(2)

前期准备


准备后期要使用的数据,使用字典创建DataFrame对象


import pandas as pd
import numpy as np
data = {
    'grammer':['python','java','go',np.nan,'python','C','C++'],
    'popularity':[1,np.nan,np.nan,4,5,7,8]
}
df = pd.DataFrame(data)
df


ac10baf7c5614290b84667da48df7282.png


1.通过DataFrame保存为EXCEL


保存文件的函数一般是 to_xxx


# 保存为EXCEL文件
df.to_excel('text.xlsx')
# 保存为csv文件
df.to_csv('text.csv')


2.查看数据行列数


通过DataFrame的对象的属性查看数据行列数

也可以通过其他的方式进行查询,但是这种是最便捷的


# .shape是属性 不用加括号
df.shape 


3.提取popularity列中值大于3小于7的行


使用的是布尔值索引还有进行合取操作


df[(df['popularity']>3) & (df['popularity']<7)]


5ecb651320c34300bdea19b272b6b86a.png


4.交换两列的位置


其实这个交换位置,内在的逻辑就是先取出交换后的数据,再将交换后的数据重新赋值给df


df = df[['popularity','grammer']]
df


4ab5dbefc9424172b48a8fe57d0838fb.png


5.提取popularity列最大的行所在行


使用到了max函数同样还有min函数,

使用这个方法避免了数据中出现两个最大值而而只取出一个的情况。


df[df['popularity']== df['popularity'].max()]


c48256ff2e4b4c5b8535bfcc56697422.png


6.查看最后3行数据


使用的是tail()函数,默认是最后5行,在括号里面传入X就会返回最后X

同样还用head() 用法是一样的


# 查看最后3行的数据
df.tail(3)


536b40e7ae074294a6d7c514ebf13d6b.png


7.删除最后一行数据


主要的思路是选中最后一行,然后删除,这种方式还可以删除多行


# 方式1
df.drop([len(df)-1],inplace=True)
# 方式2
df.drop([df.shape[0]-1],inplace=True)
df


8dd1e67849b049c7a08f0135e32862b3.png


8.添加一行数据


append() 添加数据,使用字典添加,字典的键是列名,值是要添加的数据,如果字典的键在DataFrame

中不存在,则会新建一列,其余的行设置为NaN


row = {'grammer':'Perl','popularity':6.6}
df.append(row,ignore_index=True)   # 忽略行索引


f518d2ef3a3f4f2a95b1da7125c75f96.png


9.队数据按照popularity列的值的大小进行排序


使用sort_values函数,按值排序,默认是升序 添加参数ascending=False可以变为降序


df.sort_values('popularity')  # 不会修改原数据
df.sort_values('popularity',inplace=True)  # 修改原数据


6084683610b74bd1afb468cb872ddea7.png


10.统计grammer列每个字符串的长度


因为计算字符的长度,不能为NaN不然会报错,所以我们在计算字符串的长度的时候可以选择先将孔空缺的数据填充上去,然后在计算长度


df['grammer'] = df['grammer'].fillna("R")   # 将空缺的数据填充为R 也可以填充为一个空字符
df['len_str'] = df['grammer'].map(len)     # 使用map函数,map函数传入一个函数,每一行的数据会依次调用这个函数
df


6aff744d115e4fc39d1efcdd35673134.png


今天这10道题还是比较轻松的,希望大家能够多多拓展,拓宽自己的思路,尝试一些新的方法。

这里我推荐大家去 牛客网 继续练习,牛客网里面有相应题目的专项突破


69adff8ba4e84b2e91ded84094eb6334.png


相关文章
|
2天前
|
数据采集 数据可视化 数据挖掘
如何利用Python中的Pandas库进行数据分析和可视化
Python的Pandas库是一种功能强大的工具,可以用于数据分析和处理。本文将介绍如何使用Pandas库进行数据分析和可视化,包括数据导入、清洗、转换以及基本的统计分析和图表绘制。通过学习本文,读者将能够掌握利用Python中的Pandas库进行高效数据处理和可视化的技能。
|
13天前
|
数据采集 SQL 数据挖掘
Python数据分析中的Pandas库应用指南
在数据科学和分析领域,Python语言已经成为了一种非常流行的工具。本文将介绍Python中的Pandas库,该库提供了强大的数据结构和数据分析工具,使得数据处理变得更加简单高效。通过详细的示例和应用指南,读者将了解到如何使用Pandas库进行数据加载、清洗、转换和分析,从而提升数据处理的效率和准确性。
|
14天前
|
数据可视化 数据挖掘 C++
数据分析综合案例讲解,一文搞懂Numpy,pandas,matplotlib,seaborn技巧方法
数据分析综合案例讲解,一文搞懂Numpy,pandas,matplotlib,seaborn技巧方法
|
14天前
|
算法 数据挖掘 数据处理
数据分析Pandas之Series,快速上手
数据分析Pandas之Series,快速上手
|
14天前
|
数据采集 机器学习/深度学习 数据可视化
Pandas在数据分析中有广泛的应用场景
Pandas是数据分析利器,适用于数据清洗(处理缺失值、重复项、异常值)、探索分析(统计量、图表)、预处理(特征提取、编码、选择)、建模(线性回归、聚类等)及可视化,与Matplotlib等库配合提升效率。
9 1
|
14天前
|
数据处理 Python
Pandas在数据分析中的应用案例
使用Pandas分析销售数据,通过`read_csv`读取CSV,`groupby`按产品类别分组并应用`agg`计算类别总销售额、平均价和销售量。之后,利用`sort_values`按销售额降序排列,`head`获取前5高销售额类别。示例代码展示了Pandas在数据处理和分析中的高效性。
26 0
|
24天前
|
数据采集 数据挖掘 数据处理
《Pandas 简易速速上手小册》第8章:Pandas 高级数据分析技巧(2024 最新版)
《Pandas 简易速速上手小册》第8章:Pandas 高级数据分析技巧(2024 最新版)
26 1
|
20天前
|
数据挖掘 数据处理 索引
python常用pandas函数nlargest / nsmallest及其手动实现
python常用pandas函数nlargest / nsmallest及其手动实现
36 0
|
20天前
|
Python
如何使用Python的Pandas库进行数据透视图(melt/cast)操作?
Pandas的`melt()`和`pivot()`函数用于数据透视。基本步骤:导入pandas,创建DataFrame,然后使用这两个函数变换数据。示例代码:导入pandas,定义一个包含&#39;Name&#39;和&#39;Age&#39;列的DataFrame,使用`melt()`转为长格式,再用`pivot()`恢复为宽格式。
26 1
|
21天前
|
数据处理 Python
如何使用Python的Pandas库进行数据排序和排名
【4月更文挑战第22天】Pandas Python库提供数据排序和排名功能。使用`sort_values()`按列进行升序或降序排序,如`df.sort_values(by=&#39;A&#39;, ascending=False)`。`rank()`函数用于计算排名,如`df[&#39;A&#39;].rank(ascending=False)`。多列操作可传入列名列表,如`df.sort_values(by=[&#39;A&#39;, &#39;B&#39;], ascending=[True, False])`和分别对&#39;A&#39;、&#39;B&#39;列排名。
24 2