Python datacompy 找出两个DataFrames不同的地方

简介: 本篇博客解决在两个几乎完全相同的DataFrame当中如何找出不相同的元素,并使用datacompy直观的显示出来。

本篇博客解决在两个几乎完全相同的DataFrame当中如何找出不相同的元素,并使用datacompy直观的显示出来。

x表:

06cc0b63f1df4cda887a2b291a4701be.png

让x1和x2都是x的副本,则此时x1和x2的值是相同:

x1=x.copy()
x2=x.copy()

将其中x2的一个数据赋值为2000

x2.loc['罗梓烜']['20220125']=2000
x1[x1==x2].head(25) # 如何对不相等的数据进行纠正

此时可以看到下图这个数据是NaN值,说明对于这个数据来说x1和x2是不相同的

afbc1758fdae413885da4881157412fb.png

x1[x1==x2].isnull().sum()

e9d88028c931424b81968c51e45a5e63.png

但是现在还是不能确定出有异常值(也就是不相等的值的那行数据),因此我们考虑使用datacompy

安装:

!pip install datacompy
import datacompy,pandas as pd,sys
compy=datacompy.Compare(x1,x2,on_index=True)
compy
print(compy.matches())
print(compy.report())

此时就可以很清晰的看到两个DataFrame当中不相同的值了:

2f6efcbfe88942479b52e1e3317932c8.png


相关文章
|
9月前
|
存储 索引 Python
请解释Python中的NumPy库以及它的主要用途。
【2月更文挑战第27天】【2月更文挑战第97篇】请解释Python中的NumPy库以及它的主要用途。
223 0
|
9月前
|
数据可视化 数据挖掘 API
请解释Python中的Seaborn库以及它的主要用途。
请解释Python中的Seaborn库以及它的主要用途。
320 0
|
9月前
|
存储 索引 Python
一文掌握python数组numpy的全部用法(零基础学python(二))
一文掌握python数组numpy的全部用法(零基础学python(二))
|
Python 容器
【Python基础】Python函数
【Python基础】Python函数
96 0
|
9月前
|
机器学习/深度学习 数据采集 算法
请解释Python中的Sklearn库以及它的主要用途。
`Sklearn`是Python的顶级机器学习库,提供数据预处理、特征选择、分类回归、聚类、模型评估及参数调优等工具。它包含多种算法如SVM、决策树,并提供样例数据集便于实践。它是进行机器学习项目不可或缺的工具。
115 1
|
9月前
|
数据可视化 前端开发 Linux
请解释Python中的Matplotlib库以及它的主要用途。
【2月更文挑战第27天】【2月更文挑战第99篇】请解释Python中的Matplotlib库以及它的主要用途。
99 0
|
前端开发 Shell 索引
Python(二十二)python切片的相关概念总结
首先,要注意一件事,在python中,字符串,元组,列表的取值都可以使用下标来实现。 其实切片这个用法之前在看列表和元组的时候,提到过。 说白了其实就是根据索引获取元素。只是在python中,给他起了个名字叫切片。 一:切片操作语法 一个完整的切片表达式包含两个“:”,用于分隔三个参数(start_index、end_index、step)。当只有一个“:”时,默认第三个参数step=1;当一个“:”也没有时,start_index=end_index,表示切取start_index指定的那个元素。 切片操作基本表达式: css 复制代码 object[start_index:end_in
168 0
|
数据挖掘 Python
Python3:我低调的只用一行代码,就导入Python所有库!
Python3:我低调的只用一行代码,就导入Python所有库!
104 0
|
Python
python自定义函数 def 的奇妙世界
这里是三岁,来和大家唠唠自定义函数,这一个神奇的东西,带大家白话玩转自定义函数
126 0
python自定义函数 def 的奇妙世界
|
Python
【Python基础篇011】全部内置函数详细认识(中篇)
【Python基础篇011】全部内置函数详细认识(中篇)
132 0

热门文章

最新文章

推荐镜像

更多