备案控制台

开发者社区开发与运维文章正文

Pandas 数据重复处理 duplicated()和drop_duplicates()

2023-01-17 119

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： Pandas 数据重复处理 duplicated()和drop_duplicates()

✌ duplicated()和drop_duplicates()

✌ 导库

import pandas as pd
import numpy as np

✌ 创建数据集

x=np.array([[1,2,3],[3,4,5],[1,2,3],[1,2,3]])
x=pd.DataFrame(x)
x

✌ duplicated（）

返回每行数据是否重复

x.duplicated()

✌ 计算重复数据数目

x.duplicated().sum()

✌ drop_duplicates()

删除重复值

x=x.drop_duplicates()
x

文章标签：

Python

关键词：

Pandas drop_duplicates

Pandas duplicated drop_duplicates

壹佰、

目录

相关文章

gudanhero2018

|

3月前

|

Serverless 数据处理索引

Pandas中的shift函数：轻松实现数据的前后移动

Pandas中的shift函数：轻松实现数据的前后移动

gudanhero2018

195 0 0

cqtianxin1

|

22天前

|

Python

Pandas 常用函数-数据选择和切片

10月更文挑战第28天

cqtianxin1

20 6 6

cqtianxin1

|

22天前

|

Python

Pandas 常用函数-数据分组和聚合

10月更文挑战第28天

cqtianxin1

17 4 4

cqtianxin1

|

21天前

|

Python

Pandas 常用函数-数据合并

Pandas 常用函数-数据合并

cqtianxin1

34 1 1

cqtianxin1

|

22天前

|

索引 Python

Pandas 常用函数-数据排序

10月更文挑战第28天

cqtianxin1

10 1 1

cqtianxin1

|

22天前

|

Python

Pandas 常用函数-查看数据

Pandas 常用函数-查看数据

cqtianxin1

14 2 2

cqtianxin1

|

22天前

|

SQL JSON 数据库

Pandas 常用函数-读取数据

Pandas 常用函数-读取数据

cqtianxin1

13 2 2

众所周知

|

26天前

|

Python

通过Pandas库处理股票收盘价数据，识别最近一次死叉后未出现金叉的具体位置的方法

在金融分析领域，"死叉"指的是短期移动平均线（如MA5）下穿长期移动平均线（如MA10），而"金叉"则相反。本文介绍了一种利用Python编程语言，通过Pandas库处理股票收盘价数据，识别最近一次死叉后未出现金叉的具体位置的方法。该方法首先计算两种移动平均线，接着确定它们的交叉点，最后检查并输出最近一次死叉及其后是否形成了金叉。此技术广泛应用于股市趋势分析。

众所周知

41 2 2

cqtianxin1

|

21天前

|

Python

Pandas 常用函数-数据选择和过滤

Pandas 常用函数-数据选择和过滤

cqtianxin1

11 0 0

zzy的aly

|

2月前

|

数据可视化数据挖掘数据处理

模型预测笔记(四)：pandas_profiling生成数据报告

本文介绍了pandas_profiling库，它是一个Python工具，用于自动生成包含多种统计指标和可视化的详细HTML数据报告，支持大型数据集并允许自定义配置。安装命令为`pip install pandas_profiling`，使用示例代码`pfr = pandas_profiling.ProfileReport(data_train); pfr.to_file("./example.html")`。

zzy的aly

51 1 1

热门文章

最新文章

pandas 打开没有列名的表格，并命名

pandas.to_numeric转化数据为数字型

pandas数据操作

Pandas 基本使用(三) — DataFrame.to_dict() 函数使用！

羡慕 Excel 的高级选择与文本框颜色呈现？Pandas 也可以拥有！！ ⛵

Pandas 数据分组中｜学习笔记

【Python数据分析 - 10】：pandas常见基本操作

python pandas 宝可梦数据分析可视化实战课程设计完整代码+数据可直接运行

Pandas 基础5｜学习笔记

如何利用Python中的Pandas库进行数据分析和可视化

【新手解答】Python中Pandas的初学者笔记

Python网络数据抓取（5）：Pandas

使用Python pandas的sort_values()方法可按一个或多个列对DataFrame排序

在Python的Pandas中，可以通过直接赋值或使用apply函数在DataFrame添加新列。

在Pandas中，利用boolean indexing可按条件过滤DataFrame

【Python机器学习专栏】使用Pandas处理机器学习数据集

使用Python的pandas和matplotlib库绘制移动平均线（MA）示例

Python数据分析中的Pandas库应用指南

数据分析综合案例讲解，一文搞懂Numpy，pandas，matplotlib，seaborn技巧方法

相关课程

更多

Python 数据分析库 Pandas 快速入门

相关电子书

更多

中文：即学即用的Pandas入门与时间序列分析

即学即用的Pandas入门与时间序列分析

低代码开发师（初级）实战教程

下一篇

阿里云无影云电脑免费试用，最长可试用3个月