备案控制台

开发者社区开发与运维文章正文

python数据预处理

2022-05-08 154

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 笔记

import pandas as pd
# 缺失值处理
df  = pd.read_excel('/Users/caizhengjie/Desktop/a.xlsx')
print(df)
# 直接调用info方法就会返回每一列的缺失值
print(df.info())
print('.....................')
# isnull方法判断哪个是缺失值
print(df.isnull())
print('.....................')
# 缺失值删除
'''
缺失值分为两种：1一行中某个字段的缺失值，2一行全部为空白
dropna为删除含有缺失值的行，只要某一行有缺失值就把这一行删除，运行dropna（）方法之后删除含有NaN值的行，返回删除后的数据
dropna(how = 'all'),指删除全部为空值的行 ,不全为空值的行就不会被删除
'''
# print(df.dropna(how='all'))
print('.....................')
# 缺失值的填充
# fillna（0）即将所有空值填充为0
# fillna（{'列名','要填入的值'}）
print(df.fillna({'学科':'理科'}))
print('.....................')
# 重复值处理
# drop_duplicates(）方法，默认对所有值进行重复值判断，且默认保留第一行的值
# drop_duplicates(subset = '指要判断的列名'，keep关键字，keep = 'fist'k或者'last'即默认是保留第一个，keep = false指把重复列全部删除）
# 数据类型
# print(df.info()) #查看全部数据类型
# print(df['学号'].dtype) #查看某一列的数据类型
# 类型转换-astype()转换数据类型
# print(df['学号'].astype('float'))
# 素引设置
# print('.....................')
# df.columns('学号','s','a','r','w','v','x','b')

以上内容仅供参考学习

文章标签：

Python

数据采集

关键词：

Python数据

Python数据预处理

游客wkxim4agoo6le

目录

相关文章

站大爷

|

1月前

|

数据采集 Web App开发数据可视化

Python零基础爬取东方财富网股票行情数据指南

东方财富网数据稳定、反爬宽松，适合爬虫入门。本文详解使用Python抓取股票行情数据，涵盖请求发送、HTML解析、动态加载处理、代理IP切换及数据可视化，助你快速掌握金融数据爬取技能。

站大爷

1084 1 3

凉凉心.

|

1月前

|

Java 数据挖掘数据处理

（Pandas）Python做数据处理必选框架之一！（一）：介绍Pandas中的两个数据结构；刨析Series：如何访问数据；数据去重、取众数、总和、标准差、方差、平均值等；判断缺失值、获取索引...

Pandas 是一个开源的数据分析和数据处理库，它是基于 Python 编程语言的。 Pandas 提供了易于使用的数据结构和数据分析工具，特别适用于处理结构化数据，如表格型数据（类似于Excel表格）。 Pandas 是数据科学和分析领域中常用的工具之一，它使得用户能够轻松地从各种数据源中导入数据，并对数据进行高效的操作和分析。 Pandas 主要引入了两种新的数据结构：Series 和 DataFrame。

凉凉心.

356 0 0

技术交流18179014480

|

1月前

|

JSON 算法 API

Python采集淘宝商品评论API接口及JSON数据返回全程指南

Python采集淘宝商品评论API接口及JSON数据返回全程指南

技术交流18179014480

437 136 137

技术交流18179014480

|

1月前

|

JSON API 数据安全/隐私保护

Python采集淘宝拍立淘按图搜索API接口及JSON数据返回全流程指南

通过以上流程，可实现淘宝拍立淘按图搜索的完整调用链路，并获取结构化的JSON商品数据，支撑电商比价、智能推荐等业务场景。

技术交流18179014480

381 138 138

荔枝科研社

|

3月前

|

机器学习/深度学习新能源调度

电力系统短期负荷预测（Python代码+数据+详细文章讲解）

电力系统短期负荷预测（Python代码+数据+详细文章讲解）

荔枝科研社

336 1 1

兵临天下19970108016

|

3月前

|

缓存 API 网络架构

淘宝item_search_similar - 搜索相似的商品API接口，用python返回数据

淘宝联盟开放平台中，可通过“物料优选接口”（taobao.tbk.dg.optimus.material）实现“搜索相似商品”功能。该接口支持根据商品 ID 获取相似推荐商品，并返回商品信息、价格、优惠等数据，适用于商品推荐、比价等场景。本文提供基于 Python 的实现示例，包含接口调用、数据解析及结果展示。使用时需配置淘宝联盟的 appkey、appsecret 和 adzone_id，并注意接口调用频率限制和使用规范。

兵临天下19970108016

219 1 1

魔羯座liaotianfeile

|

2月前

|

存储监控 API

Python实战：跨平台电商数据聚合系统的技术实现

本文介绍如何通过标准化API调用协议，实现淘宝、京东、拼多多等电商平台的商品数据自动化采集、清洗与存储。内容涵盖技术架构设计、Python代码示例及高阶应用（如价格监控系统），提供可直接落地的技术方案，帮助开发者解决多平台数据同步难题。

魔羯座liaotianfeile

122 0 0

站大爷

|

2月前

|

存储 JSON 算法

Python集合：高效处理无序唯一数据的利器

Python集合是一种高效的数据结构，具备自动去重、快速成员检测和无序性等特点，适用于数据去重、集合运算和性能优化等场景。本文通过实例详解其用法与技巧。

站大爷

130 0 0

小白学大数据

|

4月前

|

存储 Web App开发前端开发

Python + Requests库爬取动态Ajax分页数据

Python + Requests库爬取动态Ajax分页数据

小白学大数据

206 1 2

技术交流18179014480

|

4月前

|

JSON API 数据格式

Python采集京东商品评论API接口示例，json数据返回

下面是一个使用Python采集京东商品评论的完整示例，包括API请求、JSON数据解析

技术交流18179014480

187 0 0

热门文章

最新文章

基于python大数据的台风灾害分析及预测系统

基于python大数据的青少年网络使用情况分析及预测系统

基于Python大数据的热门游戏推荐系统

文本分析-使用Python做词频统计分析

【技术分享】强化学习中使用seaborn绘制带有均值Reward的图片

Python数据可视化：用Seaborn绘制高端玩家版散点图

零基础学python之文本和编码问题

python之sys模块

45. Python 小练习

用python实现一个不排序的列表功能

Python中的列表推导式：简洁高效的数据处理艺术

Python字符串格式化利器：f-strings入门指南

Python列表推导式：简洁高效的数据处理利器

Python高效字符串格式化：f-strings的魅力

掌握Python装饰器：轻松统计函数执行时间

Python f-strings：让字符串格式化更简洁高效！

Python爬取招标信息并生成可视化分析报告

用 Python 制作简单小游戏教程：手把手教你开发猜数字游戏

Python3.14正式支持Free Threaded版本！

Python web Django快速入门手册全栈版，共2590字，短小精悍

相关课程

更多

Python Web开发基础

Python开发基础入门

Python常用数据科学库

Python网络爬虫实战

Python完全自学手册图文教程

Python基础快速入门实战教程

相关电子书

更多

From Python Scikit-Learn to Sc

Data Pre-Processing in Python:

双剑合璧-Python和大数据计算平台的结合

推荐镜像

更多

python-release

下一篇

阿里云弹性公网IP线路类型【BGP(多线)_精品】是什么意思？