Python数据分析与展示:DataFrame类型索引操作-10

简介: Python数据分析与展示:DataFrame类型索引操作-10

DataFrame对象操作

重新索引


.reindex()能够改变或重排Series和DataFrame索引


.reindex(index=None, columns=None,…)的参数

image.png


image.png

索引类型

Series和DataFrame的索引是Index类型

Index对象是不可修改类型


索引类型常用方法


image.png

image.png

.drop()能够删除Series和DataFrame指定行或列索引

# -*- coding: utf-8 -*-
# @File    : dataframe_demo2.py
# @Date    : 2018-05-20
# DataFrame对象操作
from pandas import DataFrame
dt = {
    "城市": ["北京", "上海", "南京", "天津"],
    "人口": [200, 20, 30, 40],
    "收入": [10, 20, 40, 50]
}
df = DataFrame(dt, index=["c1", "c2", "c3", "c4"])
print(df)
"""
    城市   人口  收入
c1  北京  200  10
c2  上海   20  20
c3  南京   30  40
c4  天津   40  50
"""
# 重新索引行,排序
df2 = df.reindex(index=["c4", "c3", "c2", "c1"])
print(df2)
"""
    城市   人口  收入
c4  天津   40  50
c3  南京   30  40
c2  上海   20  20
c1  北京  200  10
"""
# 重新索引列,排序
df3 = df.reindex(columns=["城市", "收入", "人口"])
print(df3)
"""
    城市  收入   人口
c1  北京  10  200
c2  上海  20   20
c3  南京  40   30
c4  天津  50   40
"""
# 插入列索引
col = df.columns.insert(3, "新增")
print(col)
"""
Index(['城市', '人口', '收入', '新增'], dtype='object')
"""
# 增加数据,默认填充200
df4 = df.reindex(columns=col, fill_value=200)
print(df4)
"""
    城市   人口  收入   新增
c1  北京  200  10  200
c2  上海   20  20  200
c3  南京   30  40  200
c4  天津   40  50  200
"""
# 删除插入索引
nc = df.columns.delete(2)
ni = df.index.insert(5, "c0")
df5 = df.reindex(index=ni, columns=nc)
print(df5)
"""
     城市     人口
c1   北京  200.0
c2   上海   20.0
c3   南京   30.0
c4   天津   40.0
c0  NaN    NaN
"""
# DataFrame删除行
df6 = df5.drop("c1")
print(df6)
"""
     城市    人口
c2   上海  20.0
c3   南京  30.0
c4   天津  40.0
c0  NaN   NaN
"""
# DataFrame删除列
df7 = df6.drop("人口", axis=1)
print(df7)
"""
     城市
c2   上海
c3   南京
c4   天津
c0  NaN
"""


相关文章
|
2月前
|
Java 数据挖掘 数据处理
(Pandas)Python做数据处理必选框架之一!(一):介绍Pandas中的两个数据结构;刨析Series:如何访问数据;数据去重、取众数、总和、标准差、方差、平均值等;判断缺失值、获取索引...
Pandas 是一个开源的数据分析和数据处理库,它是基于 Python 编程语言的。 Pandas 提供了易于使用的数据结构和数据分析工具,特别适用于处理结构化数据,如表格型数据(类似于Excel表格)。 Pandas 是数据科学和分析领域中常用的工具之一,它使得用户能够轻松地从各种数据源中导入数据,并对数据进行高效的操作和分析。 Pandas 主要引入了两种新的数据结构:Series 和 DataFrame。
402 0
|
3月前
|
数据采集 数据可视化 数据挖掘
Python数据分析实战:Pandas处理结构化数据的核心技巧
在数据驱动时代,结构化数据是分析决策的基础。Python的Pandas库凭借其高效的数据结构和丰富的功能,成为处理结构化数据的利器。本文通过真实场景和代码示例,讲解Pandas的核心操作,包括数据加载、清洗、转换、分析与性能优化,帮助你从数据中提取有价值的洞察,提升数据处理效率。
187 3
|
5月前
|
数据采集 数据可视化 搜索推荐
Python数据分析全流程指南:从数据采集到可视化呈现的实战解析
在数字化转型中,数据分析成为企业决策核心,而Python凭借其强大生态和简洁语法成为首选工具。本文通过实战案例详解数据分析全流程,涵盖数据采集、清洗、探索、建模、可视化及自动化部署,帮助读者掌握从数据到业务价值的完整技能链。
588 0
|
2月前
|
数据可视化 大数据 关系型数据库
基于python大数据技术的医疗数据分析与研究
在数字化时代,医疗数据呈爆炸式增长,涵盖患者信息、检查指标、生活方式等。大数据技术助力疾病预测、资源优化与智慧医疗发展,结合Python、MySQL与B/S架构,推动医疗系统高效实现。
|
3月前
|
数据可视化 数据挖掘 大数据
基于python大数据的水文数据分析可视化系统
本研究针对水文数据分析中的整合难、分析单一和可视化不足等问题,提出构建基于Python的水文数据分析可视化系统。通过整合多源数据,结合大数据、云计算与人工智能技术,实现水文数据的高效处理、深度挖掘与直观展示,为水资源管理、防洪减灾和生态保护提供科学决策支持,具有重要的应用价值和社会意义。
|
4月前
|
存储 数据挖掘 大数据
基于python大数据的用户行为数据分析系统
本系统基于Python大数据技术,深入研究用户行为数据分析,结合Pandas、NumPy等工具提升数据处理效率,利用B/S架构与MySQL数据库实现高效存储与访问。研究涵盖技术背景、学术与商业意义、国内外研究现状及PyCharm、Python语言等关键技术,助力企业精准营销与产品优化,具有广泛的应用前景与社会价值。
|
5月前
|
存储 监控 算法
基于 Python 跳表算法的局域网网络监控软件动态数据索引优化策略研究
局域网网络监控软件需高效处理终端行为数据,跳表作为一种基于概率平衡的动态数据结构,具备高效的插入、删除与查询性能(平均时间复杂度为O(log n)),适用于高频数据写入和随机查询场景。本文深入解析跳表原理,探讨其在局域网监控中的适配性,并提供基于Python的完整实现方案,优化终端会话管理,提升系统响应性能。
144 4
|
7月前
|
机器学习/深度学习 数据采集 数据可视化
Python数据分析,别再死磕Excel了!
Python数据分析,别再死磕Excel了!
303 2
|
SQL 数据挖掘 Python
Python—pandas中DataFrame类型数据操作函数
Python—pandas中DataFrame类型数据操作函数
388 0
|
3月前
|
数据采集 机器学习/深度学习 人工智能
Python:现代编程的首选语言
Python:现代编程的首选语言
293 102

推荐镜像

更多