文档备案控制台

开发者社区大数据文章正文

【Python数据分析 - 9】：DataFrame结构中自定义行列索引（Pandas篇）

2022-11-01 935

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 【Python数据分析 - 9】：DataFrame结构中自定义行列索引（Pandas篇）

pandas设置行列索引

本次以股票的数据为例

数据准备&DataFrame结构

模块导入

import pandas as pd
import numpy as np

numpy准备数据

stock = np.random.normal(0, 1, [500, 504])

使用pd.DataFrame()，将数据变为DataFrame结构

生成的DataFrame中默认的行列索引为数字

自定义行索引

准备行索引数据

设置行索引，在将数据变为DataFrame结构时添加：index=stock_index

结果展示

自定义列索引

pandas中时间序列 - date_range函数

函数功能：生成一个固定频率的时间索引，使用此函数时，须指定start，end或periods，否则报错。

语法：pandas.date_range(start=None, end=None, periods=None, freq=‘D’, tz=None, normalize=False, name=None, closed=None, **kwargs）

主要参数说明：

periods：固定时期，取值为整数或None，设置为整数时会从根据start的时期往后取到periods天。

freq：日期偏移量，取值为string或DateOffset，默认为’D’；当设置为’B‘时表示除去周六和周日。

normalize：若参数为True表示将start、end参数值正则化到午夜时间戳。

name：生成时间索引对象的名称，取值为string或None。

closed：当closed=‘left’ 表示在返回的结果基础上，再取左开右闭的结果；当closed='right’表示在返回的结果基础上，再取左闭右开的结果。

列索引设置

准备列索引数据

列索引数据展示

设置列索引，在将数据变为DataFrame结构时添加：columns=date

结果展示

文章标签：

Python

数据挖掘

索引

关键词：

Python数据分析

Pandas python

Python DataFrame

Pandas dataframe

Python dataframe结构

IT工藤新一

目录

相关文章

凉凉心.

|

8月前

|

Java 数据处理索引

（Pandas）Python做数据处理必选框架之一！（二）：附带案例分析；刨析DataFrame结构和其属性；学会访问具体元素；判断元素是否存在；元素求和、求标准值、方差、去重、删除、排序...

DataFrame结构每一列都属于Series类型，不同列之间数据类型可以不一样，但同一列的值类型必须一致。 DataFrame拥有一个总的 idx记录列，该列记录了每一行的索引在DataFrame中，若列之间的元素个数不匹配，且使用Series填充时，在DataFrame里空值会显示为NaN；当列之间元素个数不匹配，并且不使用Series填充，会报错。在指定了index 属性显示情况下，会按照index的位置进行排序，默认是 [0,1,2,3,...] 从0索引开始正序排序行。

凉凉心.

626 0 1

凉凉心.

|

8月前

|

Java 数据挖掘数据处理

（Pandas）Python做数据处理必选框架之一！（一）：介绍Pandas中的两个数据结构；刨析Series：如何访问数据；数据去重、取众数、总和、标准差、方差、平均值等；判断缺失值、获取索引...

Pandas 是一个开源的数据分析和数据处理库，它是基于 Python 编程语言的。 Pandas 提供了易于使用的数据结构和数据分析工具，特别适用于处理结构化数据，如表格型数据（类似于Excel表格）。 Pandas 是数据科学和分析领域中常用的工具之一，它使得用户能够轻松地从各种数据源中导入数据，并对数据进行高效的操作和分析。 Pandas 主要引入了两种新的数据结构：Series 和 DataFrame。

凉凉心.

726 0 0

陌陌谣

|

11月前

|

存储监控算法

基于 Python 跳表算法的局域网网络监控软件动态数据索引优化策略研究

局域网网络监控软件需高效处理终端行为数据，跳表作为一种基于概率平衡的动态数据结构，具备高效的插入、删除与查询性能（平均时间复杂度为O(log n)），适用于高频数据写入和随机查询场景。本文深入解析跳表原理，探讨其在局域网监控中的适配性，并提供基于Python的完整实现方案，优化终端会话管理，提升系统响应性能。

陌陌谣

292 4 4

站大爷

|

10月前

|

存储数据采集数据处理

Pandas与NumPy：Python数据处理的双剑合璧

Pandas与NumPy是Python数据科学的核心工具。NumPy以高效的多维数组支持数值计算，适用于大规模矩阵运算；Pandas则提供灵活的DataFrame结构，擅长处理表格型数据与缺失值。二者在性能与功能上各具优势，协同构建现代数据分析的技术基石。

站大爷

798 0 0

小白学大数据

|

11月前

|

数据采集存储 NoSQL

Python爬虫案例：Scrapy+XPath解析当当网网页结构

Python爬虫案例：Scrapy+XPath解析当当网网页结构

小白学大数据

533 0 0

overmind1980

|

人工智能索引 Python

[oeasy]python091_列表_索引_index_中括号_索引函数

本文介绍了Python中列表与字符串的索引及index函数用法。通过range生成列表，使用索引[]访问和修改列表元素，index函数查找元素位置。字符串支持索引访问但不可直接修改。还探讨了16进制数在Python中的表示方法，以及日期、月份等特殊字符的Unicode范围。最后总结了列表与字符串操作的区别，并预告后续内容，提供蓝桥云课、GitHub和Gitee链接供进一步学习。

overmind1980

355 20 20

站大爷

|

开发框架 Java .NET

Python中main函数：代码结构的基石

在Python中，`main`函数是程序结构化和模块化的重要组成部分。它实现了脚本执行与模块导入的分离，避免全局作用域污染并提升代码复用性。其核心作用包括：标准化程序入口、保障模块复用及支持测试驱动开发（TDD）。根据项目复杂度，`main`函数有基础版、函数封装版、参数解析版和类封装版四种典型写法。与其他语言相比，Python的`main`机制更灵活，支持同一文件作为脚本运行或模块导入。进阶技巧涵盖多文件项目管理、命令行参数处理、环境变量配置及日志集成等。此外，还需注意常见错误如全局变量污染和循环导入，并通过延迟加载、多进程支持和类型提示优化性能。

站大爷

1131 0 0

花满楼m

|

Python

python pandas学习（一）

该代码段展示了四个主要操作：1) 删除指定列名，如商品id；2) 使用正则表达式模糊匹配并删除列，例如匹配订单商品名称1的列；3) 将毫秒级时间戳转换为带有时区调整的日期时间格式，并增加8小时以适应本地时区；4) 将列表转换为DataFrame后保存为Excel文件，文件路径和名称根据变量拼接而成。

花满楼m

252 3 3

站大爷

|

存储数据挖掘数据处理

Python Pandas入门：行与列快速上手与优化技巧

Pandas是Python中强大的数据分析库，广泛应用于数据科学和数据分析领域。本文为初学者介绍Pandas的基本操作，包括安装、创建DataFrame、行与列的操作及优化技巧。通过实例讲解如何选择、添加、删除行与列，并提供链式操作、向量化处理、索引优化等高效使用Pandas的建议，帮助用户在实际工作中更便捷地处理数据。

站大爷

539 2 2

东方睿赢

|

机器学习/深度学习自然语言处理语音技术

Python在深度学习领域的应用，重点讲解了神经网络的基础概念、基本结构、训练过程及优化技巧

本文介绍了Python在深度学习领域的应用，重点讲解了神经网络的基础概念、基本结构、训练过程及优化技巧，并通过TensorFlow和PyTorch等库展示了实现神经网络的具体示例，涵盖图像识别、语音识别等多个应用场景。

东方睿赢

600 8 8

热门文章

最新文章

pandas.to_numeric转化数据为数字型

建模常用的pandas语句

Pandas获取SQL数据库read_sql()函数及参数一文详解+实例代码

成功解决pyinstaller打包AttributeError:type object pandas._TSObject has no attribute _reduce_cython_

Pandas数据合并：concat与merge

成功解决除去或展开pandas.core.frame.DataFrame输出类型中所包含的省略号(列数据或者行数据显示不完全)

python数据可视化开发(2)：pandas读取Excel的数据格式处理（数据读取、指定列数据、DataFrame转json、数学运算、透视表运算输出）

使用Python的Pandas库进行数据透视表（pivot table）操作

Pandas如何将多个Dataframe格式数据放入一个Excel或csv中

Pandas数据处理1、DataFrame删除NaN空值(dropna各种属性值控制超全)

基于python大数据的台风灾害分析及预测系统

基于Python大数据的热门游戏推荐系统

基于python大数据的青少年网络使用情况分析及预测系统

2026版基于python大数据的电影分析可视化系统

基于Python大数据的的电商用户行为分析系统

基于python大数据技术的医疗数据分析与研究

基于python大数据深度学习的酒店评论文本情感分析系统

Python SQLAlchemy模块：从入门到实战的数据库操作指南

基于python大数据的的海洋气象数据可视化平台

基于Python大数据的主流汽车价格分析可视化系统

相关课程

更多

Python Web开发基础

Python爬虫实战

Python常用数据科学库

Python网络爬虫实战

Python完全自学手册图文教程

Python基础快速入门实战教程

相关电子书

更多

From Python Scikit-Learn to Sc

Data Pre-Processing in Python:

双剑合璧-Python和大数据计算平台的结合

推荐镜像

更多

python-release

下一篇

小红书笔记详情API深度解析与实战指南（2025年最新版）