备案控制台

开发者社区大数据文章正文

深度之眼（二十）——Python：Pandas库(上）

2023-01-31 212

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 深度之眼（二十）——Python：Pandas库(上）

零、导读

零、引子

Numpy在向量化的数值计算中表现优异

但是在处理更灵活、复杂的数据任务:

如为数据添加标签、处理缺失值、分组和透视表等方面

Numpy显得力不从心

而基于Numpy构建的Pandas库，提供了使得数据分析变得更快更简单的高级数据结构和操作工具

一、对象的创建

1.1 一维数组（Series）

通用结构

import pandas as pd
data = pd.Series([1.5,3,4.5,6])
data

data = pd.Series([5,6,7,8],index=["a","b","c","d"],dtype = "float")
data

data["a"]

2、用一维numpy数组创建

import numpy as np
x = np.arange(5)
pd.Series(x)

3.用字典创建

.默认以键为index值为data

●字典创建，如果指定index，则会到字典的键中筛选，找不到的，值设为NaN

4、data为标量的情况

pd.Series(5,[100,200,300])

1.2 多维数组

DataFrame是带标签数据的多维数组

DataFrame对象的创建

通用结构pd .DataFrame(data, index=index, columns=columns)

data:数据，可以是列表，字典或Numpy数组

index:索引，为可选参数

columns:列标签，为可选参数

p_d = {
    "a":1,
    "b":5,
    "c":7,
    "d":6
}
p = pd.Series(p_d)
pd.DataFrame(p)

2.通过Series对象字典创建

3.通过宇典列表对象创建

●不存在的键，会默认值为NaN

4、通过Numpy二维数组创建

二、DataFrame性质

2.1 属性

2.2 索引

7a399525ddec4b77923c464820b33738 (1).png

3、切片

7a399525ddec4b77923c464820b33738 (1).png

文章标签：

Python

数据挖掘

索引

关键词：

Python库

Pandas python

Python Pandas

Pandas库

Python pandas库

周末不下雨

目录

相关文章

凉凉心.

|

2月前

|

Java 数据处理索引

（Pandas）Python做数据处理必选框架之一！（二）：附带案例分析；刨析DataFrame结构和其属性；学会访问具体元素；判断元素是否存在；元素求和、求标准值、方差、去重、删除、排序...

DataFrame结构每一列都属于Series类型，不同列之间数据类型可以不一样，但同一列的值类型必须一致。 DataFrame拥有一个总的 idx记录列，该列记录了每一行的索引在DataFrame中，若列之间的元素个数不匹配，且使用Series填充时，在DataFrame里空值会显示为NaN；当列之间元素个数不匹配，并且不使用Series填充，会报错。在指定了index 属性显示情况下，会按照index的位置进行排序，默认是 [0,1,2,3,...] 从0索引开始正序排序行。

凉凉心.

274 0 0

凉凉心.

|

2月前

|

Java 数据挖掘数据处理

（Pandas）Python做数据处理必选框架之一！（一）：介绍Pandas中的两个数据结构；刨析Series：如何访问数据；数据去重、取众数、总和、标准差、方差、平均值等；判断缺失值、获取索引...

Pandas 是一个开源的数据分析和数据处理库，它是基于 Python 编程语言的。 Pandas 提供了易于使用的数据结构和数据分析工具，特别适用于处理结构化数据，如表格型数据（类似于Excel表格）。 Pandas 是数据科学和分析领域中常用的工具之一，它使得用户能够轻松地从各种数据源中导入数据，并对数据进行高效的操作和分析。 Pandas 主要引入了两种新的数据结构：Series 和 DataFrame。

凉凉心.

432 0 0

虫无涯

|

3月前

|

存储人工智能测试技术

如何使用LangChain的Python库结合DeepSeek进行多轮次对话？

本文介绍如何使用LangChain结合DeepSeek实现多轮对话，测开人员可借此自动生成测试用例，提升自动化测试效率。

虫无涯

495 125 130

如何使用LangChain的Python库结合DeepSeek进行多轮次对话？

站大爷

|

3月前

|

监控数据可视化数据挖掘

Python Rich库使用指南：打造更美观的命令行应用

Rich库是Python的终端美化利器，支持彩色文本、智能表格、动态进度条和语法高亮，大幅提升命令行应用的可视化效果与用户体验。

站大爷

240 0 0

mashukui

|

2月前

|

数据可视化关系型数据库 MySQL

【可视化大屏】全流程讲解用python的pyecharts库实现拖拽可视化大屏的背后原理，简单粗暴！

本文详解基于Python的电影TOP250数据可视化大屏开发全流程，涵盖爬虫、数据存储、分析及可视化。使用requests+BeautifulSoup爬取数据，pandas存入MySQL，pyecharts实现柱状图、饼图、词云图、散点图等多种图表，并通过Page组件拖拽布局组合成大屏，支持多种主题切换，附完整源码与视频讲解。

mashukui

257 4 4

【可视化大屏】全流程讲解用python的pyecharts库实现拖拽可视化大屏的背后原理，简单粗暴！

Deephub

|

2月前

|

传感器运维前端开发

Python离群值检测实战：使用distfit库实现基于分布拟合的异常检测

本文解析异常（anomaly）与新颖性（novelty）检测的本质差异，结合distfit库演示基于概率密度拟合的单变量无监督异常检测方法，涵盖全局、上下文与集体离群值识别，助力构建高可解释性模型。

Deephub

326 10 10

Python离群值检测实战：使用distfit库实现基于分布拟合的异常检测

蓝易云

|

4月前

|

运维 Linux 开发者

Linux系统中使用Python的ping3库进行网络连通性测试

以上步骤展示了如何利用 Python 的 `ping3` 库来检测网络连通性，并且提供了基本错误处理方法以确保程序能够优雅地处理各种意外情形。通过简洁明快、易读易懂、实操性强等特点使得该方法非常适合开发者或系统管理员快速集成至自动化工具链之内进行日常运维任务之需求满足。

蓝易云

265 18 18

Deephub

|

4月前

|

机器学习/深度学习 API 异构计算

JAX快速上手：从NumPy到GPU加速的Python高性能计算库入门教程

JAX是Google开发的高性能数值计算库，旨在解决NumPy在现代计算需求下的局限性。它不仅兼容NumPy的API，还引入了自动微分、GPU/TPU加速和即时编译（JIT）等关键功能，显著提升了计算效率。JAX适用于机器学习、科学模拟等需要大规模计算和梯度优化的场景，为Python在高性能计算领域开辟了新路径。

Deephub

404 0 0

JAX快速上手：从NumPy到GPU加速的Python高性能计算库入门教程

站大爷

|

4月前

|

存储数据采集数据处理

Pandas与NumPy：Python数据处理的双剑合璧

Pandas与NumPy是Python数据科学的核心工具。NumPy以高效的多维数组支持数值计算，适用于大规模矩阵运算；Pandas则提供灵活的DataFrame结构，擅长处理表格型数据与缺失值。二者在性能与功能上各具优势，协同构建现代数据分析的技术基石。

站大爷

389 0 0

武子康

|

Python

pip批量安装Python库 requirement.txt 离线环境无互联网环境下pip安装Python库

pip批量安装Python库 requirement.txt 离线环境无互联网环境下pip安装Python库

武子康

900 3 3

热门文章

最新文章

基于Python深度学习的【蘑菇识别】系统~卷积神经网络+TensorFlow+图像识别+人工智能

Python3.6.3安装详细简单完整版

手把手教你使用Python爬取西刺代理数据（下篇）

打开文件 | Python从入门到精通：高阶篇之四十四

python 循环语句

python常用模块补充

Python基本语法_函数属性 & 参数类型 & 偏函数的应用

OpenCV(图像处理)-基于Python-特征检测-特征点匹配

人工智能AI库Spleeter免费人声和背景音乐分离实践(Python3.10)

【错误记录】Mac 中 IntelliJ IDEA 运行 Python 程序报错 ( End of statement expected )

（Pandas）Python做数据处理必选框架之一！（二）：附带案例分析；刨析DataFrame结构和其属性；学会访问具体元素；判断元素是否存在；元素求和、求标准值、方差、去重、删除、排序...

（Pandas）Python做数据处理必选框架之一！（一）：介绍Pandas中的两个数据结构；刨析Series：如何访问数据；数据去重、取众数、总和、标准差、方差、平均值等；判断缺失值、获取索引...

Pandas与NumPy：Python数据处理的双剑合璧

告别低效代码：用对这10个Pandas方法让数据分析效率翻倍

Pandas时间数据处理：从基础到进阶的实战指南

Pandas时间数据处理：从基础到进阶的实战指南

Pandas数据合并：10种高效连接技巧与常见问题

Pandas高级数据处理：数据仪表板制作

Pandas高级数据处理：数据报告生成

Pandas高级数据处理：交互式数据探索

相关课程

更多

Python Web开发基础

Python爬虫实战

Python开发基础入门

Python常用数据科学库

Python网络爬虫实战

Python完全自学手册图文教程

相关电子书

更多

Data Pre-Processing in Python:

即学即用的Pandas入门与时间序列分析

双剑合璧-Python和大数据计算平台的结合

推荐镜像

更多

python-release

下一篇

阿里云服务器快照备份数据怎么下载到本地保存？