Python数据分析与展示:DataFrame类型简单操作-9

简介: Python数据分析与展示:DataFrame类型简单操作-9

DataFrame类型

DataFrame类型由共用相同索引的一组列组成


DataFrame是一个表格型的数据类型,每列值类型可以不同

DataFrame既有行索引、也有列索引

index axis=0

axis=1 column

DataFrame常用于表达二维数据,但可以表达多维数据


DataFrame类型可以由如下类型创建:


二维ndarray对象

由一维ndarray、列表、字典、元组或Series构成的字典

Series类型

其他的DataFrame类型

DataFrame是二维带“标签”数组


DataFrame基本操作类似Series,依据行列索引


代码示例

# -*- coding: utf-8 -*-
# @File    : dataframe_demo.py
# @Date    : 2018-05-20
import pandas as pd
import numpy as np
# DataFrame对象
# 从二维ndarray对象创建  自动行、列索引
df = pd.DataFrame(np.arange(10).reshape(2, 5))
print(df)
"""
   0  1  2  3  4
0  0  1  2  3  4
1  5  6  7  8  9
"""
# 从一维ndarray对象字典创建
dt = {
    "one": pd.Series([1, 2, 3], index=["a", "b", "c"]),
    "two": pd.Series([5, 6, 7, 8], index=["a", "b", "c", "d"])
      }
df = pd.DataFrame(dt)
print(dt)
"""
{
    'one':
    a    1
    b    2
    c    3
    dtype: int64, 
    'two': 
    a    5
    b    6
    c    7
    d    8
    dtype: int64
}
"""
# 数据根据行列索引自动补齐
df = pd.DataFrame(dt, index=["a", "b", "c"], columns=["one", "two"])
print(df)
"""
   one  two
a    1    5
b    2    6
c    3    7
"""
# 从列表类型的字典创建
dt = {
    "one": [1, 2, 3, 4],
    "two": [5, 6, 7, 9]
      }
df = pd.DataFrame(dt, index=["a", "b", "c", "d"])
print(df)
"""
   one  two
a    1    5
b    2    6
c    3    7
d    4    9
"""
# 获取行索引
print(df.index)
# Index(['a', 'b', 'c', 'd'], dtype='object')
# 获取列索引
print(df.columns)
# Index(['one', 'two'], dtype='object')
# 获取值
print(df.values)
"""
[[1 5]
 [2 6]
 [3 7]
 [4 9]]
"""
# 获取列
print(df["one"])
"""
a    1
b    2
c    3
d    4
Name: one, dtype: int64
"""
#获取行
print(df.ix["a"])
"""
one    1
two    5
Name: a, dtype: int64
"""
# 获取某单元格的值
print(df["one"]["a"])
# 1
相关文章
|
2月前
|
Java 数据处理 索引
(Pandas)Python做数据处理必选框架之一!(二):附带案例分析;刨析DataFrame结构和其属性;学会访问具体元素;判断元素是否存在;元素求和、求标准值、方差、去重、删除、排序...
DataFrame结构 每一列都属于Series类型,不同列之间数据类型可以不一样,但同一列的值类型必须一致。 DataFrame拥有一个总的 idx记录列,该列记录了每一行的索引 在DataFrame中,若列之间的元素个数不匹配,且使用Series填充时,在DataFrame里空值会显示为NaN;当列之间元素个数不匹配,并且不使用Series填充,会报错。在指定了index 属性显示情况下,会按照index的位置进行排序,默认是 [0,1,2,3,...] 从0索引开始正序排序行。
250 0
|
3月前
|
数据采集 数据可视化 数据挖掘
Python数据分析实战:Pandas处理结构化数据的核心技巧
在数据驱动时代,结构化数据是分析决策的基础。Python的Pandas库凭借其高效的数据结构和丰富的功能,成为处理结构化数据的利器。本文通过真实场景和代码示例,讲解Pandas的核心操作,包括数据加载、清洗、转换、分析与性能优化,帮助你从数据中提取有价值的洞察,提升数据处理效率。
187 3
|
5月前
|
数据采集 数据可视化 搜索推荐
Python数据分析全流程指南:从数据采集到可视化呈现的实战解析
在数字化转型中,数据分析成为企业决策核心,而Python凭借其强大生态和简洁语法成为首选工具。本文通过实战案例详解数据分析全流程,涵盖数据采集、清洗、探索、建模、可视化及自动化部署,帮助读者掌握从数据到业务价值的完整技能链。
588 0
|
2月前
|
数据可视化 大数据 关系型数据库
基于python大数据技术的医疗数据分析与研究
在数字化时代,医疗数据呈爆炸式增长,涵盖患者信息、检查指标、生活方式等。大数据技术助力疾病预测、资源优化与智慧医疗发展,结合Python、MySQL与B/S架构,推动医疗系统高效实现。
|
3月前
|
数据可视化 数据挖掘 大数据
基于python大数据的水文数据分析可视化系统
本研究针对水文数据分析中的整合难、分析单一和可视化不足等问题,提出构建基于Python的水文数据分析可视化系统。通过整合多源数据,结合大数据、云计算与人工智能技术,实现水文数据的高效处理、深度挖掘与直观展示,为水资源管理、防洪减灾和生态保护提供科学决策支持,具有重要的应用价值和社会意义。
|
4月前
|
存储 数据挖掘 大数据
基于python大数据的用户行为数据分析系统
本系统基于Python大数据技术,深入研究用户行为数据分析,结合Pandas、NumPy等工具提升数据处理效率,利用B/S架构与MySQL数据库实现高效存储与访问。研究涵盖技术背景、学术与商业意义、国内外研究现状及PyCharm、Python语言等关键技术,助力企业精准营销与产品优化,具有广泛的应用前景与社会价值。
|
7月前
|
机器学习/深度学习 数据采集 数据可视化
Python数据分析,别再死磕Excel了!
Python数据分析,别再死磕Excel了!
303 2
|
机器学习/深度学习 数据采集 数据可视化
基于爬虫和机器学习的招聘数据分析与可视化系统,python django框架,前端bootstrap,机器学习有八种带有可视化大屏和后台
本文介绍了一个基于Python Django框架和Bootstrap前端技术,集成了机器学习算法和数据可视化的招聘数据分析与可视化系统,该系统通过爬虫技术获取职位信息,并使用多种机器学习模型进行薪资预测、职位匹配和趋势分析,提供了一个直观的可视化大屏和后台管理系统,以优化招聘策略并提升决策质量。
839 4
|
数据采集 数据可视化 数据挖掘
数据分析大神养成记:Python+Pandas+Matplotlib助你飞跃!
在数字化时代,数据分析至关重要,而Python凭借其强大的数据处理能力和丰富的库支持,已成为该领域的首选工具。Python作为基石,提供简洁语法和全面功能,适用于从数据预处理到高级分析的各种任务。Pandas库则像是神兵利器,其DataFrame结构让表格型数据的处理变得简单高效,支持数据的增删改查及复杂变换。配合Matplotlib这一数据可视化的魔法棒,能以直观图表展现数据分析结果。掌握这三大神器,你也能成为数据分析领域的高手!
250 2
|
机器学习/深度学习 算法 数据挖掘
2023 年第二届钉钉杯大学生大数据挑战赛初赛 初赛 A:智能手机用户监测数据分析 问题二分类与回归问题Python代码分析
本文介绍了2023年第二届钉钉杯大学生大数据挑战赛初赛A题的Python代码分析,涉及智能手机用户监测数据分析中的聚类分析和APP使用情况的分类与回归问题。
347 0
2023 年第二届钉钉杯大学生大数据挑战赛初赛 初赛 A:智能手机用户监测数据分析 问题二分类与回归问题Python代码分析

推荐镜像

更多