数据分析处理库Pandas-Series结构

简介: 数据分析处理库Pandas-Series结构

Series是DataFrame的一个子结构,把DataFrame中的某一列或者某几列单独拿出来就是一个Series结构,相当于Numpy当中ndarray


导入pandas库


import pandas as pd


我们以一个csv文件来演示Series的作用:fandango_score_comparison.csv


导入csv文件fandango_score_comparision.csv


fandango = pd.read_csv("fandango_score_comparison.csv")


1、取出一个series


①查看series的类型


series_film = fandango["FILM"]
print(type(series_film))


OUT:


<class 'pandas.core.series.Series'>


②取出一个series中的前5行


series_rt = fandango["RottenTomatoes"]
print(series_rt[:5])


OUT:


0    74
1    85
2    80
3    18
4    14
Name: RottenTomatoes, dtype: int64


2、创建一个series


from pandas import Series
film_name = series_film.values
rt_score =series_rt.values
#依据film_name给rt_score建立新的索引
series_custom = Series(rt_score, index=film_name)


①查看索引值为”Minious (2015)”和”Leviathan (2014)”的rt_score


series_custom[["Minions (2015)", "Leviathan (2014)"]]


OUT:


Minions (2015)      54
Leviathan (2014)    99
dtype: int64


②查看索引值5-10的rt_score


series_custom[5:10]


OUT:


The Water Diviner (2015)        63
Irrational Man (2015)           42
Top Five (2014)                 86
Shaun the Sheep Movie (2015)    99
Love & Mercy (2015)             89
dtype: int64


3、按照索引值排序


①普通方法


original_index = series_custom.index.tolist()
sort_index = sorted(original_index)
sort_by_index = series_custom.reindex(sort_index)
print(sort_by_index[:10])


OUT:


'71 (2015)                    97
5 Flights Up (2015)           52
A Little Chaos (2015)         40
A Most Violent Year (2014)    90
About Elly (2015)             97
Aloha (2015)                  19
American Sniper (2015)        72
American Ultra (2015)         46
Amy (2015)                    97
Annie (2014)                  27
dtype: int64


②series方法


sort_series_index = series_custom.sort_index()
print(sort_series_index[:10])


OUT:


'71 (2015)                    97
5 Flights Up (2015)           52
A Little Chaos (2015)         40
A Most Violent Year (2014)    90
About Elly (2015)             97
Aloha (2015)                  19
American Sniper (2015)        72
American Ultra (2015)         46
Amy (2015)                    97
Annie (2014)                  27
dtype: int64
相关文章
|
15天前
|
数据采集 SQL 数据可视化
使用Pandas进行高效数据分析
【6月更文挑战第1天】Pandas是Python数据分析的核心库,基于NumPy,提供高效的数据结构如Series和DataFrame。它支持数据加载(CSV、Excel、SQL等)、清洗、预处理、探索、可视化及时间序列分析。通过实例展示了如何加载CSV文件,填充缺失值,进行数据统计和按部门平均薪资的可视化。Pandas与Matplotlib等库集成,简化了数据分析流程,对数据科学家和分析师极其重要。
|
4天前
|
数据采集 数据可视化 数据挖掘
数据分析大神养成记:Python+Pandas+Matplotlib助你飞跃!
【6月更文挑战第12天】在数字时代,Python因其强大的数据处理能力和易用性成为数据分析首选工具。结合Pandas(用于高效数据处理)和Matplotlib(用于数据可视化),能助你成为数据分析专家。Python处理数据预处理、分析和可视化,Pandas的DataFrame简化表格数据操作,Matplotlib则提供丰富图表展示数据。掌握这三个库,数据分析之路将更加畅通无阻。
|
4天前
|
JSON 数据挖掘 API
数据分析实战丨基于pygal与requests分析GitHub最受欢迎的Python库
数据分析实战丨基于pygal与requests分析GitHub最受欢迎的Python库
17 2
|
14天前
|
Python 数据挖掘 数据可视化
Python数据分析——Pandas与Jupyter Notebook
【6月更文挑战第1天】 本文探讨了如何使用Python的Pandas库和Jupyter Notebook进行数据分析。首先,介绍了安装和设置步骤,然后展示了如何使用Pandas的DataFrame进行数据加载、清洗和基本分析。接着,通过Jupyter Notebook的交互式环境,演示了数据分析和可视化,包括直方图的创建。文章还涉及数据清洗,如处理缺失值,并展示了如何进行高级数据分析,如数据分组和聚合。此外,还提供了将分析结果导出到文件的方法。通过销售数据的完整案例,详细说明了从加载数据到可视化和结果导出的全过程。最后,讨论了进一步的分析和可视化技巧,如销售额趋势、产品销售排名和区域分布,以及
34 2
|
18天前
|
数据采集 SQL 数据处理
Python中的Pandas库:数据处理与分析的利器
Python中的Pandas库:数据处理与分析的利器
30 0
|
18天前
|
存储 并行计算 数据挖掘
Python中的NumPy库:科学计算与数据分析的基石
Python中的NumPy库:科学计算与数据分析的基石
68 0
|
19天前
|
数据采集 数据挖掘 数据处理
Python数据分析实战:使用Pandas处理Excel文件
Python数据分析实战:使用Pandas处理Excel文件
96 0
|
19天前
|
数据采集 数据可视化 数据处理
Python中的高效数据处理:Pandas库详解
Python中的高效数据处理:Pandas库详解
35 2
|
19天前
|
数据采集 SQL 数据可视化
使用Python和Pandas库进行数据分析的入门指南
使用Python和Pandas库进行数据分析的入门指南
77 0
|
19天前
|
数据采集 SQL 存储
使用Python和Pandas进行数据分析
使用Python和Pandas进行数据分析
24 0