开发者社区> 问答> 正文

Python中的Pandas是什么?

Python中的Pandas是什么?

展开
收起
鲁花花生油 2021-10-22 15:21:36 812 0
来自:华章出版社
1 条回答
写回答
取消 提交回答
  • Pandas这个名字源于panel data(面板数据,这是计量经济学中关于多维结构化数据集的一个术语),也是Python data analysis(Python数据分析)的简写。 Pandas处理以下三种数据结构:

    系列(Series)。

    数据帧(DataFrame)。

    面板(Panel)。

    这些数据结构都构建在NumPy数组之上。其中,Series为一维数组,与NumPy中的一维array类似,二者与Python基本的数据结构List也很相近。Series如今能保存不同的数据类型,包括字符串、布尔值、数字等;DataFrame是二维的表格型数据结构,其很多功能与R语言中的data.frame类似,可以将DataFrame理解为Series的容器;Panel是三维的数组,可以理解为DataFrame的容器。

    Pandas提供了使我们能够快速、便捷地处理结构化数据的大量数据结构和函数,是数据科学中重要的Python库。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一。它用来操作数据和分析数据,很适合不同类型的数据,如表格、有序时间序列、无序时间序列、矩阵等。

    此外,Pandas兼具NumPy高性能的数组计算功能以及电子表格和关系型数据库(如SQL)灵活的数据处理功能。它提供了复杂而精细的索引功能,以便更为便捷地完成重塑、切片和切块、聚合以及选取数据子集等操作。

    资料来源:《Python机器学习》,文章链接:https://developer.aliyun.com/article/727175

    2021-10-22 16:05:30
    赞同 展开评论 打赏
问答分类:
问答标签:
问答地址:
来源圈子
更多
收录在圈子:
+ 订阅
问答排行榜
最热
最新

相关电子书

更多
Data Pre-Processing in Python: 立即下载
即学即用的Pandas入门与时间序列分析 立即下载
双剑合璧-Python和大数据计算平台的结合 立即下载