2.2.2 pandas
pandas的名称院子面板数据(panel data)和Python数据分析(Data Analysis),最初是被作为金融数据分析工具而开发出来的,由AQP Capital Managent于2008年4月开发,并于2009年底开源。
pandas是Python的核心数据分析支持库,提供了快速、灵活、明确的数据结构,旨在简单且直观地处理关系型、标记型数据。pandas与其他第三方科学计算支持库也能够完美地集成。pandas还包含了高级的数据结构和精巧的工具,使得在Python中处理数据非常快速和简单。pandas中常用的数据结构为Series(一维数据)与DataFrance(二维数据),这两种数据结构足以处理金融、统计、社会科学、工程等领域里的大多数典型用例。
pandas的功能非常强大,可提供高性能的矩阵运算,可用于数据挖掘和数据分析,同时提供数据清洗功能,支持类似SQL的树据增、删、查、改,并且带有丰富的数据处理函数,支持时间序列分析功能,支持灵活处理缺失数据等。