Python数据分析:pandas玩转Excel(一)

简介: Python数据分析:pandas玩转Excel(一)

1 pandas简介


1.Pandas是什么?


Pandas是一个强大的分析结构化数据的工具集;


它的使用基础是Numpy(提供高性能的矩阵运算);


用于数据挖掘和数据分析,同时也提供数据清洗功能。

2.DataFrame


DataFrame是Pandas中的一个表格型的数据结构,包含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔型等),DataFrame即有行索引也有列索引,可以被看做是由Series组成的字典。


pandas 相当于 python 中 excel:它使用表(也就是 dataframe),能在数据上做各种变换,但还有其他很多功能。


class pandas.DataFrame(data=None, index=None, columns=None, dtype=None, copy=False)


image.png


3.Series


它是一种类似于一维数组的对象,是由一组数据(各种NumPy数据类型)以及一组与之相关的数据标签(即索引)组成。仅由一组数据也可产生简单的Series对象。


4.pandas 网址


官网:https://pandas.pydata.org/


中文网:https://www.pypandas.cn/


2 导入


image.png


还需要执行以下导入才能开始:


import pandas as pd
import numpy as np


3 使用

# 使用Pandas
>>> import pandas as pd
>>> df = pd.DataFrame() 
>>> print(df)
# 输出结果
Empty DataFrame
Columns: []
Index: []

4 读取、写入

import pandas as pd
df = pd.read_excel("D:/项目/资料/People.xlsx")     # 把文件读到内存中形成DataFrame
print(df.shape)     # 读取文件行数和列数
print(df.columns)   # 读取列名
print(df.head(3))   # 打印前3行
print(df.tail(3))   # 打印后3行
df = pd.DataFrame({"ID":[1,2,3],"Name":["jack","小明","小红"]})
df = df.set_index("ID")     # 把ID那一列当索引,并产生新的DataFrame
df.to_excel("D:/项目/我爱你.xlsx")   # 写入文件
print("Done!")
目录
相关文章
|
1天前
|
存储 小程序 数据处理
【Python】—— pandas数据处理
【Python】—— pandas数据处理
11 1
|
1天前
|
数据可视化 数据挖掘 BI
【Python】—— pandas 数据分析
【Python】—— pandas 数据分析
7 1
|
1天前
|
存储 索引 Python
【Python】—— Pandas 初体验(二)
【Python】—— Pandas 初体验(二)
6 1
|
3天前
|
数据采集 数据可视化 数据挖掘
如何利用Python中的Pandas库进行数据分析和可视化
Python的Pandas库是一种功能强大的工具,可以用于数据分析和处理。本文将介绍如何使用Pandas库进行数据分析和可视化,包括数据导入、清洗、转换以及基本的统计分析和图表绘制。通过学习本文,读者将能够掌握利用Python中的Pandas库进行高效数据处理和可视化的技能。
|
4天前
|
数据采集 数据可视化 数据挖掘
【新手解答】Python中Pandas的初学者笔记
【新手解答】Python中Pandas的初学者笔记
5 0
|
5天前
|
机器学习/深度学习 数据可视化 算法
使用Python进行数据分析的5个必备技巧
【5月更文挑战第9天】本文介绍了Python数据分析的五个关键技巧:1) 使用Pandas进行数据处理和清洗;2) 利用NumPy进行高效数值计算;3) 通过Matplotlib和Seaborn创建可视化图表;4) 使用Scikit-learn执行机器学习任务;5) 在Jupyter Notebook中进行交互式分析和文档分享。这些技巧能提升数据分析的效率和准确性。
|
6天前
|
数据采集 数据可视化 数据挖掘
Python 与 PySpark数据分析实战指南:解锁数据洞见
Python 与 PySpark数据分析实战指南:解锁数据洞见
|
7天前
|
存储 JavaScript 前端开发
Python网络数据抓取(5):Pandas
Python网络数据抓取(5):Pandas
29 8
|
8天前
|
机器学习/深度学习 运维 算法
Python数据分析中的异常检测与处理方法
在Python数据分析中,异常数据是一个常见但又十分重要的问题。本文将介绍几种常见的异常检测与处理方法,包括基于统计学方法、机器学习方法以及深度学习方法。通过对异常数据的有效检测与处理,可以提高数据分析的准确性和可信度,从而更好地指导业务决策。
|
3月前
|
存储 数据可视化 数据挖掘
Python在数据分析中的利器:Pandas库全面解析
【2月更文挑战第7天】 众所周知,Python作为一种简洁、易学且功能强大的编程语言,被广泛运用于数据科学和人工智能领域。而Pandas库作为Python中最受欢迎的数据处理库之一,在数据分析中扮演着举足轻重的角色。本文将全面解析Pandas库的基本功能、高级应用以及实际案例,带您深入了解这个在数据分析领域的利器。
74 1