Pandas数据存储

简介: Pandas数据存取Pandas可以存取多种介质类型数据,例如:内存、文本、CSV、JSON、HTML、Excel、HDF5、SQL等生成数据import numpy as np import pandas as pddf = pd.

Pandas数据存取

Pandas可以存取多种介质类型数据,例如:内存、文本、CSV、JSON、HTML、Excel、HDF5、SQL等

生成数据

import numpy as np 
import pandas as pd

df = pd.DataFrame(np.random.randn(1000, 4), columns = ['A', 'B', 'C', 'D'])

df.head()
A B C D
0 -0.132774 -2.420509 0.559352 -0.561248
1 1.114528 0.253100 -0.677942 0.103792
2 0.979150 0.377479 0.083386 -0.107285
3 -0.176661 0.096700 0.841432 0.124089
4 1.488258 0.209315 0.602946 0.441837
df02 = pd.date_range()

Pandas存取CSV

写入CSV

df.to_csv('foo01.csv')
# 不保存行索引
df.to_csv('foo02.csv', index=False)

读取CSV

read_csv = pd.read_csv('foo02.csv')
read_csv.head()
A B C D
0 -0.132774 -2.420509 0.559352 -0.561248
1 1.114528 0.253100 -0.677942 0.103792
2 0.979150 0.377479 0.083386 -0.107285
3 -0.176661 0.096700 0.841432 0.124089
4 1.488258 0.209315 0.602946 0.441837

读取CSV其他参数

pd.read_csv(
    'foo02.csv', # 文件名
    usecols=[0,1,2,4], # 读取指定列
    nrows=5, # 读取前几行
    encoding='GBK' # 编码,根据文本编码修改,默认utf-8,可以指定为GBK
)
A B C D
0 -0.132774 -2.420509 0.559352 NaN
1 1.114528 0.253100 -0.677942 NaN
2 0.979150 0.377479 0.083386 NaN
3 -0.176661 0.096700 0.841432 NaN
4 1.488258 0.209315 0.602946 NaN
x = pd.read_csv(
    'foo02.csv',
    parse_dates = {'timestamp': ['data','time']}, # 将两列合并解析为时间格式
    index_col = 'timestamp' # 将时间设为行索引
)
  • csv文件内有汉字等特殊符号时,csv文件编码应为utf-8(无BOM)可默认正常读取,如果编码是ANSI,加参数encoding=’GBK’
  • 数据内有逗号时,左右加英文半角双引号,可以正常解析

Pandas存取HDF5

写入HDF5

df.to_hdf('foo.h5', 'df')

从HDF5读取

pd.read_hdf('foo.h5', 'df')

Pandas存取Excel(xlsx)

写入Excel文件

df.to_excel('foo.xlsx', sheet_name='Sheet1')

从Excel文件读取

pd.read_excel('foo.xlsx', 'Sheet1', index_col=None, na_values=['NA'])
目录
相关文章
|
7月前
|
数据挖掘 数据处理 索引
pandas及常见数据处理基础
欢迎关注我的微信公众号:Python学习杂记
|
6月前
|
存储 数据挖掘 数据处理
Pandas Excel数据处理指南
在数据处理和分析的过程中,Excel是一个非常常见的工具。然而,当数据量变大,操作复杂度增加时,Excel的效率和功能可能无法满足需求。Pandas是一个强大的Python数据处理库,可以轻松地读取、处理和分析Excel文件中的数据。本指南将介绍如何使用Pandas进行Excel数据处理,并展示一些常见的操作和技巧。
|
8月前
|
存储 SQL 大数据
Pandas DataFrame 数据存储格式比较
Pandas 支持多种存储格式,在本文中将对不同类型存储格式下的Pandas Dataframe的读取速度、写入速度和大小的进行测试对比。
139 0
|
9月前
|
存储 数据挖掘 索引
【Pandas数据分析1】pandas数据结构
【Pandas数据分析1】pandas数据结构
84 0
|
7月前
|
数据采集 数据处理 数据库
pandas 数据处理
pandas 数据处理
82 0
|
7月前
|
数据处理 索引 Python
pandas 数据处理汇总(上)
pandas 数据处理汇总(上)
|
7月前
|
数据可视化 数据处理 Python
pandas 数据处理汇总(下)
pandas 数据处理汇总(下)
|
7月前
|
数据处理 索引 Python
pandas 数据处理汇总(中)
pandas 数据处理汇总(中)
|
9月前
|
算法 数据挖掘 Python
Pandas数据转换处理
Pandas数据转换处理
74 0
|
9月前
|
存储 SQL JSON
Pandas数据读写操作
Pandas数据读写操作
59 1