DataFrame

简介: 【10月更文挑战第15天】

Pandas 是 Python 中用于数据分析和操作的一个强大库,它提供了多种函数来读取不同格式的数据文件,并将这些数据转换为 DataFrame 对象,DataFrame 是 Pandas 中用于存储和操作结构化数据的主要数据结构。

以下是 Pandas 提供的一些常用数据读取函数的详细说明和使用示例:

1. pd.read_csv(filename)

这个函数用于读取 CSV(逗号分隔值)文件,并将其转换为 DataFrame。

是什么:读取 CSV 文件。
怎么用:你需要提供 CSV 文件的路径或 URL。
代码示例

import pandas as pd

# 读取本地 CSV 文件
df_csv = pd.read_csv('path/to/your/file.csv')

# 读取网上的 CSV 文件
df_csv = pd.read_csv('https://example.com/data.csv')

print(df_csv)

2. pd.read_excel(filename)

这个函数用于读取 Excel 文件,并将其转换为 DataFrame。

是什么:读取 Excel 文件。
怎么用:你需要提供 Excel 文件的路径。
代码示例

# 读取 Excel 文件
df_excel = pd.read_excel('path/to/your/file.xlsx')

print(df_excel)

3. pd.read_sql(query, connection_object)

这个函数用于从 SQL 数据库中读取数据,并将其转换为 DataFrame。

是什么:从 SQL 数据库读取数据。
怎么用:你需要提供 SQL 查询语句和数据库连接对象。
代码示例

import sqlite3
import pandas as pd

# 创建数据库连接
conn = sqlite3.connect('path/to/your/database.db')

# SQL 查询语句
query = 'SELECT * FROM your_table'

# 从 SQL 数据库读取数据
df_sql = pd.read_sql(query, conn)

# 关闭数据库连接
conn.close()

print(df_sql)

4. pd.read_json(json_string)

这个函数用于从 JSON 字符串中读取数据,并将其转换为 DataFrame。

是什么:从 JSON 字符串读取数据。
怎么用:你需要提供 JSON 格式的字符串。
代码示例

# JSON 字符串
json_str = '[{"name": "John", "age": 30}, {"name": "Anna", "age": 28}]'

# 从 JSON 字符串读取数据
df_json = pd.read_json(json_str)

print(df_json)

5. pd.read_html(url)

这个函数用于从 HTML 页面中读取表格数据,并将其转换为 DataFrame。

是什么:从 HTML 页面读取表格数据。
怎么用:你需要提供包含表格数据的 HTML 页面的 URL。
代码示例

# 从 HTML 页面读取表格数据
df_html = pd.read_html('https://example.com/data.html')

# 如果页面中有多个表格,返回的将是一个 DataFrame 的列表
# 选择第一个 DataFrame
df_html = df_html[0]

print(df_html)
目录
相关文章
DataFrame(6):DataFrame的增、删、改、查(二)
DataFrame(6):DataFrame的增、删、改、查(二)
DataFrame(6):DataFrame的增、删、改、查(二)
dataframe获取指定列
dataframe获取指定列
1503 0
|
索引 Python
Python 教程之 Pandas(4)—— 使用 Pandas 索引和选择数据
Python 教程之 Pandas(4)—— 使用 Pandas 索引和选择数据
579 0
|
Python
dataframe添加一新列
dataframe添加一新列
2750 2
|
数据挖掘 数据处理 索引
如何使用Python的Pandas库进行数据筛选和过滤?
Pandas是Python数据分析的核心库,其DataFrame数据结构便于数据操作。筛选与过滤数据主要包括:导入pandas,创建DataFrame,通过布尔索引、`query()`或`loc[]`、`iloc[]`方法筛选。
526 0
|
数据可视化 数据挖掘
基于Bert的文本聚类工具:BERTopic
基于Bert的文本聚类工具:BERTopic
2428 0
基于Bert的文本聚类工具:BERTopic
|
Python
Python中如何按行遍历DataFrame
听世界的意见,保留自己的态度。
2839 0
|
机器学习/深度学习 索引 Python
技术经验分享:DataFrame(1):结构介绍
技术经验分享:DataFrame(1):结构介绍
860 0
|
编解码 数据挖掘 开发者
Pandas数据导出:CSV文件
Pandas是Python中强大的数据分析库,提供了灵活的数据结构如DataFrame和Series。通过`to_csv()`函数可轻松将数据保存为CSV文件。本文介绍了基本用法、常见问题(如编码、索引、分隔符等)及解决方案,并涵盖大文件处理和报错解决方法,帮助用户高效导出数据。
1297 83
|
索引 Python
Python 教程之 Pandas(7)—— 遍历 Pandas DataFrame 中的行和列
Python 教程之 Pandas(7)—— 遍历 Pandas DataFrame 中的行和列
1512 0