Pandas 是 Python 中用于数据分析和操作的一个强大库,它提供了多种函数来读取不同格式的数据文件,并将这些数据转换为 DataFrame 对象,DataFrame 是 Pandas 中用于存储和操作结构化数据的主要数据结构。
以下是 Pandas 提供的一些常用数据读取函数的详细说明和使用示例:
1. pd.read_csv(filename)
这个函数用于读取 CSV(逗号分隔值)文件,并将其转换为 DataFrame。
是什么:读取 CSV 文件。
怎么用:你需要提供 CSV 文件的路径或 URL。
代码示例:
import pandas as pd
# 读取本地 CSV 文件
df_csv = pd.read_csv('path/to/your/file.csv')
# 读取网上的 CSV 文件
df_csv = pd.read_csv('https://example.com/data.csv')
print(df_csv)
2. pd.read_excel(filename)
这个函数用于读取 Excel 文件,并将其转换为 DataFrame。
是什么:读取 Excel 文件。
怎么用:你需要提供 Excel 文件的路径。
代码示例:
# 读取 Excel 文件
df_excel = pd.read_excel('path/to/your/file.xlsx')
print(df_excel)
3. pd.read_sql(query, connection_object)
这个函数用于从 SQL 数据库中读取数据,并将其转换为 DataFrame。
是什么:从 SQL 数据库读取数据。
怎么用:你需要提供 SQL 查询语句和数据库连接对象。
代码示例:
import sqlite3
import pandas as pd
# 创建数据库连接
conn = sqlite3.connect('path/to/your/database.db')
# SQL 查询语句
query = 'SELECT * FROM your_table'
# 从 SQL 数据库读取数据
df_sql = pd.read_sql(query, conn)
# 关闭数据库连接
conn.close()
print(df_sql)
4. pd.read_json(json_string)
这个函数用于从 JSON 字符串中读取数据,并将其转换为 DataFrame。
是什么:从 JSON 字符串读取数据。
怎么用:你需要提供 JSON 格式的字符串。
代码示例:
# JSON 字符串
json_str = '[{"name": "John", "age": 30}, {"name": "Anna", "age": 28}]'
# 从 JSON 字符串读取数据
df_json = pd.read_json(json_str)
print(df_json)
5. pd.read_html(url)
这个函数用于从 HTML 页面中读取表格数据,并将其转换为 DataFrame。
是什么:从 HTML 页面读取表格数据。
怎么用:你需要提供包含表格数据的 HTML 页面的 URL。
代码示例:
# 从 HTML 页面读取表格数据
df_html = pd.read_html('https://example.com/data.html')
# 如果页面中有多个表格,返回的将是一个 DataFrame 的列表
# 选择第一个 DataFrame
df_html = df_html[0]
print(df_html)