Pandas AI:Pandas与人工智能的结合,让你不再拘泥于如何使用pandas方法及处理语法

简介: Pandas AI:Pandas与人工智能的结合,让你不再拘泥于如何使用pandas方法及处理语法

今天跟大家分享一款Python三方开源库:pandas-ai


Pandas AI 是由海外软件工程师 Gianluca Venturini 开发的,他创建 Pandas AI 的目的是为了简化 Pandas 的使用,使数据分析更容易、更直观。Pandas AI 是一个 Python 库,它将生成的人工智能功能集成到 Pandas 中,使数据框成为对话式的。

image.png

该项目从开源到迄今为止, GitHub Star 数达到了 5600+,而且还在实时更新之中,也有许多贡献者加入到该项目的开发与维护中,想必使用的人也不在少数。现在详细介绍下该项目的功用吧。


GitHub地址:https://github.com/gventuri/pandas-ai


功能概况:

  • 支持 Prompt 提示词,通过 Prompt 实现所需的数据分析功能
  • 更好地进行数据可视化


安装


pip install pandasai

用法


PandasAI 旨在与 Pandas 结合使用。它使 Pandas 具有对话性,支持以 Pandas DataFrames 的形式提出有关数据的问题并获得答案。


比如,可以要求 PandasAI 查找 DataFrame 中哪5个国家最幸福?,它将返回仅包含这些行的 DataFrame:

前提:需要有OpenAI ApiKey

image.png

配置API Key


import pandas as pd
from pandasai import PandasAI
# Sample DataFrame
df = pd.DataFrame({
    "country": ["United States", "United Kingdom", "France", "Germany", "Italy", "Spain", "Canada", "Australia", "Japan", "China"],
    "gdp": [19294482071552, 2891615567872, 2411255037952, 3435817336832, 1745433788416, 1181205135360, 1607402389504, 1490967855104, 4380756541440, 14631844184064],
    "happiness_index": [6.94, 7.16, 6.66, 7.07, 6.38, 6.4, 7.23, 7.22, 5.87, 5.12]
})
# Instantiate a LLM
from pandasai.llm.openai import OpenAI
llm = OpenAI()
pandas_ai = PandasAI(llm, conversational=False)
pandas_ai.run(df, prompt='Which are the 5 happiest countries?')

输出示例:

6            Canada
7         Australia
1    United Kingdom
3           Germany
0     United States
Name: country, dtype: object

当然,也可以让 PandasAI 进行更复杂的查询。


比如,要求 PandasAI 求出 2 个最不幸福国家的 GDP 总和

pandas_ai.run(df, prompt='What is the sum of the GDPs of the 2 unhappiest countries?')

还可以借助 Pandas AI 进行绘画:“绘制每个gpd显示的国家直方图,每个条形图使用不同的颜色”

pandas_ai.run(
    df,
    "Plot the histogram of countries showing for each the gpd, using different colors for each bar",
)

image.png

Pandas AI 绘制图表


更多示例代码查看:https://github.com/gventuri/pandas-ai/tree/main/examples


隐私与安全


为了生成要运行的 Python 代码,我们获取数据帧头部,将其随机化(对敏感数据使用随机生成,对非敏感数据使用混洗)并仅发送头部。


此外,如果你想进一步加强你的隐私,你可以实例化 PandasAI,enforce_privacy = True它不会将头部(但只是列名)发送到 LLM。


环境变量


为了设置 LLM(Hugging Face Hub,OpenAI)的 API 密钥,需要设置适当的环境变量。通过将.env.example文件复制到.env


cp .env.example .env

然后,编辑.env文件并设置适当的值。

或者,您也可以将环境变量直接传递给 LLM 的构造函数:

# OpenAI
llm = OpenAI(api_token="YOUR_OPENAI_API_KEY")
# Starcoder
llm = Starcoder(api_token="YOUR_HF_API_KEY")

由于没有API Key,所以没办法第一时间去体验实际的一个功能。不清楚AI功能支持的如何,中英文是否有差异,这个都有待验证。有兴趣有条件的同学可以去当个先行官。


相关文章
|
3月前
|
机器学习/深度学习 人工智能 运维
AI望远镜:人工智能是如何发现“藏在宇宙角落的新星系”的?
AI望远镜:人工智能是如何发现“藏在宇宙角落的新星系”的?
177 64
|
3月前
|
自然语言处理 数据挖掘 数据处理
告别低效代码:用对这10个Pandas方法让数据分析效率翻倍
本文将介绍 10 个在数据处理中至关重要的 Pandas 技术模式。这些模式能够显著减少调试时间,提升代码的可维护性,并构建更加清晰的数据处理流水线。
142 3
告别低效代码:用对这10个Pandas方法让数据分析效率翻倍
|
4天前
|
人工智能 数据安全/隐私保护 异构计算
桌面版exe安装和Python命令行安装2种方法详细讲解图片去水印AI源码私有化部署Lama-Cleaner安装使用方法-优雅草卓伊凡
桌面版exe安装和Python命令行安装2种方法详细讲解图片去水印AI源码私有化部署Lama-Cleaner安装使用方法-优雅草卓伊凡
57 8
桌面版exe安装和Python命令行安装2种方法详细讲解图片去水印AI源码私有化部署Lama-Cleaner安装使用方法-优雅草卓伊凡
|
4月前
|
人工智能 JavaScript
生成式人工智能(GAI)认证:2025最值得考的AI证书!
生成式人工智能(GAI)认证由全球教育巨头 Pearson 推出,融合技术原理、实战应用与伦理合规的三维培养框架。该项目与 AI 领域领先企业合作开发,涵盖提示优化、基础提示工程及社会影响等核心内容,助力学习者全面掌握 GAI 技能。中文版认证已落地中国,由达内教育与恒利联创战略合作推广,深度融合本土 AI 平台。作为高含金量的全球认可证书,GAI 认证可提升职业竞争力,满足行业对复合型 AI 人才的需求,为个人和企业开辟数字时代新机遇。
|
11天前
|
机器学习/深度学习 人工智能 自然语言处理
如何让AI更“聪明”?VLM模型的优化策略与测试方法全解析​
本文系统解析视觉语言模型(VLM)的核心机制、推理优化、评测方法与挑战。涵盖多模态对齐、KV Cache优化、性能测试及主流基准,助你全面掌握VLM技术前沿。建议点赞收藏,深入学习。
190 8
|
1月前
|
人工智能
AI推理方法演进:Chain-of-Thought、Tree-of-Thought与Graph-of-Thought技术对比分析
大语言模型推理能力不断提升,从早期的规模扩展转向方法创新。2022年Google提出Chain-of-Thought(CoT),通过展示推理过程显著提升模型表现。随后,Tree-of-Thought(ToT)和Graph-of-Thought(GoT)相继出现,推理结构由线性链条演进为树状分支,最终发展为支持多节点连接的图网络。CoT成本低但易错传,ToT支持多路径探索与回溯,GoT则实现非线性、多维推理,适合复杂任务。三者在计算成本与推理能力上形成递进关系,推动AI推理向更接近人类思维的方向发展。
132 4
|
29天前
|
数据采集 传感器 人工智能
没有大数据,哪来人工智能?——聊聊“大数据喂养下的AI进化史”
没有大数据,哪来人工智能?——聊聊“大数据喂养下的AI进化史”
81 6