Data Formulator:微软开源的数据可视化 AI 工具,通过自然语言交互快速创建复杂的数据图表

简介: Data Formulator 是微软研究院推出的开源 AI 数据可视化工具,结合图形化界面和自然语言输入,帮助用户快速创建复杂的可视化图表。

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!

🥦 微信公众号|搜一搜:蚝油菜花 🥦


大家好,我是蚝油菜花,今天跟大家分享一下 Data Formulator 这个由微软研究院推出的开源 AI 数据可视化工具。

🚀 快速阅读

Data Formulator 是一款强大的 AI 数据可视化工具,帮助用户通过简单交互和指令快速创建丰富的可视化图表。

  1. 核心功能:结合图形化界面与自然语言输入,支持复杂数据转换和迭代设计。
  2. 技术原理:多模态交互界面、概念绑定与数据转换、AI 代理与代码生成。

Data Formulator 是什么

Data Formulator

Data Formulator 是微软研究院推出的一款开源 AI 数据可视化工具,旨在帮助用户通过简单的交互和指令快速创建复杂的可视化图表。它结合了图形化用户界面(GUI)和自然语言输入(NL),用户可以通过拖拽操作或直接输入需求来设计图表,AI 负责处理复杂的数据转换和计算。

Data Formulator 的目标是让用户能够更高效地探索和理解数据,无需编写复杂的代码或进行繁琐的数据预处理。无论是数据分析专家还是初学者,都可以通过这款工具轻松创建专业的可视化图表。

Data Formulator 的主要功能

  • 结合图形化界面与自然语言输入:用户可以通过拖拽操作将数据字段放置到图表属性中,也可以通过自然语言描述需求,AI 会根据指令完成数据转换和可视化。
  • 支持复杂数据转换:用户可以在编码栏中输入不存在的数据字段名称,AI 会根据自然语言提示进行数据计算和转换,生成新的可视化内容。
  • 迭代可视化设计:Data Formulator 提供了“数据线程”功能,用户可以基于现有图表进行进一步操作,AI 会根据自然语言指令更新图表。
  • 结果验证与错误纠正:用户可以查看 AI 生成的转换数据、可视化图表和代码,通过代码解释模块理解数据转换过程。如果发现错误,可以用数据线程的迭代机制进行纠正。
  • 灵活的图表样式调整:用户可以在不进行额外数据转换的情况下,直接在概念编码架上调整图表样式(如颜色方案、轴排序等),即时看到视觉反馈。

Data Formulator 的技术原理

  • 多模态交互界面:Data Formulator 结合了图形化用户界面(GUI)和自然语言输入(NL),用户可以通过拖拽操作或直接输入自然语言指令来定义可视化需求。“双管齐下”的方式让用户能根据自己的习惯选择操作方式,通过界面操作还是语言描述,能高效地传达需求。
  • 概念绑定与数据转换:用户首先通过自然语言或示例定义他们计划可视化的数据概念,然后将这些概念绑定到可视化通道(如 x 轴、y 轴、颜色等)。Data Formulator 会通过其 AI 代理(Agent)自动将输入数据转换为所需的格式,生成所需的可视化。
  • AI 代理与代码生成:Data Formulator 的后端使用 Flask 框架,通过 RESTful API 接收前端请求。当用户点击“Formulate”按钮时,前端会发送一个 POST 请求到后端的 /derive-data 接口。后端根据用户输入的指令和数据,调用 AI 代理(如 DataTransformationAgentV2)生成 Python 代码,执行这些代码以完成数据转换。
  • 数据处理与反馈机制:Data Formulator 提供了数据线程功能,用户可以基于现有图表进行进一步操作,AI 会根据自然语言指令更新图表。Data Formulator 提供了反馈机制,用户可以查看 AI 生成的转换数据、可视化图表和代码,确保结果符合预期。

如何运行 Data Formulator

1. 安装 via Python PIP

使用 Python PIP 进行安装,推荐在虚拟环境中运行:

# 安装 data_formulator
pip install data_formulator

# 启动 data_formulator
data_formulator

# 或者使用以下命令启动
python -m data_formulator

Data Formulator 将自动在浏览器中打开,访问地址为 http://localhost:5000。如果默认端口被占用,可以指定其他端口,例如 python -m data_formulator --port 8080

2. 使用 GitHub Codespaces

你也可以在 GitHub Codespaces 中运行 Data Formulator,所有配置已经预先设置好。点击下方链接即可快速启动:

Open in GitHub Codespaces

3. 开发者模式

如果你希望完全控制开发环境并进行自定义配置,可以参考 DEVELOPMENT.md 文件中的详细说明进行本地构建。

资源


❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!

🥦 微信公众号|搜一搜:蚝油菜花 🥦

相关文章
|
5月前
|
机器学习/深度学习 人工智能 算法
AI可以做电商主图了:技术原理,AI电商图生成工具对比及技术解析
双十一临近,电商主图需求激增。AI技术凭借多图融合、扩散模型等,实现高效智能设计,30秒生成高质量主图,远超传统PS效率。支持风格迁移、背景替换、文案生成,助力商家快速打造吸睛商品图,提升转化率。
1624 0
|
5月前
|
人工智能 搜索推荐 数据可视化
当AI学会“使用工具”:智能体(Agent)如何重塑人机交互
当AI学会“使用工具”:智能体(Agent)如何重塑人机交互
618 115
|
5月前
|
人工智能 安全 搜索推荐
AI的下一个前沿:从静态工具到动态代理
AI的下一个前沿:从静态工具到动态代理
326 113
|
5月前
|
人工智能 自然语言处理 安全
从工具到伙伴:AI代理(Agent)是下一场革命
从工具到伙伴:AI代理(Agent)是下一场革命
604 117
|
5月前
|
人工智能 缓存 运维
【智造】AI应用实战:6个agent搞定复杂指令和工具膨胀
本文介绍联调造数场景下的AI应用演进:从单Agent模式到多Agent协同的架构升级。针对复杂指令执行不准、响应慢等问题,通过意图识别、工具引擎、推理执行等多Agent分工协作,结合工程化手段提升准确性与效率,并分享了关键设计思路与实践心得。
918 20
【智造】AI应用实战:6个agent搞定复杂指令和工具膨胀
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
双 11 电商效率突围:10 款 AI 工具的技术落地与实践指南
2025年双11促销长达38天,电商迎来AI重构关键期。本文剖析10款主流AI工具技术原理,涵盖设计、文案、投放、客服等场景,揭示计算机视觉、自然语言处理等技术如何驱动电商智能化升级,助力企业高效应对大促挑战。
895 1
|
5月前
|
机器学习/深度学习 人工智能
AI重塑电商拍摄:技术驱动的商业变革——5款AI模特图生成工具技术分析
AI技术正重塑电商拍摄:低成本、高效率生成逼真模特图,支持批量换装、换背景,助力商家快速上架、灵活试错。燕雀光年、Kaiber等工具实测好用,未来AI与实拍将互补共存。
632 0
|
5月前
|
消息中间件 人工智能 安全
云原生进化论:加速构建 AI 应用
本文将和大家分享过去一年在支持企业构建 AI 应用过程的一些实践和思考。
1336 55
|
6月前
|
人工智能 安全 中间件
阿里云 AI 中间件重磅发布,打通 AI 应用落地“最后一公里”
9 月 26 日,2025 云栖大会 AI 中间件:AI 时代的中间件技术演进与创新实践论坛上,阿里云智能集团资深技术专家林清山发表主题演讲《未来已来:下一代 AI 中间件重磅发布,解锁 AI 应用架构新范式》,重磅发布阿里云 AI 中间件,提供面向分布式多 Agent 架构的基座,包括:AgentScope-Java(兼容 Spring AI Alibaba 生态),AI MQ(基于Apache RocketMQ 的 AI 能力升级),AI 网关 Higress,AI 注册与配置中心 Nacos,以及覆盖模型与算力的 AI 可观测体系。
1272 59

热门文章

最新文章