结构化表格也成模态!浙大TableGPT2开源,最强表格AI问世

简介: 在AI快速发展中,大型语言模型(LLMs)如GPTs等展现了巨大潜力。然而,表格数据整合这一关键领域发展不足。浙江大学提出TableGPT2,使用593.8K张表格和2.36M查询-表格-输出三元组进行预训练和微调。该模型创新性地引入了表格编码器,增强了处理模糊查询、缺失列名和不规则表格的能力。TableGPT2在23个基准测试指标上表现出色,7B模型性能提升35.20%,72B模型提升49.32%。其开源代码和模型为社区提供了强大的研究工具。

在人工智能(AI)的迅猛发展中,大型语言模型(LLMs)如GPTs、Claude、LLaMA和Qwen等,已经在各个行业中展现出了巨大的潜力和应用价值。然而,尽管结构化表格数据在许多实际应用领域中具有基础性的作用,但表格数据的整合问题却一直没有得到充分的发展。

表格数据整合的重要性体现在以下几个方面:

  1. 高级应用需求:在许多高级应用中,数据库或数据仓库的数据整合是必不可少的。例如,在金融领域,实时市场数据的整合对于股票投资推荐等应用至关重要。

  2. 未开发的资源:表格数据是一种丰富且尚未被充分利用的资源。据估计,全球超过70%的数据以结构化表格形式存在,这为数据分析提供了巨大的潜力。

  3. 商业智能需求:商业智能(BI)领域对灵活、精确的解决方案有着特定的需求。然而,当前的LLMs在处理复杂查询和多步骤推理时可能面临挑战。

为了解决这些问题,浙江大学的研究人员提出了TableGPT2,一个经过严格预训练和微调的模型,使用了超过593.8K张表格和2.36M高质量的查询-表格-输出三元组。这一规模的表格相关数据在之前的研究工作中是前所未有的。

TableGPT2的关键创新之一是其新颖的表格编码器,该编码器专门设计用于捕捉模式级别和单元格级别的信息。这种编码器增强了模型处理模糊查询、缺失列名和不规则表格的能力,这些在实际应用中经常遇到。

TableGPT2在23个基准测试指标上表现出色,与之前的基准中立LLMs相比,7B模型的平均性能提高了35.20%,72B模型的平均性能提高了49.32%。同时,TableGPT2保持了强大的通用语言和编码能力。

TableGPT2的另一个重要特点是其对多模态的探索。它创新性地引入了一个单独的模态模块,用于读取和解释表格数据。类似于视觉语言模型(VLMs),TableGPT2将表格数据读取模块生成的特殊嵌入与文本输入的令牌嵌入进行连接,从而更好地捕捉表格数据的结构与语义。

研究人员已经开源了TableGPT2的代码和模型,并提供了一个全面的代理工作流。此外,他们还发布了RealTabBench数据集的一部分,以促进在实际数据驱动和BI生产环境中的进一步探索和应用。

TableGPT2的问世为表格数据的处理和分析带来了巨大的潜力和可能性。其在多个基准测试上的出色表现证明了其在表格相关任务上的强大能力。同时,TableGPT2的开源也为社区提供了一个强大的工具和平台,用于进一步的研究和开发。

然而,TableGPT2也面临一些挑战和限制。例如,其对表格数据的处理能力可能受到表格规模和复杂性的限制。此外,TableGPT2的训练数据主要来自特定的领域和来源,这可能限制了其在其他领域的泛化能力。

论文地址:https://arxiv.org/pdf/2411.02059

目录
相关文章
|
8天前
|
人工智能 API 决策智能
还在蹲Manus的邀请码?别等了!开源版Manus为你快速创建AI工位,给AI一台电脑,然后你就玩去吧!
OpenManus 是 MetaGPT 的开源 AI 平台,支持多语言模型和工具链,执行代码、处理文件等任务,具备实时反馈。OWL 基于 CAMEL-AI,支持角色分配、任务分解和记忆功能,实现高效任务自动化。
498 22
还在蹲Manus的邀请码?别等了!开源版Manus为你快速创建AI工位,给AI一台电脑,然后你就玩去吧!
|
8天前
|
机器学习/深度学习 人工智能 JSON
Resume Matcher:增加面试机会!开源AI简历优化工具,一键解析简历和职位描述并优化
Resume Matcher 是一款开源AI简历优化工具,通过解析简历和职位描述,提取关键词并计算文本相似性,帮助求职者优化简历内容,提升通过自动化筛选系统(ATS)的概率,增加面试机会。
73 18
Resume Matcher:增加面试机会!开源AI简历优化工具,一键解析简历和职位描述并优化
|
8天前
|
人工智能 API 开发者
无需邀请码!MetaGPT 开源AI助手 OpenManus,实时反馈+模块化设计,开发者福音
OpenManus 是 MetaGPT 团队推出的开源 AI Agent 复刻版,支持多种语言模型和工具链,能够执行代码、处理文件、搜索网络信息等复杂任务,具备实时反馈机制和灵活的配置选项。
222 17
无需邀请码!MetaGPT 开源AI助手 OpenManus,实时反馈+模块化设计,开发者福音
|
2天前
|
人工智能 自然语言处理 算法
AI-Researcher:告别熬夜肝论文!港大开源AI科研神器,从选题到发表全自动
AI-Researcher 是香港大学数据科学实验室推出的开源自动化科研工具,基于大型语言模型(LLM)代理,支持从研究想法到论文发表的全流程自动化,涵盖文献综述、算法设计、实验验证和论文撰写等功能。
81 8
AI-Researcher:告别熬夜肝论文!港大开源AI科研神器,从选题到发表全自动
|
2天前
|
人工智能 安全 数据可视化
一键部署谷歌最新开源多模态AI模型 Gemma 3:单GPU性能碾压Llama!支持35+种语言
Gemma 3 是谷歌最新推出的开源多模态AI模型,支持超过35种语言,具备文本、图像及短视频处理能力,提供四种模型尺寸,优化单GPU性能,适用于多种AI应用场景。
101 8
一键部署谷歌最新开源多模态AI模型 Gemma 3:单GPU性能碾压Llama!支持35+种语言
|
2天前
|
人工智能 自然语言处理 API
MM-StoryAgent:交大阿里联合开源!多模态AI一键生成儿童故事绘本+配音
MM-StoryAgent 是上海交通大学与阿里巴巴联合推出的开源多模态、多智能体框架,用于生成沉浸式的有声故事绘本视频,支持文本、图像、语音等多种模态的生成与对齐。
31 7
MM-StoryAgent:交大阿里联合开源!多模态AI一键生成儿童故事绘本+配音
|
3天前
|
人工智能 自然语言处理 安全
Anus:公开整活!完全用 Manus 复刻 Manus 功能的开源 AI 智能体项目
Anus 是一个开源 AI 智能体项目,复刻了 Manus 的部分功能,支持自然语言指令执行、多代理协作、多模态输入处理等功能,旨在为开发者提供强大且灵活的工具。
66 1
Anus:公开整活!完全用 Manus 复刻 Manus 功能的开源 AI 智能体项目
|
20小时前
|
人工智能 并行计算 语音技术
Open-LLM-VTuber:宅男福音!开源AI老婆离线版上线,实时语音+Live2D互动还会脸红心跳
Open-LLM-VTuber 是一个开源的跨平台语音交互 AI 伴侣项目,支持实时语音对话、视觉感知和生动的 Live2D 动态形象,完全离线运行,保护用户隐私。
40 9
Open-LLM-VTuber:宅男福音!开源AI老婆离线版上线,实时语音+Live2D互动还会脸红心跳
|
5天前
|
Web App开发 人工智能 JavaScript
Nanobrowser:开源版OpenAI Operator!AI自动操控浏览器,复杂网页任务一键搞定
Nanobrowser 是一款开源的 Chrome 扩展工具,基于多智能体系统实现复杂的网页任务自动化,支持多种大型语言模型,完全免费且注重隐私保护。
98 1
|
5天前
|
存储 人工智能 Docker
Heygem:开源数字人克隆神器!1秒视频生成4K超高清AI形象,1080Ti显卡也能轻松跑
Heygem 是硅基智能推出的开源数字人模型,支持快速克隆形象和声音,30秒内完成克隆,60秒内生成4K超高清视频,适用于内容创作、直播、教育等场景。
586 0

热门文章

最新文章