金融行业 · 大模型挑战赛 |用大模型理解金融市场

简介: 2024金融行业大模型挑战赛即将开启,旨在推动大型语言模型在金融领域的应用。比赛提供金融多轮问答数据集,参赛者需使用GLM-4模型API,通过SQL、API等技术解决金融问题,涵盖数据查询、统计分析及复杂问题处理。赛事分初赛、复赛和决赛,总奖金20万元。报名时间为2024年12月2日至2025年2月6日。

image.png


近年来,大型语言模型(LLM)在金融领域的应用取得显著进展。继「2023 金融行业·大模型挑战赛」之后,我们将举办「2024 金融行业 · 大模型挑战赛」,以期进一步推进大模型在金融行业的广泛应用。 

为确保比赛内容紧贴实际应用,我们整合了所有公开的金融数据,打造了符合金融场景需求的多轮问答评测赛题——金融多轮问答数据集。比赛将提供完整的基础数据表供选手使用。 

参赛选手需采用 GLM-4 系列模型 API 进行比赛。选手可运用多种技术手段,如代理方法(agentic)、文本到API(text2api)、文本到SQL(text2sql)和信息检索等,以完成赛题。 

赛题设有中文和英文两个测试集,选手可根据个人偏好选择其一进行优化和提升。 

主办单位:清华大学基础模型研究中心 

支持单位:智谱、博时基金、安硕信息、恒生聚源 

社区支持:魔搭社区,WaytoAGI,ZLead硅谷委员会,Huggingface 

模型支持:BigModel.cn

数据支持:恒生聚源、安硕信息、博时基金 


赛题内容

参赛选手需利用GLM-4模型API以及比赛提供的金融数据,开发一个能够处理多轮问答的系统,旨在回答用户提出的金融相关问题。 

本赛题涉及多轮问答,并包含中文及英文两种语言。 

根据难度和复杂度,赛题分为初级、中级、高级三个等级,描述如下: 

初级:数据基本查询(30分) 

通过SQL或API等方式可查询结果,如:「某公司(或某股票代码)2022年11月2日的涨跌幅为多少?」 

中级:数据统计分析查询(40分) 

在初级阶段的基础上,使用基础数据完成金融数据的统计分析、关联指标查询、公式计算等,如:「MACD即将金叉,中小板,近半年涨停次数超过10次的股票有多少家?分别是谁?」 

高级:复杂问题(30分) 

股价回测、财务分析等,如:「每年的4月叠加上市公司年报和一季报。理论上新闻频次会达到了一年最高。帮我验证下,2021年在A股有多少比例的上市公司符合这个假设?」 

数据结构

本次赛题数据主要分为两大类:结构化数据和非结构化数据。 

结构化数据包括以下几部分: 

  • A股上市公司数据:涵盖500家A股公司(2019-2021年),包括公司基本资料(如LC_StockArchives),公司名称变更(LC_NameChange),以及公司业务信息(LC_Business)。
  • 股东及股权信息:包括股东类型分类(LC_SHTypeClassifi)、股东名单(LC_MainSHListNew)、公司实际控制人(LC_ActualController)等信息,涉及股东持股统计、股权变动、股权冻结与质押等内容。
  • 公司财务与经营状况:包括资产负债表(LC_BalanceSheetAll)、利润表(LC_IncomeStatementAll)、现金流量表(LC_CashFlowStatementAll)、主营业务构成(LC_MainOperIncome)以及审计意见(LC_AuditOpinion)。
  • 行业及概念板块:包含行业分类(LC_ExgIndustry)、行业估值指标(LC_IndustryValuation)、行业财务指标(LC_IndFinIndicators)及概念板块信息(LC_COConcept)。
  • 股票市场数据:如A股交易数据(日行情表QT_DailyQuote)、股票技术指标(CS_TurnoverVolTecIndex)及停牌复牌信息(LC_SuspendResumption)。
  • 基金数据:涉及管理人前10家,每家50只基金(2019-2021年),包括基金概况(MF_FundArchives)、基金管理人信息(MF_InvestAdvisorOutline)及基金分红(MF_Dividend)。
  • 港股和美股数据:涵盖20家港股公司及20家美股公司(2019-2021年),包括公司概况、员工数量变动、日行情等信息。
  • 指数数据:包含沪深三百、中证500、中证1000、创业板指数、上证指数的基本情况(LC_IndexBasicInfo)及其成份(LC_IndexComponent)。
  • 舆情数据:针对500家A股公司(2019-2021年)的舆情信息(PS_NewsSecurity),以及相关事件体系指引(PS_EventStru)。

非结构化数据主要涉及: 

  • 报告:年度报告、季度报告等公司财务报告。
  • 公告:董事会公告、监事会公告、股东大会公告等。
  • 上市资料:如招股说明书等公司上市相关文件。

赛事日程

🗓 初赛阶段(2024/12/3 - 2025/2/10)

  • A榜(2024/12/3 - 2025/2/6):每日报名队伍有3次提交机会,实时评测,展示历史最佳成绩。
  • B榜(2025/2/7 - 2025/2/10):评测标准与A榜相同,赛题难度提升。

初赛成绩:A榜(30%)+ B榜(70%)加权得出。 

🗓 复赛阶段(2025/2/17 - 2025/3/9)

  • A榜(2025/2/17 - 2025/3/6):每天5次提交机会,实时评测与排名更新。
  • B榜(2025/3/7 - 2025/3/9):评测标准与A榜相同,赛题难度调整,挑战极限。

复赛成绩:A榜(30%)+ B榜(70%)加权得出。前15名晋级决赛。 

🗓 决赛答辩(2025年3月底)

决赛将以线上或线下答辩形式进行,晋级队伍需准备答辩PPT、参赛总结和核心代码。 

最终成绩:复赛成绩(60%)+ 答辩成绩(40%)。 

奖项设置

本次大赛赛题奖金总额为20万元人民币。具体奖金分布如下(所有奖金均为税前): 

冠军(1名):60000元人民币现金奖金,颁发获奖证书。 

亚军(2名):30000元人民币现金奖金,颁发获奖证书。 

季军(5名):10000元人民币现金奖金,颁发获奖证书。 

Baseline奖励(15名):2000元人民币现金奖金。 

加入比赛

报名时间:2024年12月02日至2025年02月06日

报名通道:

https://competitions.zhipuai.cn/match 



相关文章
|
9小时前
|
XML Java 数据库连接
Mybatis映射关系
简介:本文介绍了MyBatis框架中四种常见的关系映射方式,包括一对一、一对多、多对一及多对多。一对一通过简单属性映射实现;一对多通过在主对象中添加集合属性并使用`<collection>`标签映射子对象集合;多对一则利用`<association>`标签在主对象中映射单个子对象;多对多需引入第三方类,分别在两个主对象中添加对方的集合属性,并通过`<collection>`标签实现映射。
39 26
|
9小时前
|
存储 索引
什么情况下不应该创建索引?
索引应避免在很少使用的列、数据值少的列、text/image/bit类型列上创建,因为这些情况下索引不仅无助于提升查询速度,还会降低系统维护效率,增加存储开销。当数据修改频率远高于查询时,也不宜创建索引。
32 20
|
9小时前
|
关系型数据库 数据库
数据库如何保证事务的ACID特性?
InnoDB通过undo log实现事务的原子性,支持回滚;采用悲观锁与乐观锁确保事务隔离性;利用redo log保障事务持久性,记录数据页的物理修改并用于恢复;通过上述特性共同维护数据的一致性。
33 20
|
1天前
|
人工智能
AnchorCrafter:中科院联合腾讯推出的AI虚拟主播带货视频制作技术
AnchorCrafter是由中科院和腾讯联合推出的一项AI虚拟主播带货视频制作技术。该技术基于扩散模型,能够自动生成高保真度的主播风格产品推广视频,通过整合人-物交互(HOI)技术,实现对物体外观和运动控制的高度还原。AnchorCrafter在物体外观保持、交互感知以及视频质量方面优于现有方法,为在线广告和消费者参与提供了新的可能性。
70 30
AnchorCrafter:中科院联合腾讯推出的AI虚拟主播带货视频制作技术
|
13天前
|
算法 安全 网络安全
数据结构之网络攻击路径(深度优先搜索)
本文介绍了如何使用深度优先搜索(DFS)算法分析网络攻击路径。在网络安全领域,DFS用于检测网络中潜在的攻击路径,帮助安全人员及时发现并阻止威胁。文中详细描述了网络图的构建、节点间的连接关系以及DFS的实现过程。通过一个具体的例子,展示了如何检测从一个普通节点到关键节点的攻击路径,并讨论了DFS算法的优缺点。提供的C++代码实现了网络图的构建和攻击路径的检测功能。
54 24
|
13天前
|
SQL 运维 网络安全
【实践】基于Hologres+Flink搭建GitHub实时数据查询
本文介绍了如何利用Flink和Hologres构建GitHub公开事件数据的实时数仓,并对接BI工具实现数据实时分析。流程包括创建VPC、Hologres、OSS、Flink实例,配置Hologres内部表,通过Flink实时写入数据至Hologres,查询实时数据,以及清理资源等步骤。
|
1天前
|
机器学习/深度学习 人工智能 达摩院
MVGenMaster:复旦联合阿里等实验室推出的多视图扩散模型
MVGenMaster是由复旦大学、阿里巴巴达摩院和湖潘实验室联合推出的多视图扩散模型,专注于新视角合成(NVS)任务。该模型通过整合3D先验信息,显著提升了NVS的泛化和3D一致性,并能从单一图像生成多达100个新视图。此外,研究团队还推出了包含160万场景的大型多视图图像数据集MvD-1M,以支持模型的训练和优化。
48 27
MVGenMaster:复旦联合阿里等实验室推出的多视图扩散模型
|
6天前
|
SQL Java 索引
java小工具util系列2:字符串工具
java小工具util系列2:字符串工具
131 83
|
9天前
|
测试技术 UED 开发者
软件测试的艺术与科学:探索有效的测试策略
在软件开发的宇宙中,测试是一颗璀璨的星辰,它不仅保障着产品的质量,也指引着项目的方向。本文将带你穿梭于测试的银河系,从基础的单元测试到复杂的集成测试,再到全面的系统测试,我们将一探究竟。你会发现,每一个测试阶段都是一次对代码深度和广度的挑战,也是一次对开发者耐心和智慧的考验。准备好了吗?让我们开始这段探索之旅,看看如何通过精心设计的测试案例来确保我们的软件能够在现实世界中稳健运行。
|
7天前
|
开发工具 git
git 常用命令
这些只是 Git 命令的一部分,Git 还有许多其他命令和选项,可根据具体需求进行深入学习和使用。熟练掌握这些命令能够帮助你更高效地管理代码版本和协作开发。