备案控制台

开发者社区机器之心文章正文

金融GPT来了：500亿参数，但用来投资还是跑不赢大盘（1）（2）

2023-05-25 83

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 金融GPT来了：500亿参数，但用来投资还是跑不赢大盘（1）

知识评估

在一项任务中，BloombergGPT 比 BLOOM176B、GPT-NeoX 和 OPT66B 性能都高。在其他三项中排名第二（表 14）。与上一节类似，它优于类似尺寸的模型，同时几乎与更大的模型持平。Massive Multitask Language Understanding (MMLU, Hendrycks et al., 2021) 涵盖了 57 个不同的主题，因此比上述任务的覆盖面要广得多。

表 15 中的结果遵循了在 BIG-bench hard 中看到的见解。BloombergGPT 始终优于 OPT66B，后者又优于 GPT-NeoX，而 GPT-3 表现最佳。与前面的部分相比，BloombergGPT 在这一类别中的表现也优于 BLOOM176B，尽管差距很小。它落后于 GPT-3 的报告表现，尤其是在社会科学类别中。与 GPT-3 的差距在 STEM 和 “其他” 领域最为接近，其中包括与财务和会计相关的问题。

阅读理解

下表 16 反映了在阅读理解任务上的排名：虽然 GPT-3 的性能最高，但 BloombergGPT 紧随其后。除 OpenBookQA 外，BloombergGPT 的性能是 BLOOM176B、GPT-NeoX、OPT66B 中最高的。令人惊讶的是，BLOOM176B 在这一类别中明显落后。

语言学任务

下表 17 展示了在语言学任务上的结果，这与知识类别任务有相似的趋势。BloombergGPT 略落后于 GPT-3，但优于其他模型。与阅读理解类别类似，BLOOM176B 落后于 BloombergGPT。

最后，需要注意的是，使用金融 GPT 进行投资，可能仍然会跑输大盘指数：

-开发达人-

目录

相关文章

楠竹11

|

2月前

|

自然语言处理

Meta首发变色龙挑战GPT-4o，34B参数引领多模态革命！10万亿token训练刷新SOTA

【5月更文挑战第27天】Meta推出34B参数的多模态模型Chameleon，通过早期融合技术处理图像和文本，实现全面的多模态建模。在10万亿token的训练数据下，Chameleon在图像字幕生成和文本推理任务中刷新SOTA，展现出在混合模态生成和推理的潜力。然而，模型可能无法完全捕捉图像语义信息，且在某些特定任务上有优化空间。[论文链接](https://arxiv.org/pdf/2405.09818)

楠竹11

41 1 1

Deephub

|

2月前

|

人工智能测试技术 iOS开发

微软Phi-3，3.8亿参数能与Mixtral 8x7B和GPT-3.5相媲美，量化后还可直接在IPhone中运行

Phi-3系列是微软推出的一系列高效语言模型，旨在在移动设备上实现高性能。该系列包括 Phi-3-mini（38亿参数）、Phi-3-small 和 Phi-3-medium，它们在保持紧凑的同时，性能媲美GPT-3.5和Mixtral。模型通过精心筛选的数据集和优化训练策略，如数据最优化和阶段训练，实现高效能。 Phi-3-mini可在iPhone 14上运行，占用约1.8GB内存。这些模型在多个基准测试中展现出色性能，推动了AI在移动设备上的应用，增强了用户隐私和体验。虽然目前仅发布技术报告，但源代码和权重即将开放下载。

Deephub

71 1 1

-开发达人-

|

11月前

|

机器学习/深度学习数据采集人工智能

150亿参数、一次通过率超60％，华为代码能力超GPT3.5的大模型来了

150亿参数、一次通过率超60％，华为代码能力超GPT3.5的大模型来了

-开发达人-

148 0 0

-开发达人-

|

人工智能安全自动驾驶

GPT-4是8x2200亿参数的混合模型？这个小道消息今天传疯了

GPT-4是8x2200亿参数的混合模型？这个小道消息今天传疯了

-开发达人-

93 0 0

-开发达人-

|

机器学习/深度学习人工智能自然语言处理

世界的参数倒影：为何GPT通过Next Token Prediction可以产生智能（1）

世界的参数倒影：为何GPT通过Next Token Prediction可以产生智能

-开发达人-

215 0 0

-开发达人-

|

机器学习/深度学习存储自然语言处理

世界的参数倒影：为何GPT通过Next Token Prediction可以产生智能（2）

世界的参数倒影：为何GPT通过Next Token Prediction可以产生智能

-开发达人-

252 0 0

-开发达人-

|

存储编解码自然语言处理

世界的参数倒影：为何GPT通过Next Token Prediction可以产生智能（3）

世界的参数倒影：为何GPT通过Next Token Prediction可以产生智能

-开发达人-

343 0 0

-开发达人-

|

存储自然语言处理物联网

世界的参数倒影：为何GPT通过Next Token Prediction可以产生智能（4）

世界的参数倒影：为何GPT通过Next Token Prediction可以产生智能

-开发达人-

286 0 0

-开发达人-

|

机器学习/深度学习人工智能安全

没有RLHF，一样媲美GPT-4、Bard，Meta发布650亿参数语言模型LIMA

没有RLHF，一样媲美GPT-4、Bard，Meta发布650亿参数语言模型LIMA

-开发达人-

90 0 0

-开发达人-

|

机器人 PyTorch 算法框架/工具

300美元复刻ChatGPT九成功力，GPT-4亲自监考，130亿参数开源模型「小羊驼」来了

300美元复刻ChatGPT九成功力，GPT-4亲自监考，130亿参数开源模型「小羊驼」来了

-开发达人-

314 0 0

热门文章

最新文章

中文稀疏GPT大模型落地 -----通往低成本&高性能多任务通用自然语言理解的关键里程碑

CentOS6、7编译安装FFmpeg

MySQL无损复制

UI自动化测试分析与实践 | F2etest&UIRecorde

Xshell 7(SSH远程终端工具) v7.0.0109 官方中文正式版(附文件+安装教程)

ADB工具包15秒快速安装器，已集合ADB、FASTBOOT工具箱和最新的驱动程序

使用TDengine国产时序数据库存储能耗数据并通过钉钉机器人接收报警信息

mbr,gpt,开机启动流程.

阿里云推出大模型助手魔搭GPT

Paper：GPT-3《 Language Models are Few-Shot Learners》的翻译与解读（三）

开源11天，马斯克再发Grok-1.5！128K代码击败GPT-4

【强烈推荐使用】免费在线使用 GPT-4 | Free GPT-4 Online

GPT-5会有质的飞跃！Sam Altman最新专访透露了哪些重要信息？

GPT-4 vs. ChatGPT：19个弱项问题（多步逻辑推理、概念间接关联）的横向对比

23.3k Star！推荐一款非常强大的GPT网页客户端：Lobe Chat

全球第一AI大模型易主，Claude 3超越GPT-4，它的推理能力有多强

王者Claude 3大模型！！！OpenAI竞争对手Anthropic推出Claude 3大模型，各项性能全面碾压GPT-4！

GPT-5，将在高级推理功能上实现重大进步

GPT-SoVits：刚上线两天就获得了1.4k star的开源声音克隆项目！效果炸裂的跨语言音色克隆模型！

【保姆级】GPT的Oops问题快速解决方案

相关课程

更多

【新人赛】资金流入流出预测-挑战Baseline经验分享

【新人赛】工业蒸汽量预测建模算法代码开源分享合集

基于通义灵码实现高效 AI 编码

创空间应用训练个性化模型

智能运维赛（复赛）：利用数据和算法，快速定位系统异常并进行根因分析

场景实践-通过阿里云数据分析工具实现共享单车骑行分析

相关电子书

更多

增长的真相暨金数据新产品发布

PG在电商平台运营决策系统中的应用实践-张亚运

数据智能引爆用户增长

相关实验场景

更多

函数计算部署AI艺术字应用，生成新春文字头像

基于阿里云DeepGPU实例，用AI画唯美国风少女

使用计算巢AI应用，轻松定制个人数字形象

通过GPU云服务器训练GPT-2

使用EDA架构部署在线外卖订单系统

下一篇

部署LAMP环境（Alibaba Cloud Linux 3）