百川智能发布超千亿大模型Baichuan3，中文评测超GPT-4-阿里云开发者社区

百川智能发布超千亿大模型Baichuan3，中文评测超GPT-4

2024-01-29 468

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 1月29日午间消息，百川智能宣布发布超千亿参数的大语言模型Baichuan 3。在 CMMLU、GAOKAO 和 AGI-Eval 等评测中，Baichuan 3 号称在中文任务上超越了 GPT-4。

1月29日午间消息，百川智能宣布发布超千亿参数的大语言模型Baichuan 3。在 CMMLU、GAOKAO 和 AGI-Eval 等评测中，Baichuan 3 号称在中文任务上超越了 GPT-4。

据介绍，百川智能在 Baichuan 3 训练过程中提出了“动态数据选择”、“重要度保持”以及“异步 CheckPoint 存储”等多种技术手段及方案，稳定训练时间达到一个月以上，故障恢复时间不超过 10 分钟。

百川智能官方表示，Baichuan 3 还突破“迭代式强化学习”技术，进一步提升了语义理解和生成能力，在诗词创作的格式、韵律、表意等方面进行了提升，对于宋词这种格式多变，结构深细、韵律丰富的高难度文体，生成的内容亦能工整对仗、韵脚和谐，让每个人都能创作出咏物、寄思的五言律诗、七言绝句，写下的言志、抒情的“沁园春”、“定风波”。

据介绍，面向医疗行业，百川智能在模型预训练阶段构建了超过千亿Token的医疗数据集，该数据集涵盖了从理论到实际操作，从基础理论到临床应用等各个方面的医学知识，确保了模型在医疗领域的专业度和知识深度。在对逻辑推理能力及专业性要求极高的MCMLE、MedExam等权威医疗评测上的中文效果同样超过了GPT-4。

https://www.xinpin1688.com/article-19164-1.html

https://www.xinpin1688.com/article-19163-1.html

https://www.xinpin1688.com/article-19160-1.html

百川智能发布超千亿大模型Baichuan3，中文评测超GPT-4

热门文章

最新文章

相关课程

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

百川智能发布超千亿大模型Baichuan3，中文评测超GPT-4

热门文章

最新文章

相关课程

相关电子书