国内首发,百川13B大模型上架魔搭

本文涉及的产品
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
模型训练 PAI-DLC,100CU*H 3个月
交互式建模 PAI-DSW,每月250计算时 3个月
简介: 今日,百川智能发布130亿参数通用大语言模型Baichuan-13B-base和对话模型Baichuan-13B-Chat。两个模型全都开源、免费、可商用,均已在魔搭社区上架,属于国内首发。

模型介绍


今日,百川智能发布130亿参数通用大语言模型Baichuan-13B-base和对话模型Baichuan-13B-Chat。两个模型全都开源、免费、可商用,均已在魔搭社区上架,属于国内首发。


image.png


6 月 15 日,百川智能刚刚发布第一款 70 亿参数规模的中英文语言模型 Baichuan-7B,该模型也于当天在魔搭上架。


对比 Baichuan-7B,Baichuan-13B拥有更多参数和语料,模型参数130亿,在1.4万亿token数据集上训练,训练数据量超过LLaMA-13B 40%,是当前开源13B尺寸下训练数据量最多的模型。


本次发布,共包含基础模型(Baichuan-13B-Base)和对齐模型(Baichuan-13B-Chat)两个版本。基础模型是适用于开发者的“基座”,具有对话功能的对齐模型则可以满足普通用户的需求。


为了进一步降低模型使用门槛,满足更广大用户的需求,百川智能还开源了对齐模型(Baichuan-13B-Chat)的int8和int4两个量化版本,相对非量化版本,可以在几乎没有效果损失的情况下大幅降低部署门槛,比如将模型部署在Nvidia 3090等消费级显卡上。


此次推出的 Baichuan-13B 对学术研究完全开放,其他开发者也可通过邮件向百川智能申请授权,并获得官方商用许可后即可免费商用。


魔搭社区成立于2022年11月,致力于成为中国开源大模型第一平台,现已聚集 180 多万 AI 开发者,模型下载总量超过 3600 万次,累计开源开放 900多个优质AI模型,模型贡献者包括20多家顶尖人工智能机构,基本覆盖国内大模型赛道核心玩家,如百川智能、哔哩哔哩、IDEA研究院、兰丁股份、澜舟科技、openBMB社区、启智社区、清华TSAIL、RWKV、深势科技、WeNet社区、元语智能、浙江大学、智谱AI等(排名不分先后),他们贡献了30多个10亿以上参数规模的开源大模型。


找大模型,上魔搭!


模型链接


基础模型链接:

https://modelscope.cn/models/Baichuan-inc/Baichuan-13B-Base/summary


对话模型链接:

https://modelscope.cn/models/baichuan-inc/Baichuan-13B-Chat/summary


相关文章
|
数据安全/隐私保护
Gitlab----管理员如何创建用户并邮件通知
Gitlab----管理员如何创建用户并邮件通知
1546 0
Gitlab----管理员如何创建用户并邮件通知
|
网络协议 关系型数据库 MySQL
如何在Android Termux上安装MySQL并实现公网远程访问?
如何在Android Termux上安装MySQL并实现公网远程访问?
571 0
|
存储 编解码 调度
剖析ffmpeg视频解码播放:时间戳的处理
剖析ffmpeg视频解码播放:时间戳的处理
1274 0
|
机器学习/深度学习 算法 搜索推荐
阿里云机器学习平台PAI与香港大学合作论文入选INFOCOM 2022,有效减少大规模神经网络训练时间
近日,阿里云机器学习平台 PAI 与香港大学吴川教授团队合作的论文”Efficient Pipeline Planning for Expedited Distributed DNN Training”入选INFOCOM(IEEE International Conference on Computer Communications) 2022,论文提出了一个支持任意网络拓扑的同步流水线并行训练算法,有效减少大规模神经网络的训练时间。
阿里云机器学习平台PAI与香港大学合作论文入选INFOCOM 2022,有效减少大规模神经网络训练时间
|
运维 大数据 数据建模
连载7:阿里巴巴大数据实践:OneData模型实施介绍
如何从具体的需求或项目转换为可实施的解决方案,如何进行需求分析、架构设计、详细模型设计等,则是模型实施过程中讨论的内容。
6600 1
连载7:阿里巴巴大数据实践:OneData模型实施介绍
|
9月前
|
算法 数据安全/隐私保护
泵浦光与斯托克斯光相遇耦合效应的matlab模拟与仿真
本程序使用MATLAB2022A模拟泵浦光与斯托克斯光在非线性光学材料中的耦合效应,基于拉曼散射原理。通过非线性薛定谔方程描述两者相互作用,实现能量转换与放大。核心代码展示了时间与距离上的光强变化,最终生成动态图像展示耦合过程。完整程序无水印,运行结果如附图所示。该仿真有助于理解非线性光学现象及其应用。
193 14
|
存储 网络协议 Java
【网络】UDP回显服务器和客户端的构造,以及连接流程
【网络】UDP回显服务器和客户端的构造,以及连接流程
265 3
|
11月前
|
算法
基于梯度流的扩散映射卡尔曼滤波算法的信号预处理matlab仿真
本项目基于梯度流的扩散映射卡尔曼滤波算法(GFDMKF),用于信号预处理的MATLAB仿真。通过设置不同噪声大小,测试滤波效果。核心代码实现数据加载、含噪信号生成、扩散映射构建及DMK滤波器应用,并展示含噪与无噪信号及滤波结果的对比图。GFDMKF结合非线性流形学习与经典卡尔曼滤波,提高对非线性高维信号的滤波和跟踪性能。 **主要步骤:** 1. 加载数据并生成含噪测量值。 2. 使用扩散映射捕捉低维流形结构。 3. 应用DMK滤波器进行状态估计。 4. 绘制不同SNR下的轨迹示例。
|
自然语言处理 数据库 C++
Table-GPT:让大语言模型理解表格数据
llm对文本指令非常有用,但是如果我们尝试向模型提供某种文本格式的表格数据和该表格上的问题,LLM更有可能产生不准确的响应。
883 0
|
存储 运维 监控
构建端到端可观测全景丨云栖大会可观测分享实录
构建端到端可观测全景丨云栖大会可观测分享实录
792 97

热门文章

最新文章