国内首发,百川13B大模型上架魔搭

本文涉及的产品
交互式建模 PAI-DSW,每月250计算时 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
模型训练 PAI-DLC,100CU*H 3个月
简介: 今日,百川智能发布130亿参数通用大语言模型Baichuan-13B-base和对话模型Baichuan-13B-Chat。两个模型全都开源、免费、可商用,均已在魔搭社区上架,属于国内首发。

模型介绍


今日,百川智能发布130亿参数通用大语言模型Baichuan-13B-base和对话模型Baichuan-13B-Chat。两个模型全都开源、免费、可商用,均已在魔搭社区上架,属于国内首发。


image.png


6 月 15 日,百川智能刚刚发布第一款 70 亿参数规模的中英文语言模型 Baichuan-7B,该模型也于当天在魔搭上架。


对比 Baichuan-7B,Baichuan-13B拥有更多参数和语料,模型参数130亿,在1.4万亿token数据集上训练,训练数据量超过LLaMA-13B 40%,是当前开源13B尺寸下训练数据量最多的模型。


本次发布,共包含基础模型(Baichuan-13B-Base)和对齐模型(Baichuan-13B-Chat)两个版本。基础模型是适用于开发者的“基座”,具有对话功能的对齐模型则可以满足普通用户的需求。


为了进一步降低模型使用门槛,满足更广大用户的需求,百川智能还开源了对齐模型(Baichuan-13B-Chat)的int8和int4两个量化版本,相对非量化版本,可以在几乎没有效果损失的情况下大幅降低部署门槛,比如将模型部署在Nvidia 3090等消费级显卡上。


此次推出的 Baichuan-13B 对学术研究完全开放,其他开发者也可通过邮件向百川智能申请授权,并获得官方商用许可后即可免费商用。


魔搭社区成立于2022年11月,致力于成为中国开源大模型第一平台,现已聚集 180 多万 AI 开发者,模型下载总量超过 3600 万次,累计开源开放 900多个优质AI模型,模型贡献者包括20多家顶尖人工智能机构,基本覆盖国内大模型赛道核心玩家,如百川智能、哔哩哔哩、IDEA研究院、兰丁股份、澜舟科技、openBMB社区、启智社区、清华TSAIL、RWKV、深势科技、WeNet社区、元语智能、浙江大学、智谱AI等(排名不分先后),他们贡献了30多个10亿以上参数规模的开源大模型。


找大模型,上魔搭!


模型链接


基础模型链接:

https://modelscope.cn/models/Baichuan-inc/Baichuan-13B-Base/summary


对话模型链接:

https://modelscope.cn/models/baichuan-inc/Baichuan-13B-Chat/summary


相关文章
|
网络协议 关系型数据库 MySQL
如何在Android Termux上安装MySQL并实现公网远程访问?
如何在Android Termux上安装MySQL并实现公网远程访问?
496 0
|
存储 编解码 调度
剖析ffmpeg视频解码播放:时间戳的处理
剖析ffmpeg视频解码播放:时间戳的处理
1169 0
|
人工智能 算法 开发工具
Mixtral 8X7B MoE模型在阿里云PAI平台的微调部署实践
Mixtral 8x7B 是Mixtral AI最新发布的大语言模型,是当前最为先进的开源大语言模型之一。阿里云人工智能平台PAI,提供了对于 Mixtral 8x7B 模型的全面支持,开发者和企业用户可以基于 PAI-快速开始轻松完成Mixtral 8x7B 模型的微调和部署。
|
7月前
|
算法 数据安全/隐私保护
泵浦光与斯托克斯光相遇耦合效应的matlab模拟与仿真
本程序使用MATLAB2022A模拟泵浦光与斯托克斯光在非线性光学材料中的耦合效应,基于拉曼散射原理。通过非线性薛定谔方程描述两者相互作用,实现能量转换与放大。核心代码展示了时间与距离上的光强变化,最终生成动态图像展示耦合过程。完整程序无水印,运行结果如附图所示。该仿真有助于理解非线性光学现象及其应用。
159 14
|
机器学习/深度学习 算法 搜索推荐
阿里云机器学习平台PAI与香港大学合作论文入选INFOCOM 2022,有效减少大规模神经网络训练时间
近日,阿里云机器学习平台 PAI 与香港大学吴川教授团队合作的论文”Efficient Pipeline Planning for Expedited Distributed DNN Training”入选INFOCOM(IEEE International Conference on Computer Communications) 2022,论文提出了一个支持任意网络拓扑的同步流水线并行训练算法,有效减少大规模神经网络的训练时间。
阿里云机器学习平台PAI与香港大学合作论文入选INFOCOM 2022,有效减少大规模神经网络训练时间
|
9月前
|
算法
基于梯度流的扩散映射卡尔曼滤波算法的信号预处理matlab仿真
本项目基于梯度流的扩散映射卡尔曼滤波算法(GFDMKF),用于信号预处理的MATLAB仿真。通过设置不同噪声大小,测试滤波效果。核心代码实现数据加载、含噪信号生成、扩散映射构建及DMK滤波器应用,并展示含噪与无噪信号及滤波结果的对比图。GFDMKF结合非线性流形学习与经典卡尔曼滤波,提高对非线性高维信号的滤波和跟踪性能。 **主要步骤:** 1. 加载数据并生成含噪测量值。 2. 使用扩散映射捕捉低维流形结构。 3. 应用DMK滤波器进行状态估计。 4. 绘制不同SNR下的轨迹示例。
|
自然语言处理 数据库 C++
Table-GPT:让大语言模型理解表格数据
llm对文本指令非常有用,但是如果我们尝试向模型提供某种文本格式的表格数据和该表格上的问题,LLM更有可能产生不准确的响应。
780 0
|
自然语言处理 IDE 测试技术
通义灵码怎么样?分为哪些版本,看看基础能力多少分?
通义灵码是一款基于通义大模型的智能编码辅助工具,提供实时代码续写、自然语言生成代码、单元测试生成、代码优化、注释生成、代码解释等功能。
|
资源调度 JavaScript
Electron 集成 Vue —— electron-vue
Electron 集成 Vue —— electron-vue
238 0
|
机器学习/深度学习 存储 算法
数据结构和算法学习记录——树(基本介绍、树的定义、树的特点、树的一些基本术语、树的表示、儿子-兄弟表示法)
数据结构和算法学习记录——树(基本介绍、树的定义、树的特点、树的一些基本术语、树的表示、儿子-兄弟表示法)
316 0

热门文章

最新文章