社区供稿 | 零一万物 Yi-34B开源大模型,邀请全球开发者共建创新生态

本文涉及的产品
模型训练 PAI-DLC,100CU*H 3个月
交互式建模 PAI-DSW,每月250计算时 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
简介: 大语言模型已经成为AI核心基础能力,全球发展方兴未艾,头部企业并驱争先。近日,全球AI专家李开复博士带队创办AI 2.0公司零一万物,正式开源发布 Yi Open-source。

01

介绍


大语言模型已经成为AI核心基础能力,全球发展方兴未艾,头部企业并驱争先。近日,全球AI专家李开复博士带队创办AI 2.0公司零一万物,正式开源发布 Yi Open-source。


零一万物此次开源发布的Yi系列预训练大模型包含34B和6B两个版本。Yi-6B 适合个人及研究用途,高质量 Yi-34B 已具大模型涌现能力,适合发挥于多元场景,满足开源社区的刚性需求。


根据 Hugging Face 英文开源社区平台和C-Eval 中文评测的最新榜单,Yi-34B在多项评测中全球领跑,在MMLU等评测中取得了多项 SOTA 国际最佳性能指标表现,以更小模型尺寸评测超越 LLaMA2-70B、Falcon-180B 等大尺寸开源模型,对开发者社群更为友好。


Yi-34B还直接开源了可支持200K 超长上下文窗口版本,可以处理约40万汉字超长文本输入。很多依赖于向量数据库构建外部知识库的场景,都可以用上下文窗口来进行替代,给想要在更长上下文窗口进行微调的开发者提供了更多的可能性。


目前Yi-34B和Yi-6B已在 Hugging Face、ModelScope、GitHub 三大全球开源社区平台正式上线,对学术研究完全开放,同步开放免费商用申请,给开源社区的开发者在使用LLM的过程中提供了更多、更优质的选择。


Yi-34B的模型尺寸在开源社区属于稀缺的“甜点级”尺寸,虽然不大但是已经达到了“涌现”的门槛。技术规格:

* 4 bit 可单张 4090 或 3090 24G 显存版本


本次开源的基座模型进行了比较均衡的IQ和EQ的配置,保留了后续进行不同方向微调的可能性。为了能让语言模型有更好的应用效果,广大开发者可以基于基座模型进行微调,GitHub 01Yi 开源网页上已经提供了简单的微调代码,同时模型和主流语言模型微调框架兼容,开发者可以自行进行适配。


从Yi-34B开始,接下来,零一万物还将基于Yi 基座模型,快节奏开源发布一系列的量化版本、对话模型、数学模型、代码模型和多模态模型等。


零一万物坚信基于大模型的技术将诞生比移动互联网大十倍的平台机会,AI 2.0 时代将诞生新一批 “AI-first” 的应用,于是坚定以生态开源方向全球首发,将第一款高质量模型贡献于国际开源社区。


我们相信生态与开发者是语言大模型的核心。邀请开发者跟我们一起搭建Yi开源模型的创新生态体系,引领下一代前沿创新和商业模型,零一万物也承诺以最大的努力,长期投入开源模型的迭代进步和开发者社群支持。


Look forward to seeing wonderful projects from the community 🔧💪


02

Yi Open-soruce 开源地址


ModelScope:

https://www.modelscope.cn/models/01ai/Yi-34B/summaryhttps://www.modelscope.cn/models/01ai/Yi-6B/summary

https://www.modelscope.cn/models/01ai/Yi-34B-200k/summary

https://www.modelscope.cn/models/01ai/Yi-6B-200k/summary


Hugging Face:

https://huggingface.co/01-ai/Yi-34B;https://huggingface.co/01-ai/Yi-34B-200K

https://huggingface.co/01-ai/Yi-6B;https://huggingface.co/01-ai/Yi-6B-200K  


GitHub:

https://github.com/01-ai/Yi 


03

火热预告


2023年11月14日,抢先注册 01.AI Playground体验对话,提前试用Yi-34B Chat Model能力https://cn.mikecrm.com/gnEZjiQ(我们将根据报名信息匹配度选取试用者并提前联系)


预计两周内,Yi Open-source 将在开源平台正式发布 Yi-34B,Yi-6B Chat Model 及量化版本


相关文章
|
7月前
|
存储 人工智能 自然语言处理
社区供稿 | 开放开源!蚂蚁集团浙江大学联合发布开源大模型知识抽取框架OneKE
OneKE 是由蚂蚁集团和浙江大学联合研发的大模型知识抽取框架,具备中英文双语、多领域多任务的泛化知识抽取能力,并提供了完善的工具链支持。OneKE 以开源形式贡献给 OpenKG 开放知识图谱社区。
|
2月前
|
人工智能 安全 自动驾驶
【通义】AI视界|英特尔和AMD“史无前例”首次合作,组建X86生态系统咨询小组
本文概览了近期科技领域的五大热点新闻,包括联想与Meta合作推出个人AI智能体“AI Now”,英特尔和AMD首次合作组建X86生态系统咨询小组,特斯拉计划大规模生产自动驾驶出租车,前Palantir首席信息安全官加盟OpenAI,以及Meta因涉嫌损害青少年心理健康面临美国多州诉讼。更多资讯,请访问通义平台。
|
4月前
|
人工智能 大数据
实践证明+奖学金+项目履历!魔搭社区联合主办的AI 夏令营来了
2024 AI夏令营,由Datawhale主办,联合科大讯飞、阿里云天池、蚂蚁集团、英特尔、浪潮信息、魔搭社区等国内外顶尖人工智能企业。
|
7月前
|
机器学习/深度学习 人工智能 安全
DeepMind前成员推出Haiper:AI视频生成赛道再添新势力
【2月更文挑战第16天】DeepMind前成员推出Haiper:AI视频生成赛道再添新势力
364 2
DeepMind前成员推出Haiper:AI视频生成赛道再添新势力
|
7月前
|
Linux Anolis 开发者
|
人工智能 算法 数据处理
零一万物发布首款大模型,阿里云魔搭社区开源首发
零一万物发布首款大模型,阿里云魔搭社区开源首发
371 0
|
人工智能 边缘计算 Cloud Native
2023开放原子全球开源峰会参会感受:英特尔开源技术合作与产品创新
2023开放原子全球开源峰会参会感受:英特尔开源技术合作与产品创新
71 0
|
人工智能 达摩院 自然语言处理
首批开源超300个顶尖模型:这几家中国「AI主力军」,合力打造了一个AI模型社区「魔搭」
首批开源超300个顶尖模型:这几家中国「AI主力军」,合力打造了一个AI模型社区「魔搭」
288 0
|
人工智能 达摩院 自然语言处理
阿里达摩院五年磨一剑,重磅推出AI模型社区,直击“AI应用难”
11月3日,2022云栖大会杭州现场,阿里达摩院联手CCF开源发展委员会共同推出AI模型社区“魔搭”ModelScope,旨在降低AI的应用门槛。达摩院率先向魔搭社区贡献300多个经过验证的优质AI模型,超过1/3为中文模型,全面开源开放,并且把模型变为直接可用的服务。
539 0
|
机器学习/深度学习 人工智能 弹性计算
五年磨一剑:阿里达摩院重磅推出AI模型社区「魔搭」,300+模型全面开源
五年磨一剑:阿里达摩院重磅推出AI模型社区「魔搭」,300+模型全面开源
1179 0

热门文章

最新文章

下一篇
DataWorks