01
介绍
大语言模型已经成为AI核心基础能力,全球发展方兴未艾,头部企业并驱争先。近日,全球AI专家李开复博士带队创办AI 2.0公司零一万物,正式开源发布 Yi Open-source。
零一万物此次开源发布的Yi系列预训练大模型包含34B和6B两个版本。Yi-6B 适合个人及研究用途,高质量 Yi-34B 已具大模型涌现能力,适合发挥于多元场景,满足开源社区的刚性需求。
根据 Hugging Face 英文开源社区平台和C-Eval 中文评测的最新榜单,Yi-34B在多项评测中全球领跑,在MMLU等评测中取得了多项 SOTA 国际最佳性能指标表现,以更小模型尺寸评测超越 LLaMA2-70B、Falcon-180B 等大尺寸开源模型,对开发者社群更为友好。
Yi-34B还直接开源了可支持200K 超长上下文窗口版本,可以处理约40万汉字超长文本输入。很多依赖于向量数据库构建外部知识库的场景,都可以用上下文窗口来进行替代,给想要在更长上下文窗口进行微调的开发者提供了更多的可能性。
目前Yi-34B和Yi-6B已在 Hugging Face、ModelScope、GitHub 三大全球开源社区平台正式上线,对学术研究完全开放,同步开放免费商用申请,给开源社区的开发者在使用LLM的过程中提供了更多、更优质的选择。
Yi-34B的模型尺寸在开源社区属于稀缺的“甜点级”尺寸,虽然不大但是已经达到了“涌现”的门槛。技术规格:
* 4 bit 可单张 4090 或 3090 24G 显存版本
本次开源的基座模型进行了比较均衡的IQ和EQ的配置,保留了后续进行不同方向微调的可能性。为了能让语言模型有更好的应用效果,广大开发者可以基于基座模型进行微调,GitHub 01Yi 开源网页上已经提供了简单的微调代码,同时模型和主流语言模型微调框架兼容,开发者可以自行进行适配。
从Yi-34B开始,接下来,零一万物还将基于Yi 基座模型,快节奏开源发布一系列的量化版本、对话模型、数学模型、代码模型和多模态模型等。
零一万物坚信基于大模型的技术将诞生比移动互联网大十倍的平台机会,AI 2.0 时代将诞生新一批 “AI-first” 的应用,于是坚定以生态开源方向全球首发,将第一款高质量模型贡献于国际开源社区。
我们相信生态与开发者是语言大模型的核心。邀请开发者跟我们一起搭建Yi开源模型的创新生态体系,引领下一代前沿创新和商业模型,零一万物也承诺以最大的努力,长期投入开源模型的迭代进步和开发者社群支持。
Look forward to seeing wonderful projects from the community 🔧💪
02
Yi Open-soruce 开源地址
ModelScope:
https://www.modelscope.cn/models/01ai/Yi-34B/summaryhttps://www.modelscope.cn/models/01ai/Yi-6B/summary
https://www.modelscope.cn/models/01ai/Yi-34B-200k/summary
https://www.modelscope.cn/models/01ai/Yi-6B-200k/summary
Hugging Face:
https://huggingface.co/01-ai/Yi-34B;https://huggingface.co/01-ai/Yi-34B-200K
https://huggingface.co/01-ai/Yi-6B;https://huggingface.co/01-ai/Yi-6B-200K
GitHub:
03
火热预告
2023年11月14日,抢先注册 01.AI Playground体验对话,提前试用Yi-34B Chat Model能力https://cn.mikecrm.com/gnEZjiQ(我们将根据报名信息匹配度选取试用者并提前联系)
预计两周内,Yi Open-source 将在开源平台正式发布 Yi-34B,Yi-6B Chat Model 及量化版本