社区供稿 | 零一万物 Yi-34B开源大模型,邀请全球开发者共建创新生态

简介: 大语言模型已经成为AI核心基础能力,全球发展方兴未艾,头部企业并驱争先。近日,全球AI专家李开复博士带队创办AI 2.0公司零一万物,正式开源发布 Yi Open-source。

01

介绍


大语言模型已经成为AI核心基础能力,全球发展方兴未艾,头部企业并驱争先。近日,全球AI专家李开复博士带队创办AI 2.0公司零一万物,正式开源发布 Yi Open-source。


零一万物此次开源发布的Yi系列预训练大模型包含34B和6B两个版本。Yi-6B 适合个人及研究用途,高质量 Yi-34B 已具大模型涌现能力,适合发挥于多元场景,满足开源社区的刚性需求。


根据 Hugging Face 英文开源社区平台和C-Eval 中文评测的最新榜单,Yi-34B在多项评测中全球领跑,在MMLU等评测中取得了多项 SOTA 国际最佳性能指标表现,以更小模型尺寸评测超越 LLaMA2-70B、Falcon-180B 等大尺寸开源模型,对开发者社群更为友好。


Yi-34B还直接开源了可支持200K 超长上下文窗口版本,可以处理约40万汉字超长文本输入。很多依赖于向量数据库构建外部知识库的场景,都可以用上下文窗口来进行替代,给想要在更长上下文窗口进行微调的开发者提供了更多的可能性。


目前Yi-34B和Yi-6B已在 Hugging Face、ModelScope、GitHub 三大全球开源社区平台正式上线,对学术研究完全开放,同步开放免费商用申请,给开源社区的开发者在使用LLM的过程中提供了更多、更优质的选择。


Yi-34B的模型尺寸在开源社区属于稀缺的“甜点级”尺寸,虽然不大但是已经达到了“涌现”的门槛。技术规格:

* 4 bit 可单张 4090 或 3090 24G 显存版本


本次开源的基座模型进行了比较均衡的IQ和EQ的配置,保留了后续进行不同方向微调的可能性。为了能让语言模型有更好的应用效果,广大开发者可以基于基座模型进行微调,GitHub 01Yi 开源网页上已经提供了简单的微调代码,同时模型和主流语言模型微调框架兼容,开发者可以自行进行适配。


从Yi-34B开始,接下来,零一万物还将基于Yi 基座模型,快节奏开源发布一系列的量化版本、对话模型、数学模型、代码模型和多模态模型等。


零一万物坚信基于大模型的技术将诞生比移动互联网大十倍的平台机会,AI 2.0 时代将诞生新一批 “AI-first” 的应用,于是坚定以生态开源方向全球首发,将第一款高质量模型贡献于国际开源社区。


我们相信生态与开发者是语言大模型的核心。邀请开发者跟我们一起搭建Yi开源模型的创新生态体系,引领下一代前沿创新和商业模型,零一万物也承诺以最大的努力,长期投入开源模型的迭代进步和开发者社群支持。


Look forward to seeing wonderful projects from the community 🔧💪


02

Yi Open-soruce 开源地址


ModelScope:

https://www.modelscope.cn/models/01ai/Yi-34B/summaryhttps://www.modelscope.cn/models/01ai/Yi-6B/summary

https://www.modelscope.cn/models/01ai/Yi-34B-200k/summary

https://www.modelscope.cn/models/01ai/Yi-6B-200k/summary


Hugging Face:

https://huggingface.co/01-ai/Yi-34B;https://huggingface.co/01-ai/Yi-34B-200K

https://huggingface.co/01-ai/Yi-6B;https://huggingface.co/01-ai/Yi-6B-200K  


GitHub:

https://github.com/01-ai/Yi 


03

火热预告


2023年11月14日,抢先注册 01.AI Playground体验对话,提前试用Yi-34B Chat Model能力https://cn.mikecrm.com/gnEZjiQ(我们将根据报名信息匹配度选取试用者并提前联系)


预计两周内,Yi Open-source 将在开源平台正式发布 Yi-34B,Yi-6B Chat Model 及量化版本


相关文章
|
数据可视化 PyTorch 算法框架/工具
“零一万物”Yi系列魔搭最佳实践教程来了!
11 月 6 日,李开复博士带队创办的AI2.0公司零一万物正式开源发布首款预训练大模型 Yi-34B,模型开放商用申请,已在阿里云魔搭社区ModelScope首发。魔搭第一时间推出了模型部署相关教程,供开发者参考并快速上手。
|
NoSQL Redis Docker
Mac下Docker安装Redis
Mac下Docker安装Redis
1156 0
|
数据可视化 IDE 编译器
Open CASCADE之v7.4.0源码编译与可视化调试,使用VS2017+32位编译器(1)
Open CASCADE之v7.4.0源码编译与可视化调试,使用VS2017+32位编译器
1974 0
Open CASCADE之v7.4.0源码编译与可视化调试,使用VS2017+32位编译器(1)
|
6月前
|
机器学习/深度学习 弹性计算 人工智能
阿里云服务器收费标准:今年最新价格表,ECS、轻量和GPU云服务器报价清单
阿里云今年最新云服务器租用优惠价格表,这个月的价格和上个月持平,阿小云整理最新优惠价格:依旧是轻量应用服务器200M峰值带宽68元1年(秒杀38元),ECS云服务器2核2G3M带宽99元一年、2核4G、5M带宽、80G系统盘优惠价格199元一年,4核16G服务器10M带宽89元1个月,8核32G服务器10M固定带宽160元一个月,阿里云香港轻量服务器200M带宽25元个月起。
|
SQL 缓存 Java
MyBatis最经典的20道面试题,你都会了吗?
MyBatis最经典的20道面试题,你都会了吗?
570 0
|
JSON 前端开发 JavaScript
解决跨域问题
解决跨域问题
|
运维 数据可视化 开发者
Dpanel:Star2k,短短时间就被大家称为GitHub开源神器!轻量化Docker面板,还在等什么
如今的软件开发和运维领域,Docker容器技术已经成为一种主流的解决方案,它允许开发者和系统管理员以更高效、更灵活的方式部署和管理应用程序。然而,Docker的命令行界面虽然强大,但对于某些用户来说可能不够直观。今天,我们要介绍的开源项目——dpanel,就是一个轻量化的Docker可视化管理面板,它以其简洁、高效的特点,为用户提供了一个易于操作的界面来管理Docker容器和镜像。
1922 0
|
消息中间件 存储 缓存
为什么 Kafka 的吞吐量那么高?
为什么 Kafka 的吞吐量那么高?
554 2
|
机器学习/深度学习 人工智能 自然语言处理
算法金 | 一文看懂人工智能、机器学习、深度学习是什么、有什么区别!
**摘要:** 了解AI、ML和DL的旅程。AI是模拟人类智能的科学,ML是其分支,让机器从数据中学习。DL是ML的深化,利用多层神经网络处理复杂数据。AI应用广泛,包括医疗诊断、金融服务、自动驾驶等。ML助力个性化推荐和疾病预测。DL推动计算机视觉和自然语言处理的进步。从基础到实践,这些技术正改变我们的生活。想要深入学习,可参考《人工智能:一种现代的方法》和《深度学习》。一起探索智能的乐趣!
808 1
算法金 | 一文看懂人工智能、机器学习、深度学习是什么、有什么区别!
|
网络协议 网络虚拟化
BGP EVPN(一)
BGP EVPN(一)

热门文章

最新文章