首个中文Stable Diffusion模型背后的技术：IDEA研究院封神榜团队揭秘-阿里云开发者社区

首个中文Stable Diffusion模型背后的技术：IDEA研究院封神榜团队揭秘

2023-05-18 468

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 首个中文Stable Diffusion模型背后的技术：IDEA研究院封神榜团队揭秘

近年来，随着大模型在自然语言处理、计算机视觉等多个领域兴起，认知智能正在经历范式上的变化。借助大规模的数据以及庞大的参数量，这些模型展现出能够有效处理各种任务的特征，并正在以惊人的速度被部署到各个专业领域中，对社会和经济发展产生深远的影响。

但是目前中文社区出现了某种停滞不前的现象，因为模型的体量已经从原本的百万参数飞跃至千亿级别，一些高校和传统公司并不具备足够的算力，也缺少有效的基础设施帮助他们训练和使用模型。因此，要推动人工智能技术进一步发展，坚实的基础设施尤为重要。

在这个背景下，IDEA 研究院封神榜团队在过去快速积累的基础上，已经开源超过 86 个预训练模型，其中一个里程碑事件，就是近期刚刚开源的以中文为主的首个中文 Stable Diffusion 模型 “太乙”，让 AI 更懂中文，也让中文的世界真正拥有具备中国文化内核的 AIGC 模型。

至于Stable Diffusion，最近可是火出了圈，其模型的开源，催生了众多 AI 绘画的应用，得益于 Stability AI 的开源精神，这一创变推动了整个以英文为主的下游文生图生态的蓬勃发展。

然而在国内，大部分团队主要是基于翻译 API + 英文 Stable Diffusion 模型进行开发，由于中英文之间所得存在文化差异导致遇到中文独特的叙事和表达时，这种模型就很难给出正确匹配的图片内容。“太乙”的开源可谓是弥补了这一缺憾。

首个中文Stable Diffusion模型背后的技术：IDEA研究院封神榜团队揭秘