我们通过 Colossal-AI 做了 ColossalChat,是世界上首个开源的最接近 ChatGPT 原始技术方案,具备完整 RLHF 流程的低成本 ChatGPT 复现方案。只有 70 亿或 100 亿的参数模型可以达到更好效果。
这是原理图。
相对于业界标准,Colossal-AI 可以将推理上获得 30-50% 的提速,在训练上获得大概 7 倍加速。
包括可以把 ChatGPT 训练成本从 300 万美金降低到 140 万美金左右。
接下来是一些 demo 展示和与斯坦福羊驼的对比,以及一些更进一步分布式 PPO 和 evaluation 的工作。
当然,由于我们做的是计算优化,因此不会限制于某个特定行业或者模型,具备良好的通用性。例如对于生物医药行业的蛋白质预测模型 AlphaFold2,我们也可以优化提升约 10 倍的训练推理速度。
如果感兴趣可以看一下 Colossal-AI 官网,加我们的微信群,也非常欢迎大家在 GitHub 提 issue,或者提交 PR 共同建设 Colossal-AI 项目。我的介绍就到这里,谢谢。