这款开源人工智能模型,你可以进行微调、蒸馏并在任何地方部署。最新的指令调优模型有8B、70B和405B版本可供选择。
模型
- 405B 旗舰基础模型,支持最广泛的使用案例。
- 70B 性能卓越、成本效益高的模型,支持多种使用案例。
- 8B 轻量级、超快速的模型,可在任何地方运行。
关键能力
- 工具使用
- 多语言代理
- 复杂推理
- 编码助手
让羊驼成为你自己的
使用我们的开放生态系统,通过选择一系列差异化的产品服务来更快地构建,以支持你的使用案例。
- 推理 选择实时推理或批量推理服务。下载模型权重以进一步优化每个代币的成本。
- 微调、蒸馏与部署 为你的应用程序进行适应性调整,使用合成数据进行改进,并部署在本地或云端。
- RAG与工具使用 使用羊驼系统组件,并通过零样本工具使用和RAG扩展模型,以构建具有代理行为的模型。
- 合成数据生成 利用405B高质量数据,改进针对特定使用案例的专业模型。
快速开始与合作伙伴
模型评估
在超过150个基准数据集上进行测量,这些数据集涵盖了多种语言,并经过广泛的人类评估。
模型定价
截至2024年7月23日12:00 PST,托管Llama 3.1推理API的公共定价为每百万个令牌。此表格将随着更多定价信息的可用而更新。