Sky-T1:开源版"OpenAI o1-preview",训练成本竟不到450美元

本文涉及的产品
NLP 自学习平台,3个模型定制额度 1个月
NLP自然语言处理_高级版,每接口累计50万次
NLP自然语言处理_基础版,每接口每天50万次
简介: Sky-T1是NovaSky发布的开源推理AI模型,支持低成本训练,性能优异,适用于数学问题解决、编程评估和科学研究。

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日分享大模型与 AI 领域的最新开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦


🚀 快速阅读

  1. 开源模型:Sky-T1是首个开源的推理AI模型,训练数据和代码均已公开,支持从零开始复现。
  2. 低成本训练:模型训练成本不到450美元,显著低于传统高性能模型的训练成本。
  3. 高性能表现:在数学和编程评估中表现优异,适用于教育、科研和开发等领域。

正文(附运行示例)

Sky-T1 是什么

Sky-T1

Sky-T1是由加州大学伯克利分校Sky Computing实验室的研究团队NovaSky发布的开源推理AI模型,名为Sky-T1-32B-Preview。它是首个开源的推理模型,训练数据集和代码均已公开,用户可以从零开始复现该模型。模型的训练成本不到450美元,显著降低了高性能AI模型的训练门槛。

Sky-T1的训练数据由阿里巴巴的QwQ-32B-Preview推理模型生成,经过精心筛选和重构,基于OpenAI的GPT-4o-mini进行处理,更易于模型训练。在性能方面,Sky-T1在MATH500(一组“竞赛级”数学挑战)上的表现优于OpenAI早期版本o1的预览版本,同时在LiveCodeBench的编程评估中也表现更佳。

Sky-T1 的主要功能

  • 开源复现:训练数据集和代码均已公开,用户可以从零开始复现该模型。
  • 低成本训练:模型的训练成本不到450美元,显著低于以往同等性能模型的数百万美元训练成本。
  • 推理能力:Sky-T1能有效进行自我事实核查,避免一些常见陷阱,在得出解决方案时可能需要更长时间,从几秒到几分钟不等。
  • 高性能表现:在MATH500和LiveCodeBench的评估中表现优异,适用于数学问题解决和编程评估。

如何运行 Sky-T1

1. 克隆项目仓库

首先,克隆Sky-T1的GitHub仓库到本地:

git clone https://github.com/NovaSky-AI/Sky-T1-32B-Preview.git

2. 项目目录介绍

Sky-T1-32B-Preview的数据整理、训练和评估的代码和脚本,您可以在每个目录中找到更多详细信息。

  • /data:用于训练Sky-T1-32B-Preview的17,000条训练数据。我们还添加了来自STILL-2模型的科学和谜语部分。
  • skythought/tools:Sky-T1的训练数据整理和评估。为了生成我们的训练数据,我们使用了QwQ-32B-Preview模型。我们整理了数据混合,以涵盖需要推理的多样领域,并使用拒绝采样程序来提高数据质量。
  • skythought/train:Sky-T1的训练脚本。我们使用Llama-Factory进行训练。模型训练了3个epoch,学习率为1e-5,批次大小为96。我们的模型训练在8个H100 GPU上使用DeepSpeed Zero-3卸载技术完成,耗时19小时,根据Lambda Cloud的价格,费用约为450美元。

3. 运行推理示例

在运行前需要先安装必要的Python库:

pip install transformers

使用提供的示例代码运行推理:

from transformers import pipeline

messages = [
    {
   "role": "user", "content": "Who are you?"},
]
pipe = pipeline("text-generation", model="NovaSky-AI/Sky-T1-32B-Preview")
pipe(messages)

资源


❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日分享大模型与 AI 领域的最新开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦

相关文章
|
3天前
|
人工智能 搜索推荐 API
node-DeepResearch:开源复现版OpenAI Deep Research,支持多步推理和复杂查询的AI智能体
node-DeepResearch 是一个开源 AI 智能体项目,支持多步推理和复杂查询,帮助用户逐步解决问题。
77 27
node-DeepResearch:开源复现版OpenAI Deep Research,支持多步推理和复杂查询的AI智能体
|
17天前
|
机器学习/深度学习 人工智能 自然语言处理
DeepSeek 开源 R1 系列推理模型,性能对标 OpenAI o1,基于纯强化学习完成自我进化,无需监督微调
DeepSeek R1-Zero 是一款基于纯强化学习的开源推理模型,无需监督微调数据,支持多任务泛化与自我进化,适用于数学推理、代码生成等场景。
408 21
DeepSeek 开源 R1 系列推理模型,性能对标 OpenAI o1,基于纯强化学习完成自我进化,无需监督微调
|
2天前
|
人工智能 开发者
媲美OpenAI事实性基准,这个中文评测集让o1-preview刚刚及格
为评估大型语言模型(LLM)在中文语境下的事实性能力,研究团队推出“Chinese SimpleQA”评测集。该评测集具备中文、多样性、高质量、静态和易于评估的特点,涵盖六个主要主题和99个子主题。评估结果显示,尽管部分模型在特定领域表现出色,但整体事实性能力仍有待提升。Chinese SimpleQA为LLM开发者提供了宝贵工具,推动中文LLM的改进与发展。论文链接:https://arxiv.org/abs/2411.07140
26 14
|
1天前
|
存储 人工智能 JSON
Open-Deep-Research:开源复现版 Deep Research,支持切换多种大模型,不再依赖 OpenAI o3
Open Deep Research 是一个开源的 AI 智能体,支持多种语言模型,具备实时数据提取、多源数据整合和AI推理功能。
65 16
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
MetaGPT开源SELA,用AI设计AI,效果超越OpenAI使用的AIDE
MetaGPT团队开源了Tree-Search Enhanced LLM Agents(SELA)系统,通过蒙特卡罗树搜索(MCTS)优化AutoML过程,显著提升了机器学习模型的构建效率和性能。SELA在20个数据集上的实验结果表明,其性能优于传统AutoML方法和基于LLM的代理,为AutoML领域带来了新的突破。
74 4
|
3月前
|
SQL 机器学习/深度学习 人工智能
今日 AI 开源|共 4 项|DeepSeek 推出新一代 AI 推理模型,实力比肩 OpenAI o1-preview!
本文介绍了四个最新的 AI 开源项目,涵盖多模态生成式 AI、自然语言到 SQL 转化、多模态数学推理和复杂逻辑推理等多个领域,为 AI 应用开发提供了丰富的资源和工具。
353 0
今日 AI 开源|共 4 项|DeepSeek 推出新一代 AI 推理模型,实力比肩 OpenAI o1-preview!
|
5月前
|
人工智能 Serverless API
一键服务化:从魔搭开源模型到OpenAI API服务
在多样化大模型的背后,OpenAI得益于在领域的先发优势,其API接口今天也成为了业界的一个事实标准。
一键服务化:从魔搭开源模型到OpenAI API服务
|
5月前
|
测试技术 人机交互
没有等来OpenAI开源GPT-4o,等来了开源版VITA
【9月更文挑战第9天】近日,论文《Towards Open-Source Interactive Omni Multimodal LLM》介绍了VITA,一种基于Mixtral 8×7B的新型开源多模态大语言模型,能处理视频、图像、文本和音频等多模态数据,并提供先进的人机交互体验,填补了开源模型在多模态能力上的空白。经多任务学习及指令微调,VITA在多个基准测试中表现出色,但仍存在基础能力和嘈杂音频处理等方面的局限。更多详情见论文:https://arxiv.org/pdf/2408.05211
82 3
|
4月前
|
机器学习/深度学习 人工智能 并行计算
"震撼!CLIP模型:OpenAI的跨模态奇迹,让图像与文字共舞,解锁AI理解新纪元!"
【10月更文挑战第14天】CLIP是由OpenAI在2021年推出的一种图像和文本联合表示学习模型,通过对比学习方法预训练,能有效理解图像与文本的关系。该模型由图像编码器和文本编码器组成,分别处理图像和文本数据,通过共享向量空间实现信息融合。CLIP利用大规模图像-文本对数据集进行训练,能够实现zero-shot图像分类、文本-图像检索等多种任务,展现出强大的跨模态理解能力。
408 2
|
2月前
|
Go 开发工具
百炼-千问模型通过openai接口构建assistant 等 go语言
由于阿里百炼平台通义千问大模型没有完善的go语言兼容openapi示例,并且官方答复assistant是不兼容openapi sdk的。 实际使用中发现是能够支持的,所以自己写了一个demo test示例,给大家做一个参考。

热门文章

最新文章