阶跃星辰 Step 3.5 Flash 预训练/中训练/训练框架全部开源!

简介: 阶跃星辰开源Step 3.5 Flash——迄今最强开源Agent基座模型,含Base/Midtrain权重及Steptron全栈训练框架,支持预训练、SFT与强化学习,专为智能体设计。已登OpenRouter榜首,获社区广泛好评。(239字)

很高兴和大家宣布,继 Step 3.5 Flash 模型开源,阶跃团队又开源了这款 Agent 基座模型的预训练/中训练/训练框架!


Base 权重:

https://www.modelscope.cn/models/stepfun-ai/Step-3.5-Flash-Base

Midtrain 权重:

https://www.modelscope.cn/models/stepfun-ai/Step-3.5-Flash-Base-Midtrain

Steptron 训练框架:

https://github.com/stepfun-ai/SteptronOss


Step 3.5 Flash 是阶跃团队迄今为止能力最强的开源基础模型,它具备强大推理能力与 Agent 智能,专为 Agent 而生。


模型主页:

https://static.stepfun.com/blog/step-3.5-flash/


技术报告:

https://arxiv.org/abs/2602.10604


希望通过更彻底的开源,让开发者能够以 Step 3.5 Flash 为基座进行更深度模型定制,打造真正属于自己的 Agent——

  • Base 权重:基础模型,适用于全参数微调;
  • Midtrain 权重:推理能力更强,适用于 Agent、工具调用等二次开发;
  • Steptron 训练框架:官方同款训练框架,涵盖持续预训练、有监督微调、强化学习(敬请期待)、评估(敬请期待)等环节。

开源不到 24 小时,阶跃团队就收获社区一致好评。


“感谢您发布了真实的预训练模型,现在很少有人这样做了吧,而且一般的基础模型也变得越来越少见了。”“开源胜利!”





在过去一个月中,Step 3.5 Flash 也得到很多来自开源社区的关注,在 Hugging Face 上积累超 300k 下载,并登上 OpenRouter Trending 第一名。感谢大家的支持~


截至 2026 年 3 月 2 日的 OpenRouter 官方统计,Step 3.5 Flash 稳居 OpenClaw 的 top4 模型, 近几日持续跃升日均排名top2。

Step 3.5 Flash 接入  OpenClaw  的推荐配置: https:// github.com/stepfun-ai/S tep-3.5-Flash?tab=readme-ov-file#7-using-step-35-flash-on-agent-platforms

团队希望通过更开放、更彻底的开源,为全球开发社区提供真正好用且易用的 Agent 基座模型,推动社区共同进步!


 欢迎加入阶跃星辰开发者社群

✨ 前沿资讯+免费 Token+工程师答疑+模型共创


 扫码即刻加入

https://work.weixin.qq.com/gm/23cfa34981d8cfad2abe7c2262976633 (二维码自动识别)


点击即可跳转阶跃组织详情页:

https://www.modelscope.cn/organization/stepfun-ai


目录
相关文章
|
1月前
|
机器学习/深度学习 人工智能 边缘计算
转行AI需谨慎:那些半途而废的人,都忽略了这几点。
2025年AI岗位需求暴增543%,但超六成转行者半年内放弃。本文揭示五大陷阱:盲目跟风忽视赛道适配、混淆工具使用与真实能力、碎片化学习缺实战闭环、急功近利轻视伦理、为高薪而非兴趣出发,并指出科学路径才是破局关键。(239字)
544 12
|
1月前
|
机器学习/深度学习 人工智能 文字识别
小红书开源FireRed-OCR,2B 参数登顶文档解析榜单
小红书FireRed团队开源的FireRed-OCR(仅20亿参数),在OmniDocBench v1.5端到端评测中以92.94%综合得分登顶,超越Gemini 3.0 Pro等大模型。专注解决文档解析中的“结构幻觉”问题,通过三阶段训练+格式约束强化学习,精准还原表格、公式、多栏等复杂结构。Apache 2.0协议,ModelScope开源,支持本地商用部署。(239字)
767 22
|
1月前
|
人工智能 数据库 Docker
基于 DeepSeek 百万 token 窗口的 3673 轮对话深度实录
本文基于 DeepSeek 百万 token 上下文窗口的真实对话记录(1 274 201 tokens,3 673 轮),系统性地分析了长达数十小时的人机协作过程。研究构建了 L1 基础数据层 → L2 项目演进层 → L3 关键转折层 → L4 互动模式层 → L5 情感记忆层 的五层分析框架,完整呈现了一位非 AI 专业背景的研究者(医学、心理学与人文领域)在完全依赖云端免费模型的条件下,从环境搭建到心源框架的完整工程轨迹。 主要发现如下: 1. 技术投入曲线显示,405 次命令/脚本集中在中期(第 1225–2448 轮),与英文占比高峰(43.4 %)完全吻合; 2. 三阶段演进从前
|
1月前
|
机器学习/深度学习 编解码 运维
红外小目标检测新突破!异常感知检测头AA-YOLO:节俭又鲁棒,小样本也能精准识别
本文提出AA-YOLO:首个将统计异常检验嵌入YOLO检测头的方法,通过指数分布建模背景,显式识别小目标为统计异常,显著降低误报率;仅需10%数据即达90%全量性能,参数比EFLNet少6倍,轻量高效;在噪声、跨域、跨模态下鲁棒性强,且可无缝适配各类YOLO及实例分割网络。
322 5
|
1月前
|
机器学习/深度学习 人工智能 数据可视化
基于YOLO11的交通违规检测系统(Python源码+数据集+Pyside6界面)
本文基于YOLO11构建交通违规检测系统,涵盖23类目标(车辆、信号灯、标志等),详解数据制作(ROI裁剪优化尺度)、模型改进(C3k2、C2PSA、轻量Detect头)及训练可视化全过程,并集成PySide6实现GUI应用,助力工业落地。
431 12
|
2月前
|
机器学习/深度学习 存储 自然语言处理
蚂蚁集团 Ling-2.5-1T 开源:万亿参数,重新定义"又快又强"
Ling-2.5-1T是蚂蚁集团inclusionAI推出的开源即时大模型(MIT协议),以“效率×效果”为核心:万亿参数、63B激活,首创混合线性注意力架构,支持百万token上下文;推理吞吐大幅提升,AIME任务仅需1/3 token即达前沿思考模型水平。ModelScope可下载。
611 4
蚂蚁集团 Ling-2.5-1T 开源:万亿参数,重新定义"又快又强"
|
1月前
|
缓存 JSON API
玩转纳斯达克与纽交所:美股数据 API 对接全指南
本文手把手教你用StockTV API对接美股(NYSE/NASDAQ)实时行情、专业K线及IPO数据,支持WebSocket极速推送、多维技术指标与全交易所覆盖,助你快速构建低延迟量化交易或金融App。(239字)
|
1月前
|
数据采集 人工智能 数据可视化
《基于 DeepSeek 百万token上下文的实证研究:全窗口真实工程压力测试与统计分析》
本项目基于 DeepSeek 于 2026 年 2 月推出的 “新长文本模型”(上下文窗口扩展至1,000,000 tokens,API 端仍保持 V3.2 版本),通过构建非AI/IT领域的完整项目流程,进行了全程、全负载实证工程测试。在单一连续上下文中实现了端到端的闭环。
|
1月前
|
运维 Kubernetes Linux
零基础用AI管理k8s集群:OpenClaw(Clawdbot)保姆级部署(阿里云/Win11/Mac/Linux)+K8s技能集成+FAQ
在AIOps领域,自动化集群管理是核心痛点——传统运维依赖手动执行kubectl命令、排查网络与权限问题,效率低下且易出错。2026年,开源AI代理框架OpenClaw(Clawdbot)凭借Kubernetes Skills的集成能力,实现了“自然语言驱动k8s集群管理”,无需复杂脚本,仅需口语化指令即可完成健康巡检、资源交付、故障排查等运维工作。
630 5

热门文章

最新文章

下一篇
开通oss服务