Kimi K2 模型更新,带来更强的代码能力、更快的 API

本文涉及的产品
模型训练 PAI-DLC,100CU*H 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
交互式建模 PAI-DSW,每月250计算时 3个月
简介: 今天,Kimi K2 模型的最新版本 0905 开源发布,进一步提升其在真实编程任务中的表现


image.png

今天,Kimi K2 模型的最新版本 0905 开源发布,进一步提升其在真实编程任务中的表现:

  • Agentic Coding 能力提升:在公开基准测试和真实的编程任务中均展现出更好的性能
  • 前端编程体验升级:提升了前端代码的美观度和实用性
  • 扩展上下文长度:从 128K 升级到 256K,为复杂长线任务提供更好的支持
  • 提供高速版 API:支持高达 60-100 Token/s 的输出速度

 

模型链接:

https://www.modelscope.cn/models/moonshotai/Kimi-K2-Instruct-0905

在侧重考察真实软件工程任务的 SWE-bench Verified 等基准测试中,新版 Kimi K2 模型的表现如下:

image.png

Kimi 应用和网页版中的 K2 模型已全量升级到 0905 最新版,下载 Kimi 应用或访问 kimi.com 即可体验新版模型。

Kimi 开放平台(platform.moonshot.cn)已上架 kimi-k2-0905-preview模型 API:

  • 上下文升级到 256K
  • Token Enforcer 保证 toolcall 100% 格式正确
  • 完全兼容 Anthropic API、并支持 WebSearch Tool,提供更好的 K2 + Claude Code 使用体验
  • 支持全自动 Context Caching,有助于节省 Input Token
  • 定价与之前的 0711 版相同
  • 速度达 60-100 Token/s 的高速版 API(kimi-k2-turbo-preview)已同步升级新模型

模型同步在ModelScope魔搭进行开源。同时开发者当前也可通过魔搭免费API-Inference进行API试用。

image.png

 

Kimi K2 模型最初发布于 7 月 11 日,它是一款混合专家架构(MoE)的开源基础模型,总参数 10000 亿,激活参数 320 亿。目前,AI 编程工具 Cursor、Windsurf、Trae、Cline、RooCode、Kilo Code 等已内置或接入了 Kimi K2 模型。国内外云服务厂商均部署了 Kimi K2 模型,为开发者提供更多选择。


Kimi K2 资料夹

技术博客:https://moonshotai.github.io/Kimi-K2/

技术报告:https://arxiv.org/abs/2507.20534

Github:https://github.com/moonshotai/kimi-K2

知乎讨论:https://www.zhihu.com/question/1927140506573435010

点击链接,即可跳转模型链接~

https://www.modelscope.cn/organization/moonshotai

目录
相关文章
|
4月前
|
JSON 监控 网络协议
干货分享“对接的 API 总是不稳定,网络分层模型” 看电商 API 故障的本质
本文从 OSI 七层网络模型出发,深入剖析电商 API 不稳定的根本原因,涵盖物理层到应用层的典型故障与解决方案,结合阿里、京东等大厂架构,详解如何构建高稳定性的电商 API 通信体系。
|
2月前
|
JSON API 调度
Midjourney 技术拆解与阿里云开发者实战指南:从扩散模型到 API 批量生成
Midjourney深度解析:基于优化Stable Diffusion,实现文本到图像高效生成。涵盖技术架构、扩散模型原理、API调用、批量生成系统及阿里云生态协同,助力开发者快速落地AIGC图像创作。
476 0
|
2月前
|
人工智能 API 监控
告别多接口拼凑!阿里云 API 模型聚合实现技术能力协同跃迁
API聚合整合400+国内外AI模型,统一接口、屏蔽差异,降低开发与维护成本,提升效率与系统稳定性,助力开发者高效应对多API调用困境。
318 0
|
4月前
|
API
本地用阿里云API调用的r1模型,返回的think字段中有奇怪的东西,并且停止思考
这两张图片展示了模型生成内容时可能出现的异常情况,包括图像模糊、结构错误或不符合预期的结果。这可能是由于模型训练数据不足、输入指令不清晰或模型本身存在局限性所致。建议优化输入提示词或调整模型参数以提升输出质量。
|
10月前
|
自然语言处理 安全 API
API First:模型驱动的阿里云API保障体系
本文介绍了阿里云在API设计和管理方面的最佳实践。首先,通过API First和模型驱动的方式确保API的安全、稳定和效率。其次,分享了阿里云内部如何使用CloudSpec IDL语言及配套工具保障API质量,并实现自动化生成多语言SDK等工具。接着,描述了API从设计到上线的完整生命周期,包括规范校验、企业级能力接入、测试和发布等环节。最后,展望了未来,强调了持续提升API质量和开源CloudSpec IDL的重要性,以促进社区共建更好的API生态。
|
5月前
|
缓存 自然语言处理 监控
基于通义大模型的智能客服系统构建实战:从模型微调到API部署
本文详细解析了基于通义大模型的智能客服系统构建全流程,涵盖数据准备、模型微调、性能优化及API部署等关键环节。通过实战案例与代码演示,展示了如何针对客服场景优化训练数据、高效微调大模型、解决部署中的延迟与并发问题,以及构建完整的API服务与监控体系。文章还探讨了性能优化进阶技术,如模型量化压缩和缓存策略,并提供了安全与合规实践建议。最终总结显示,微调后模型意图识别准确率提升14.3%,QPS从12.3提升至86.7,延迟降低74%。
1760 15
|
11月前
|
存储 人工智能 API
AgentScope:阿里开源多智能体低代码开发平台,支持一键导出源码、多种模型API和本地模型部署
AgentScope是阿里巴巴集团开源的多智能体开发平台,旨在帮助开发者轻松构建和部署多智能体应用。该平台提供分布式支持,内置多种模型API和本地模型部署选项,支持多模态数据处理。
5852 77
AgentScope:阿里开源多智能体低代码开发平台,支持一键导出源码、多种模型API和本地模型部署
|
7月前
|
人工智能 算法 安全
OpenRouter 推出百万 token 上下文 AI 模型!Quasar Alpha:提供完全免费的 API 服务,同时支持联网搜索和多模态交互
Quasar Alpha 是 OpenRouter 推出的预发布 AI 模型,具备百万级 token 上下文处理能力,在代码生成、指令遵循和低延迟响应方面表现卓越,同时支持联网搜索和多模态交互。
619 1
OpenRouter 推出百万 token 上下文 AI 模型!Quasar Alpha:提供完全免费的 API 服务,同时支持联网搜索和多模态交互
|
8月前
|
人工智能 自然语言处理 API
零门槛,即刻拥有DeepSeek-R1满血版——调用API及部署各尺寸模型
本文介绍了如何利用阿里云技术快速部署和使用DeepSeek系列模型,涵盖满血版API调用和云端部署两种方案。DeepSeek在数学、代码和自然语言处理等复杂任务中表现出色,支持私有化部署和企业级加密,确保数据安全。通过详细的步骤和代码示例,帮助开发者轻松上手,提升工作效率和模型性能。解决方案链接:[阿里云DeepSeek方案](https://www.aliyun.com/solution/tech-solution/deepseek-r1-for-platforms?utm_content=g_1000401616)。
零门槛,即刻拥有DeepSeek-R1满血版——调用API及部署各尺寸模型
|
10月前
|
机器学习/深度学习 人工智能 安全
GLM-Zero:智谱AI推出与 OpenAI-o1-Preview 旗鼓相当的深度推理模型,开放在线免费使用和API调用
GLM-Zero 是智谱AI推出的深度推理模型,专注于提升数理逻辑、代码编写和复杂问题解决能力,支持多模态输入与完整推理过程输出。
572 24
GLM-Zero:智谱AI推出与 OpenAI-o1-Preview 旗鼓相当的深度推理模型,开放在线免费使用和API调用

热门文章

最新文章