大佬出走后首个发布!Stability官宣代码模型Stable Code Instruct 3B

简介: Stability AI发布Stable Code Instruct 3B,一款高效代码模型,参数量仅30亿却在多编程语言基准测试中表现媲美70亿至150亿参数模型。该模型专为代码补全、逻辑推理等任务设计,其指令优化版提供直观交互,提升开发效率。团队通过Hugging Face公开模型权重,支持复现与应用。在Multi-PL基准和MT-Bench测试中表现出色,即使面对更大数据训练的模型也能保持高效性能。量化版本确保兼容性和低延迟应用。

微信图片_20240224080954.jpg
近日,全球知名人工智能公司Stability AI重磅发布了其新一代代码语言模型系列中的首款产品——Stable Code,并同步推出了针对指令交互优化的版本Stable Code Instruct 3B。这款新颖而高效的代码模型凭借其卓越的表现,在多项编程基准测试中展现出了不俗的实力,特别是在参数量较少的情况下,它与更大规模的70亿至150亿参数模型相媲美,甚至在流行的多编程语言(Multi-PL)基准测试中达到了当前最先进水平。

Stable Code系列作为通用型基础代码语言模型,旨在服务于多种软件工程相关的任务,包括但不限于代码补全、逻辑推理、数学运算以及其他基于编程的任务。同时,Stable Code Instruct版本则专为通过自然对话界面执行问答与指令驱动任务而设计,让用户能够以更加直观的方式与模型交流互动,极大地提升了用户体验与工作效率。

Stable Code项目背后的团队细致入微地介绍了用于训练这两个模型的数据集及其构建过程。值得一提的是,为了确保研究成果可复现及广泛使用,他们通过Hugging Face平台公开了这两个模型的权重,供全球研究者与开发者自由下载和应用。技术报告中详尽展示了对这两种模型的全面评估,涉及多语言编程基准测试以及特别关注多轮对话能力的MT基准测试。

报告显示,尽管Stable Code模型在参数量上仅为30亿级别,远小于诸如Code Llama等高达70亿参数或StarCoder 15B这样拥有150亿参数的大型模型,但在各主流编程语言上的表现却能与之比肩,尤其是在代码补全任务上展现出了极强的能力。而StarCoder v2这一基于更多数据训练的新款模型虽然总体性能略胜于Stable Code 3B,但这无疑凸显了Stable Code在相对较小参数规模下的高效率和优异性能。

对于Stable Code Instruct而言,其在经过指令调优后的表现同样出色。在多编程语言(Multi-PL)基准测试中,相比于其他同等级别参数量的指令调优模型,Stable Code Instruct 3B的成绩遥遥领先,显示出强大的代码理解和生成能力。此外,在更复杂的Fill in the Middle(FIM)代码补全任务以及聚焦多轮对话挑战的MT-Bench编码问题评测中,Stable Code Instruct也展现出顶尖水准。

考虑到实际应用环境中的速度和内存需求,Stability AI团队不仅提供了量化版本的Stable Code模型,还保证了它们与广泛应用的推理库如llama.cpp及Apple MLX的高度兼容性。通过对模型进行量化处理,用户可以在各种边缘设备上实现更高的吞吐率,同时减小存储空间占用和计算资源需求,这对于需要实时响应和低延迟操作的代码编辑工具尤为关键。

论文地址:https://static1.squarespace.com/static/6213c340453c3f502425776e/t/6601c5713150412edcd56f8e/1711392114564/Stable_Code_TechReport_release.pdf

目录
相关文章
|
5月前
|
人工智能 缓存 API
谷歌发布MediaPipe LLM Inference API,28亿参数模型本地跑
【2月更文挑战第24天】谷歌发布MediaPipe LLM Inference API,28亿参数模型本地跑
255 3
谷歌发布MediaPipe LLM Inference API,28亿参数模型本地跑
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
谷歌AI Gemini 官方网站是什么?国内如何使用Gemini 1.5 pro
Gemini是Google开发的先进大型语言模型(LLM),旨在处理多种自然语言处理任务,如文本生成、翻译、摘要和对话生成。作为Google AI项目的一部分,Gemini结合了最新的研究成果和技术,显著提高了自然语言处理的准确性和效率。该模型经过大量文本数据的训练,使其能够理解和生成高质量的文本。
|
4月前
|
人工智能 API 流计算
[AI Stability] 开源AI新利器:Stable Diffusion 3 Medium震撼发布!文本到图像再升级!
探索 Stable Diffusion 3 Medium(SD3),Stability AI 的最新开源模型,正在彻底改变文本到图像的生成。了解其功能、许可选项和集成可能性。
[AI Stability] 开源AI新利器:Stable Diffusion 3 Medium震撼发布!文本到图像再升级!
|
4月前
|
人工智能
[AI Google] 三种新方法利用 Gemini 提高 Google Workspace 的生产力
Workspace 侧边栏中的 Gemini 现在将使用 Gemini 1.5 Pro,新的 Gemini for Workspace 功能即将登陆 Gmail 移动应用,等等。
[AI Google] 三种新方法利用 Gemini 提高 Google Workspace 的生产力
|
5月前
|
存储 人工智能 数据可视化
[译][AI OpenAI-doc] 助手如何工作(Beta)
助手 API 旨在帮助开发人员构建功能强大的 AI 助手,能够执行各种任务。
[译][AI OpenAI-doc] 助手如何工作(Beta)
|
4月前
|
人工智能 分布式计算 调度
人工智能平台PAI产品使用合集之Stable Diffusion如何部署
阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。
|
5月前
|
存储 人工智能 JSON
[译][AI OpenAI-doc] v2 有什么新功能?Beta
2024年4月,我们宣布了一系列新功能和改进的助手API,并将我们的Beta版移至一个新的API版本,OpenAI-Beta: assistants=v2。了解更多详情,请查看我们的迁移指南。
|
5月前
|
前端开发 视频直播 vr&ar
Vision Pro:编程领域的新里程碑
近期技术圈的王炸之一,非苹果的Vision Pro莫属,苹果推出的Vision Pro高端AR头显在开发者圈引起了轰动。根据苹果官方宣传介绍,这款头显的创新设计让人仿佛置身于一个三维编程空间,代码窗口呈现出令人过目不忘的视觉效果,虽然Vision Pro高端AR头显售价不菲,但是它号称是未来技术的代表。作为一位开发者,尤其是作iOS开发的开发者,一定会考虑到如何入手Vision Pro的开发,但是考虑Vision Pro应用到编程中需要综合考虑多个因素,那么本文就来分享一下作为一位开发者是否会考虑将Vision Pro应用到编程中,并分析其潜在对开发者工作模式与效率的影响。
99 0
Vision Pro:编程领域的新里程碑
|
5月前
|
自然语言处理 JavaScript Java
CodeFuse新开源模型荣登Big Code评测榜首!
使用多任务高效微调框架MFTCoder,以DeepSeek-Coder-33b模型为底座,微调获得的CodeFuse-DeepSeek-33b模型在Big Code Models Leaderboard代码大模型榜单上以43.58% WinRate成为新晋榜首,同时模型在NLP任务上也取得了很好的表现。本文我们将介绍该模型的得来和使用,包括训练数据、训练超参设置、模型评测效果以及如何获取该模型和基于它继续微调。我们已经在HuggingFace和ModelScope开放了模型下载(下载地址在文末),并同步提供了4bit量化版本供大家直接部署到生产环境。
378 0
|
机器学习/深度学习 人工智能 安全
谷歌大模型云服务上线,代码生成、PaLM for Chat首次亮相
谷歌大模型云服务上线,代码生成、PaLM for Chat首次亮相
185 0
谷歌大模型云服务上线,代码生成、PaLM for Chat首次亮相