通义灵码代码大模型应用实践访谈

本文涉及的产品
可观测监控 Prometheus 版,每月50GB免费额度
函数计算FC,每月15万CU 3个月
可观测可视化 Grafana 版,10个用户账号 1个月
简介: 2024 年 6 月 26 日,中国信息通信研究院(以下简称“中国信通院”)在可信 AI·南京人工智能产业发展论坛正式发布了代码大模型评估结果。阿里云计算有限公司的通义灵码代码大模型顺利通过评估,获得目前最高等级 4+ 级。该等级代表阿里云通义灵码大模型在通用能力及专用场景能力绝大多部分达到优秀水平,同时具备较为成熟的管理机制。

2024 年 6 月 26 日,中国信息通信研究院(以下简称“中国信通院”)在可信 AI·南京人工智能产业发展论坛正式发布了代码大模型评估结果。

image.png

可信 AI 代码大模型评估结果证书颁发

阿里云计算有限公司的通义灵码代码大模型顺利通过评估,获得目前最高等级 4+ 级。该等级代表阿里云通义灵码大模型在通用能力及专用场景能力绝大多部分达到优秀水平,同时具备较为成熟的管理机制。


此次,我们邀请到了阿里云通义灵码产品技术负责人陈鑫先生进行采访,分享参与评估的细节及阿里云在代码大模型领域的实践经验。

image.png

阿里云计算有限公司

通义灵码产品技术负责人 陈鑫


Q:请介绍一下贵公司及此次参与评估的代码大模型。

A:本次阿里云参评大模型为通义灵码大模型。通义灵码大模型基于通义基础模型的底座能力,覆盖更全面的词表,支持更长的上下文 64K-128K,可跟随更优的系统指令,具备强大的代码补全和研发问答能力。代码补全能力用于行间续写任务,具有代码生成、长序列建模、代码修改、SQL 编写等能力;研发问答能力用于代码转换、代码优化、单测生成、智能问答等环节,以完成更复杂的代码任务。


Q:贵司的通义灵码代码大模型经过评估获得了综合评级 4+ 的好成绩,贵司因此成为了代码大模型首批 4+ 级的企业,也是当前评估体系中最高水平。请分享一下您此时的感受。

A:通义灵码自从去年 11 月正式发布以来,广受开发者群体的欢迎,目前插件市场下载量也超过了 350 万次,位居中国第一。同时大量企业客户与我们联系,期望在今年落地AI辅助编程项目,提升内部软件开发效率。这些用户的期望给了我们强大的动力去不断改进模型和产品能力。因此在过去,我们不断的进行模型升级,例如用于代码补全的 codeqwen1.5 模型(同等参数量级最优模型),以及用于研发问答的qwen2模型(全球最强开源模型)。同时也不断地推出新的产品能力,例如代码补全和研发问答检索增强、模型微调训练、企业专属安全架构等满足中大型企业代码安全和模型个性化诉求。这些举措都让我们的模型效果节节攀升,到目前核心语言的 AI 代码生成占比都超过了 30%,也就是使用通义灵码后,三成代码将由 AI 编写。


Q:贵司参与代码大模型评估的考虑是什么?您认为本次评估的最大收获是什么?

A:信通院代码大模型标准是国内权威的评估标准,能够参与建设标准并首批通过是通义灵码非常重要的产品里程碑。本次评估过程中能够感受到此标准的全面性、复杂性、高标准以及严谨性。评估用例达到了数千条,从通用能力,到专用场景能力,再到应用成熟度对代码大模型能力做了全面评估,难度大,要求高。评估过程就是对通义灵码做了全面体检,也让我们发现了非常多可以改进的空间,能够顺利通过感到非常的荣幸。


Q:请您详细介绍一下,当前阶段贵司的代码大模型都有哪些亮点以及核心优势?

A:通义灵码代码大模型是业界公认的具备全球领先能力的模型。例如用于代码补全的 codeqwen 模型,其拥有 GQA 架构,经过了超过 3T tokens 代码相关的数据进行预训练,共计支持上百种编程语言、且最长支持 64K 的上下文输入。效果方面,codeqwen 展现出了非凡的代码生成、长序列建模、代码修改、SQL 能力等。基于 codeqwen 模型构建的通义灵码产品,能够在代码生成方面拥有优异表现,成为了各大企业 AI 代码助手项目的首选产品。


Q:请您展开谈谈,贵司代码大模型有哪些典型应用?对企业的效能提升体现在哪些方面?

A:我们目前核心是基于代码大模型打造通义灵码智能编码助手,因为这是目前已经可以成熟落地的大模型场景之一。企业开始使用通义灵码后,就能够直接获得 10%-15% 的综合人效提升,见效快,性价比极高。另一方面我们也和企业探索代码大模型在 DevOps 全流程上的应用,期望能够从需求管理、测试生成、部署运维辅助等端到端实现智能化体验。最后我们也在探索 AI 程序员多智能体自主编程领域,并计划在未来合适时间推出相应产品,从而实现 AI 为主人为辅的新一代软件研发范式。


Q:关于代码大模型,贵司的下一步计划是什么?

A:通义灵码下一步将不断推出能力更强、上下文更宽、代码技能更多的大模型,从而在企业代码检索增强、项目级代码任务解决、代码和测试 Agent 等方面能力上突破,进一步满足企业对于复杂工程和复杂研发任务的提效诉求。


Q:对于代码大模型的发展前景和趋势,您怎么看?

A:我认为编码辅助是大模型应用的最大场景之一,随着模型能力不断提升,新产品不断出现,有望在未来 1-2 年内为软件研发过程带来颠覆性影响。AI 替代人类工程师完成基础事务性工作的趋势不可避免,我们需要从现在开始就拥抱这项技术,甚至参与到模型构建、场景挖掘、产品研发过程中,不断探索 AI 原生开发范式,思考未来基于代码大模型之上的软件研发流程如何重塑。

相关文章
|
29天前
|
NoSQL 安全 测试技术
Redis游戏积分排行榜项目中通义灵码的应用实战
Redis游戏积分排行榜项目中通义灵码的应用实战
52 4
|
19天前
|
机器学习/深度学习 自然语言处理 算法
通义灵码在金融与教育领域的应用
通义灵码在金融与教育领域的应用展现了其强大潜力。在金融行业,它通过优化风险评估、智能投顾及交易算法,提升业务效率与安全性;在教育领域,则通过个性化学习方案、智能化教学资源生成及编程教育辅助,革新教学方式,满足多样化需求,为行业注入新活力。
|
6天前
|
大数据 开发者
通义灵码创新实践征集赛获奖名单公布!
通义灵码创新实践征集赛得到了众多开发者的支持和喜爱,现公布活动获奖名单,快来看看吧!
68 5
|
29天前
|
存储 Serverless 数据库
通义灵码与阿里云的融合实践
本文探讨了通义灵码与阿里云的融合实践,涵盖生成在阿里云上部署应用的代码及与阿里云服务的深度集成,如云服务器创建、云数据库配置、云存储设置及函数计算服务等,显著提升开发效率和应用灵活性。
通义灵码与阿里云的融合实践
|
10天前
|
开发框架 自然语言处理 JavaScript
千问开源P-MMEval数据集,面向大模型的多语言平行评测集
近期,通义千问团队联合魔搭社区开源的多语言基准测试集 P-MMEval,涵盖了高效的基础和专项能力数据集。
|
13天前
|
缓存 API 开发工具
Qwen-coder方向-如果从0开始应用通义千问开源大模型
从0开始接触,带您全面了解Qwen2.5语言模型家族,包括其核心功能、微调方法以及具体应用场景。我们将通过一系列精心准备的应用demo和使用指南,帮助您掌握如何充分利用Qwen2.5的强大能力
180 8
|
12天前
|
人工智能 搜索推荐 安全
数百名研发人员用通义灵码,33%新增代码由AI生成,信也科技研发模式焕新升级
目前,信也科技数百名研发人员正在使用通义灵码,周活跃用户占比70%,新增代码中有33%由通义灵码编写,整体研发效率提升了11%,真正实现了数百研发人员开发效能的全面提升。
|
17天前
|
机器学习/深度学习 数据采集 存储
通义千问 Qwen 在智能文本分析中的应用实践
本文探讨了通义千问Qwen在智能文本分析的应用,涵盖文本分类、情感分析及关键信息提取,通过具体案例和代码实现,展示了Qwen的强大语言理解能力,为开发者和研究人员提供了实用参考。
|
26天前
|
人工智能 开发者
再次获奖!世界互联网大会把荣誉给了通义大模型
再次获奖!世界互联网大会把荣誉给了通义大模型
40 11
|
26天前
|
自然语言处理 安全 搜索推荐
通义灵码帮你一键读工程代码,补全相关相似代码
当你接手他人项目代码,开发者需要大量学习项目代码、架构等,学习和上手成本高。通义灵码的@workspace可以一键读懂工程代码,生成代码逻辑流程图。
下一篇
DataWorks