通义灵码代码大模型应用实践访谈

本文涉及的产品
容器镜像服务 ACR,镜像仓库100个 不限时长
性能测试 PTS,5000VUM额度
函数计算FC,每月15万CU 3个月
简介: 2024 年 6 月 26 日,中国信息通信研究院(以下简称“中国信通院”)在可信 AI·南京人工智能产业发展论坛正式发布了代码大模型评估结果。阿里云计算有限公司的通义灵码代码大模型顺利通过评估,获得目前最高等级 4+ 级。该等级代表阿里云通义灵码大模型在通用能力及专用场景能力绝大多部分达到优秀水平,同时具备较为成熟的管理机制。

2024 年 6 月 26 日,中国信息通信研究院(以下简称“中国信通院”)在可信 AI·南京人工智能产业发展论坛正式发布了代码大模型评估结果。

image.png

可信 AI 代码大模型评估结果证书颁发

阿里云计算有限公司的通义灵码代码大模型顺利通过评估,获得目前最高等级 4+ 级。该等级代表阿里云通义灵码大模型在通用能力及专用场景能力绝大多部分达到优秀水平,同时具备较为成熟的管理机制。


此次,我们邀请到了阿里云通义灵码产品技术负责人陈鑫先生进行采访,分享参与评估的细节及阿里云在代码大模型领域的实践经验。

image.png

阿里云计算有限公司

通义灵码产品技术负责人 陈鑫


Q:请介绍一下贵公司及此次参与评估的代码大模型。

A:本次阿里云参评大模型为通义灵码大模型。通义灵码大模型基于通义基础模型的底座能力,覆盖更全面的词表,支持更长的上下文 64K-128K,可跟随更优的系统指令,具备强大的代码补全和研发问答能力。代码补全能力用于行间续写任务,具有代码生成、长序列建模、代码修改、SQL 编写等能力;研发问答能力用于代码转换、代码优化、单测生成、智能问答等环节,以完成更复杂的代码任务。


Q:贵司的通义灵码代码大模型经过评估获得了综合评级 4+ 的好成绩,贵司因此成为了代码大模型首批 4+ 级的企业,也是当前评估体系中最高水平。请分享一下您此时的感受。

A:通义灵码自从去年 11 月正式发布以来,广受开发者群体的欢迎,目前插件市场下载量也超过了 350 万次,位居中国第一。同时大量企业客户与我们联系,期望在今年落地AI辅助编程项目,提升内部软件开发效率。这些用户的期望给了我们强大的动力去不断改进模型和产品能力。因此在过去,我们不断的进行模型升级,例如用于代码补全的 codeqwen1.5 模型(同等参数量级最优模型),以及用于研发问答的qwen2模型(全球最强开源模型)。同时也不断地推出新的产品能力,例如代码补全和研发问答检索增强、模型微调训练、企业专属安全架构等满足中大型企业代码安全和模型个性化诉求。这些举措都让我们的模型效果节节攀升,到目前核心语言的 AI 代码生成占比都超过了 30%,也就是使用通义灵码后,三成代码将由 AI 编写。


Q:贵司参与代码大模型评估的考虑是什么?您认为本次评估的最大收获是什么?

A:信通院代码大模型标准是国内权威的评估标准,能够参与建设标准并首批通过是通义灵码非常重要的产品里程碑。本次评估过程中能够感受到此标准的全面性、复杂性、高标准以及严谨性。评估用例达到了数千条,从通用能力,到专用场景能力,再到应用成熟度对代码大模型能力做了全面评估,难度大,要求高。评估过程就是对通义灵码做了全面体检,也让我们发现了非常多可以改进的空间,能够顺利通过感到非常的荣幸。


Q:请您详细介绍一下,当前阶段贵司的代码大模型都有哪些亮点以及核心优势?

A:通义灵码代码大模型是业界公认的具备全球领先能力的模型。例如用于代码补全的 codeqwen 模型,其拥有 GQA 架构,经过了超过 3T tokens 代码相关的数据进行预训练,共计支持上百种编程语言、且最长支持 64K 的上下文输入。效果方面,codeqwen 展现出了非凡的代码生成、长序列建模、代码修改、SQL 能力等。基于 codeqwen 模型构建的通义灵码产品,能够在代码生成方面拥有优异表现,成为了各大企业 AI 代码助手项目的首选产品。


Q:请您展开谈谈,贵司代码大模型有哪些典型应用?对企业的效能提升体现在哪些方面?

A:我们目前核心是基于代码大模型打造通义灵码智能编码助手,因为这是目前已经可以成熟落地的大模型场景之一。企业开始使用通义灵码后,就能够直接获得 10%-15% 的综合人效提升,见效快,性价比极高。另一方面我们也和企业探索代码大模型在 DevOps 全流程上的应用,期望能够从需求管理、测试生成、部署运维辅助等端到端实现智能化体验。最后我们也在探索 AI 程序员多智能体自主编程领域,并计划在未来合适时间推出相应产品,从而实现 AI 为主人为辅的新一代软件研发范式。


Q:关于代码大模型,贵司的下一步计划是什么?

A:通义灵码下一步将不断推出能力更强、上下文更宽、代码技能更多的大模型,从而在企业代码检索增强、项目级代码任务解决、代码和测试 Agent 等方面能力上突破,进一步满足企业对于复杂工程和复杂研发任务的提效诉求。


Q:对于代码大模型的发展前景和趋势,您怎么看?

A:我认为编码辅助是大模型应用的最大场景之一,随着模型能力不断提升,新产品不断出现,有望在未来 1-2 年内为软件研发过程带来颠覆性影响。AI 替代人类工程师完成基础事务性工作的趋势不可避免,我们需要从现在开始就拥抱这项技术,甚至参与到模型构建、场景挖掘、产品研发过程中,不断探索 AI 原生开发范式,思考未来基于代码大模型之上的软件研发流程如何重塑。

相关文章
|
24天前
|
存储 人工智能 运维
【01】做一个精美的打飞机小游戏,浅尝阿里云通义灵码python小游戏开发AI编程-之飞机大战小游戏上手实践-优雅草央千澈-用ai开发小游戏尝试-分享源代码和游戏包
【01】做一个精美的打飞机小游戏,浅尝阿里云通义灵码python小游戏开发AI编程-之飞机大战小游戏上手实践-优雅草央千澈-用ai开发小游戏尝试-分享源代码和游戏包
142 47
【01】做一个精美的打飞机小游戏,浅尝阿里云通义灵码python小游戏开发AI编程-之飞机大战小游戏上手实践-优雅草央千澈-用ai开发小游戏尝试-分享源代码和游戏包
|
1月前
|
编解码 Cloud Native 算法
通义万相:视觉生成大模型再进化
通义万相是阿里云推出的视觉生成大模型,涵盖图像和视频生成。其2.0版本在文生图和文生视频方面进行了重大升级,采用Diffusion Transformer架构,提升了模型的灵活性和可控性。通过高质量美学标准和多语言支持,大幅增强了画面表现力。此外,视频生成方面引入高压缩比VAE、1080P长视频生成及多样化艺术风格支持,实现了更丰富的创意表达。未来,通义万相将继续探索视觉领域的规模化和泛化,打造更加通用的视觉生成大模型。
|
21天前
|
人工智能 自然语言处理 API
用AI Agent做一个法律咨询助手,罗老看了都直呼内行 feat.通义千问大模型&阿里云百炼平台
本视频介绍如何使用通义千问大模型和阿里云百炼平台创建一个法律咨询助手AI Agent。通过简单配置,无需编写代码或训练模型,即可快速实现智能问答功能。演示包括创建应用、配置知识库、上传民法典文档、构建知识索引等步骤。最终,用户可以通过API调用集成此AI Agent到现有系统中,提供专业的法律咨询服务。整个过程简便高效,适合快速搭建专业领域的小助手。
151 21
|
2月前
|
关系型数据库 机器人 OLAP
智答引领|AnalyticDB与通义千问大模型联手打造社区问答新体验
PolarDB开源社区推出基于云原生数据仓库AnalyticDB和通义千问大模型的“PolarDB知识问答助手”,实现一站式全链路RAG能力,大幅提升查询效率和问答准确率。该系统整合静态和动态知识库,提供高效的数据检索与查询服务,支持多种场景下的精准回答,并持续优化用户体验。欢迎加入钉群体验并提出宝贵意见。
智答引领|AnalyticDB与通义千问大模型联手打造社区问答新体验
|
2月前
|
人工智能 前端开发 Java
Spring AI Alibaba + 通义千问,开发AI应用如此简单!!!
本文介绍了如何使用Spring AI Alibaba开发一个简单的AI对话应用。通过引入`spring-ai-alibaba-starter`依赖和配置API密钥,结合Spring Boot项目,只需几行代码即可实现与AI模型的交互。具体步骤包括创建Spring Boot项目、编写Controller处理对话请求以及前端页面展示对话内容。此外,文章还介绍了如何通过添加对话记忆功能,使AI能够理解上下文并进行连贯对话。最后,总结了Spring AI为Java开发者带来的便利,简化了AI应用的开发流程。
433 0
|
2月前
|
机器学习/深度学习 人工智能 安全
通义视觉推理大模型QVQ-72B-preview重磅上线
Qwen团队推出了新成员QVQ-72B-preview,这是一个专注于提升视觉推理能力的实验性研究模型。提升了视觉表示的效率和准确性。它在多模态评测集如MMMU、MathVista和MathVision上表现出色,尤其在数学推理任务中取得了显著进步。尽管如此,该模型仍存在一些局限性,仍在学习和完善中。
|
2月前
|
文字识别 测试技术 API
实战阿里通义灵码极速编程-截屏-OCR-Ollama篇代码
该代码实现了一个截屏测试工具,结合了鼠标事件监听、屏幕截图和OCR功能。用户可通过拖动鼠标选择屏幕区域进行截图,并将截图转换为Markdown格式的文本内容。具体步骤包括:初始化大模型客户端、编码图像为Base64格式、捕获指定屏幕区域并保存截图、调用大模型API进行OCR识别并输出Markdown格式的内容。
82 9
|
1月前
|
人工智能 自然语言处理 算法
通义智文:文档应用赋能千行百业
通义智文是阿里巴巴推出的大规模文档处理技术体系,旨在提升生产力效率。最初作为阅读工具发布,现已发展为涵盖文档解析、理解、生成等多方面的技术平台。通义智文支持超长文档处理、多模态文本解析,并在法律、教育等领域提供专业服务。其创新算法如VGT版面分析和Layout-LM多模态模型,显著提升了文档处理精度。应用场景包括PPT创作、故事绘本生成及法律文书审查等,赋能千行百业。
|
1月前
|
人工智能 自然语言处理 安全
千行百业,“义”不容辞:通义技术创新与商业实践
千行百业,“义”不容辞:通义技术创新与商业实践。本次分享分为两部分,首先介绍大模型的快速迭代与普及,探讨通义千问在精度和复杂任务执行上的突破;其次聚焦企业级落地,解决安全性、部署路径及模型调优三大问题。通过多模态理解(视觉、语音)和更强的生成控制力,携手伙伴服务各行业,推动技术向生产力转化,并关注公益应用,助力社会进步。
|
2月前
|
Java 测试技术 开发者
通义灵码助力高效开发——我的实践心得
作为一名Java开发工程师,我一直在寻找提高开发效率的方法。最近,我尝试了通义灵码的个人版新功能,并取得了显著的效果。本文将分享我的实践场景、效果和心得。
58 1