官方博客-第13页-阿里云开发者社区

ModelScope

2024-05-15

1320

快来与 CodeQwen1.5 结对编程

今天，来自 Qwen1.5 开源家族的新成员，代码专家模型 CodeQwen1.5开源！CodeQwen1.5 基于 Qwen 语言模型初始化，拥有 7B 参数的模型，其拥有 GQA 架构，经过了 ~3T tokens 代码相关的数据进行预训练，共计支持 92 种编程语言、且最长支持 64K 的上下文输入。效果方面，CodeQwen1.5 展现出了优秀的代码生成、长序列建模、代码修改、SQL 能力等,该模型可以大大提高开发人员的工作效率，并在不同的技术环境中简化软件开发工作流程。

ModelScope

1,320

星莲

2024-11-21

1575

剖析大模型连“Strawberry”的“r”都数不对的原因

本文将从两个常见的大模型翻车问题入手解析这些问题背后体现的大模型技术原理，并解释了为什么会导致这些问题，接着我们利用CoT（思维链）方法解决这些问题并基于上述原理试图剖析CoT方法起作用的可能原因，最后提出【理由先行】风格这一简单有效的Prompt Trick。

星莲

1,575

李德

2024-12-06

1473

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

本文章基于业务实践，总结有关客服质检场景的解决方案和处理经验，为相似场景提供可行的借鉴方法。

李德

1,473

探索云世界

2025-01-02

488

云端问道11期实践教学-创建专属AI助手

本次分享意在帮助用户更加全面、深入地了解百炼的核心产品能力，并通过实际操作学会如何快速将大模型与自己的系统及应用相结合。主要包括以下三个方面： 1. 阿里云百炼产品定位和能力简介 2. 知识检索 RAG 智能体应用能力和优势 3. 最佳落地案例实践分享

探索云世界

488

望宸

2025-02-28

1286

大模型推理主战场：通信协议的标配

DeepSeek加速了模型平权，大模型推理需求激增，性能提升主战场从训练转向推理。SSE（Server-Sent Events）和WebSocket成为大模型应用的标配网络通信协议。SSE适合服务器单向推送实时数据，如一问一答场景；WebSocket支持双向实时通信，适用于在线游戏、多人协作等高实时性场景。两者相比传统HTTPS协议，能更好地支持流式输出、长时任务处理和多轮交互，满足大模型应用的需求。随着用户体量扩大，网关层面临软件变更、带宽成本及恶意攻击等挑战，需通过无损上下线、客户端重连机制、压缩算法及安全防护措施应对。

望宸

1,286

ModelScope

2024-05-15

1992

Multi-Agent实践第7期：智能体的高效协作

教程第7期

ModelScope

1,992

阿里云云原生

2024-12-04

783

不写一行代码，通义灵码 5 分钟“手撕”年会抽奖程序

年会中的抽奖环节不可或缺，但每年为了选择合适的抽奖小程序，团队往往需要投入大量时间和精力。然而，抽奖结束后，参与者通常只记得自己是否中奖，其他细节多被遗忘。在 AI 技术日益成熟的今天，如何打造一个既高效又有技术含量的抽奖应用呢？今天，就让我们跟随通义灵码，仅用 5 分钟现场手撕一个抽奖应用吧！

阿里云云原生

783

雨鸦

2024-12-27

1736

极简开发，极速上线：构建端到端大模型应用

本文将以一个经典的 RAG（检索增强生成）知识问答系统为例，详细介绍从智能体设计到最终应用部署的全流程。

雨鸦

1,736

阿里云云原生

2025-06-30

531

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

本文介绍了如何使用 llmaz 快速部署基于 vLLM 的大语言模型推理服务，并结合 Higress AI 网关实现流量控制、可观测性、故障转移等能力，构建稳定、高可用的大模型服务平台。

阿里云云原生

531

官方博客-第13页-阿里云开发者社区

类目筛选

内容类型

快来与 CodeQwen1.5 结对编程

剖析大模型连“Strawberry”的“r”都数不对的原因

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

云端问道11期实践教学-创建专属AI助手

大模型推理主战场：通信协议的标配

Multi-Agent实践第7期：智能体的高效协作

不写一行代码，通义灵码 5 分钟“手撕”年会抽奖程序

极简开发，极速上线：构建端到端大模型应用

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

官方博客-第13页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

快来与 CodeQwen1.5 结对编程

剖析大模型连“Strawberry”的“r”都数不对的原因

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

云端问道11期实践教学-创建专属AI助手

大模型推理主战场：通信协议的标配

Multi-Agent实践第7期：智能体的高效协作

不写一行代码，通义灵码 5 分钟“手撕”年会抽奖程序

极简开发，极速上线：构建端到端大模型应用

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践