官方博客-第15页-阿里云开发者社区

澄潭计缘望宸

2025-03-14

988

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

通义千问最新推出的QwQ-32B推理模型，拥有320亿参数，性能媲美DeepSeek-R1（6710亿参数）。QwQ-32B支持在小型移动设备上本地运行，并可将企业大模型API调用成本降低90%以上。本文介绍了如何通过Higress AI网关实现DeepSeek-R1与QwQ-32B之间的无缝切换，涵盖环境准备、模型接入配置及客户端调用示例等内容。此外，还详细探讨了Higress AI网关的多模型服务、消费者鉴权、模型自动切换等高级功能，帮助企业解决TPS与成本平衡、内容安全合规等问题，提升大模型应用的稳定性和效率。

澄潭计缘望宸等

988

阿里云开发者

2025-03-21

807

在IDEA中借助满血版 DeepSeek 提高编码效率

通义灵码2.0引入了DeepSeek V3与R1模型，新增Qwen2.5-Max和QWQ模型，支持个性化服务切换。阿里云发布开源推理模型QwQ-32B，在数学、代码及通用能力上表现卓越，性能媲美DeepSeek-R1，且部署成本低。AI程序员功能涵盖表结构设计、前后端代码生成、单元测试与错误排查，大幅提升开发效率。跨语言编程示例中，成功集成DeepSeek-R1生成公告内容。相比1.0版本，2.0支持多款模型，丰富上下文类型，具备多文件修改能力。总结显示，AI程序员生成代码准确度高，但需参考现有工程风格以确保一致性，错误排查功能强大，适合明确问题描述场景。相关链接提供下载与原文参考。

阿里云开发者

807

阿里云云原生

2025-05-16

648

日志采集 Agent 性能大比拼——LoongCollector 性能深度测评

为了展现 LoongCollector 的卓越性能，本文通过纵向（LoongCollector 与 iLogtail 产品升级对比）和横向（LoongCollector 与其他开源日志采集 Agent 对比）两方面对比，深度测评不同采集 Agent 在常见的日志采集场景下的性能。

阿里云云原生

648

王明橙鲤黄俊

2024-05-15

64126

通义千问开源模型在PAI灵骏的最佳实践

本文将展示如何基于阿里云PAI灵骏智算服务，在通义千问开源模型之上进行高效分布式继续预训练、指令微调、模型离线推理验证以及在线服务部署。

王明橙鲤黄俊等

64,126

ModelScope

2024-05-15

110007

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

Arm 架构的服务器通常具备低功耗的特性，能带来更优异的能效比。相比于传统的 x86 架构服务器，Arm 服务器在相同功耗下能够提供更高的性能。这对于大模型推理任务来说尤为重要，因为大模型通常需要大量的计算资源，而能效比高的 Arm 架构服务器可以提供更好的性能和效率。

ModelScope

110,007

ModelScope

2024-05-15

104698

手把手教你捏一个自己的Agent

Modelscope AgentFabric是一个基于ModelScope-Agent的交互式智能体应用，用于方便地创建针对各种现实应用量身定制智能体，目前已经在生产级别落地。

ModelScope

104,698

遥方

2024-05-15

665

基于CEN-TR实现多种云上组网方案

基于CEN-TR可以实现灵活地组网方案，在面向不同客户业务场景可以选择不同的组网策略。本文介绍了从最简单的VPC互联到各种复杂的组网方案，适用于不同规模企业在网络组网这块的需求。

遥方

665

ModelScope

2024-05-15

1133

LISA微调技术解析：比LoRA更低的显存更快的速度

LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写，由UIUC联合LMFlow团队于近期提出的一项LLM微调技术，可实现把全参训练的显存使用降低到之前的三分之一左右，而使用的技术方法却是非常简单。

ModelScope

1,133

ModelScope

2024-05-15

742

联合XTuner，魔搭社区全面支持数据集的长文本训练

XTuner和魔搭社区（SWIFT）合作引入了一项长序列文本训练技术，该技术能够在多GPU环境中将长序列文本数据分割并分配给不同GPU，从而减少每个GPU上的显存占用。通过这种方式，训练超大规模模型时可以处理更长的序列，提高训练效率。魔搭社区的SWIFT框架已经集成了这一技术，支持多种大模型和数据集的训练。此外，SWIFT还提供了一个用户友好的界面，方便用户进行训练和部署，并且支持评估功能。

ModelScope

742

官方博客-第15页-阿里云开发者社区

类目筛选

内容类型

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

在IDEA中借助满血版 DeepSeek 提高编码效率

日志采集 Agent 性能大比拼——LoongCollector 性能深度测评

通义千问开源模型在PAI灵骏的最佳实践

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

手把手教你捏一个自己的Agent

基于CEN-TR实现多种云上组网方案

LISA微调技术解析：比LoRA更低的显存更快的速度

联合XTuner，魔搭社区全面支持数据集的长文本训练

官方博客-第15页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

在IDEA中借助满血版 DeepSeek 提高编码效率

日志采集 Agent 性能大比拼——LoongCollector 性能深度测评

通义千问开源模型在PAI灵骏的最佳实践

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

手把手教你捏一个自己的Agent

基于CEN-TR实现多种云上组网方案

LISA微调技术解析：比LoRA更低的显存更快的速度

联合XTuner，魔搭社区全面支持数据集的长文本训练