官方博客-第30页-阿里云开发者社区

肯梦筱姜

2025-02-11

653

0 代码！2 种方式，一键部署 DeepSeek 系列模型

DeepSeek 凭借其卓越的性能和广泛的应用场景，迅速在全球范围内获得了极高的关注度和广泛的用户基础。DeepSeek-R1-Distill 是使用 DeepSeek-R1 生成的样本对开源模型进行蒸馏得到的小模型，拥有更小参数规模，推理成本更低，基准测试同样表现出色。依托于函数计算 FC 算力，Serverless+ AI 开发平台 CAP 现已提供模型服务、应用模版两种部署方式辅助您部署 DeepSeek R1 系列模型。完成模型部署后，您即可与模型进行对话体验；或以 API 形式进行调用，接入 AI 应用中。欢迎您立即体验。

肯梦筱姜

653

阿里云云原生

2025-02-25

1104

解锁 DeepSeek 安全接入、稳定运行新路径

聚焦于企业部署 DeepSeek 的应用需求，本文介绍了模型权重下载及多种部署方案，还阐述了大模型应用落地的常见需求，帮助用户逐步提升模型应用效果。

阿里云云原生

1,104

澄潭计缘望宸

2025-03-14

958

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

通义千问最新推出的QwQ-32B推理模型，拥有320亿参数，性能媲美DeepSeek-R1（6710亿参数）。QwQ-32B支持在小型移动设备上本地运行，并可将企业大模型API调用成本降低90%以上。本文介绍了如何通过Higress AI网关实现DeepSeek-R1与QwQ-32B之间的无缝切换，涵盖环境准备、模型接入配置及客户端调用示例等内容。此外，还详细探讨了Higress AI网关的多模型服务、消费者鉴权、模型自动切换等高级功能，帮助企业解决TPS与成本平衡、内容安全合规等问题，提升大模型应用的稳定性和效率。

澄潭计缘望宸等

958

尹斌斌周絮

2025-03-21

753

解决隐式内存占用难题

本文详细介绍了在云原生和容器化部署环境中，内存管理和性能优化所面临的挑战及相应的解决方案。

尹斌斌周絮

753

欧叔

2024-05-15

135853

基于客户真实使用场景的云剪辑Timeline问题解答与代码实操

本文为阿里云智能媒体服务IMS「云端智能剪辑」实践指南第6期，从客户真实实践场景出发，分享一些Timeline小技巧（AI_TTS、主轨道、素材对齐），助力客户降低开发时间与成本。

欧叔

135,853

杨永

2024-05-15

1447

使用阿里云KMS产品针对 Springboot 接口参数加密解密功能

针对Springboot里面使用开源工具使用加解密，替换成阿里云KMS产品进行加解密；

杨永

1,447

ModelScope

2024-05-15

109980

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

Arm 架构的服务器通常具备低功耗的特性，能带来更优异的能效比。相比于传统的 x86 架构服务器，Arm 服务器在相同功耗下能够提供更高的性能。这对于大模型推理任务来说尤为重要，因为大模型通常需要大量的计算资源，而能效比高的 Arm 架构服务器可以提供更好的性能和效率。

ModelScope

109,980

ModelScope

2024-05-15

1110

LISA微调技术解析：比LoRA更低的显存更快的速度

LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写，由UIUC联合LMFlow团队于近期提出的一项LLM微调技术，可实现把全参训练的显存使用降低到之前的三分之一左右，而使用的技术方法却是非常简单。

ModelScope

1,110

阿里云云原生

2024-05-15

61410

云效 Pipeline as Code 来了，这些场景，用好它效率翻倍

可视化与YAML编排兼具，云效CI/CD流水线你愿意打几分？

阿里云云原生

61,410

官方博客-第30页-阿里云开发者社区

类目筛选

内容类型

0 代码！2 种方式，一键部署 DeepSeek 系列模型

解锁 DeepSeek 安全接入、稳定运行新路径

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

解决隐式内存占用难题

基于客户真实使用场景的云剪辑Timeline问题解答与代码实操

使用阿里云KMS产品针对 Springboot 接口参数加密解密功能

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

LISA微调技术解析：比LoRA更低的显存更快的速度

云效 Pipeline as Code 来了，这些场景，用好它效率翻倍

官方博客-第30页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

0 代码！2 种方式，一键部署 DeepSeek 系列模型

解锁 DeepSeek 安全接入、稳定运行新路径

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

解决隐式内存占用难题

基于客户真实使用场景的云剪辑Timeline问题解答与代码实操

使用阿里云KMS产品针对 Springboot 接口参数加密解密功能

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

LISA微调技术解析：比LoRA更低的显存更快的速度

云效 Pipeline as Code 来了，这些场景，用好它效率翻倍