官方博客-第22页-阿里云开发者社区

阿里云云原生

2024-11-01

953

Serverless GPU：助力 AI 推理加速

近年来，AI 技术发展迅猛，企业纷纷寻求将 AI 能力转化为商业价值，然而，在部署 AI 模型推理服务时，却遭遇成本高昂、弹性不足及运维复杂等挑战。本文将探讨云原生 Serverless GPU 如何从根本上解决这些问题，以实现 AI 技术的高效落地。

阿里云云原生

953

龙蜥社区OpenAnolis

2024-11-06

719

云+AI时代下，Alibaba Cloud Linux 进一步演进思考

用好开源、做深开源、自研创新，打造全方位安全可信的服务器操作系统。

龙蜥社区OpenAnolis

719

元昌

2024-11-21

584

构建理想容器镜像——以CSI为例

本文围绕阿里云CSI（Container Storage Interface）镜像构建的实际案例，探讨了一系列优化容器镜像的最佳实践。

元昌

584

李德

2024-12-06

1302

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

本文章基于业务实践，总结有关客服质检场景的解决方案和处理经验，为相似场景提供可行的借鉴方法。

李德

1,302

片风

2025-01-14

490

政采云业务网关实践：使用 Higress 统一替代 APISIX/Kong/Istio Ingress

政采云基础架构团队技术专家朱海峰介绍了业务网关项目的背景和解决方案。

片风

490

尹丰彬

2025-02-21

804

基于虚拟服务配置的渐进式迁移实践：Istio集群至ASM集群的平滑切换

本文介绍了从Istio+k8s环境迁移到阿里云ASM+ACK环境的渐进式方法，通过配置虚拟服务和入口服务实现新老集群间的服务调用与流量转发，确保业务连续性与平滑迁移

尹丰彬

804

荣阳

2025-02-28

1019

使用A10单卡24G复现DeepSeek R1强化学习过程

本文描述DeepSeek的三个模型的学习过程，其中DeepSeek-R1-Zero模型所涉及的强化学习算法，是DeepSeek最核心的部分之一会重点展示。

荣阳

1,019

澄潭计缘望宸

2025-03-14

952

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

通义千问最新推出的QwQ-32B推理模型，拥有320亿参数，性能媲美DeepSeek-R1（6710亿参数）。QwQ-32B支持在小型移动设备上本地运行，并可将企业大模型API调用成本降低90%以上。本文介绍了如何通过Higress AI网关实现DeepSeek-R1与QwQ-32B之间的无缝切换，涵盖环境准备、模型接入配置及客户端调用示例等内容。此外，还详细探讨了Higress AI网关的多模型服务、消费者鉴权、模型自动切换等高级功能，帮助企业解决TPS与成本平衡、内容安全合规等问题，提升大模型应用的稳定性和效率。

澄潭计缘望宸等

952

子葵于怀

2025-04-10

859

0代码将存量 API 适配 MCP 协议

本文主要讲述通过 Nacos+Higress 的方案实现0代码改造将 Agent 连接到存量应用，能够显著降低存量应用的改造成本。

子葵于怀

859

官方博客-第22页-阿里云开发者社区

类目筛选

内容类型

Serverless GPU：助力 AI 推理加速

云+AI时代下，Alibaba Cloud Linux 进一步演进思考

构建理想容器镜像——以CSI为例

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

政采云业务网关实践：使用 Higress 统一替代 APISIX/Kong/Istio Ingress

基于虚拟服务配置的渐进式迁移实践：Istio集群至ASM集群的平滑切换

使用A10单卡24G复现DeepSeek R1强化学习过程

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

0代码将存量 API 适配 MCP 协议

官方博客-第22页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

Serverless GPU：助力 AI 推理加速

云+AI时代下，Alibaba Cloud Linux 进一步演进思考

构建理想容器镜像——以CSI为例

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

政采云业务网关实践：使用 Higress 统一替代 APISIX/Kong/Istio Ingress

基于虚拟服务配置的渐进式迁移实践：Istio集群至ASM集群的平滑切换

使用A10单卡24G复现DeepSeek R1强化学习过程

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

0代码将存量 API 适配 MCP 协议