官方博客-第32页-阿里云开发者社区

付宇轩

2024-09-14

734

阿里云函数计算 x NVIDIA 加速企业 AI 应用落地

阿里云函数计算与 NVIDIA TensorRT/TensorRT-LLM 展开合作，通过结合阿里云的无缝计算体验和 NVIDIA 的高性能推理库，开发者能够以更低的成本、更高的效率完成复杂的 AI 任务，加速技术落地和应用创新。

付宇轩

734

铖朴层风

2024-11-06

1037

10 倍性能提升， GraalVM 应用可观测实践

本文介绍了 GraalVM 静态编译技术在云原生环境下的应用：ARMS 发布了支持 GraalVM 应用的 Java Agent 探针，可为 GraalVM 应用提供开箱即用的可观测能力。同时，文章还提供了使用 ARMS 对 GraalVM 应用进行可观测的详细步骤。

铖朴层风

1,037

惜鸟

2024-11-15

965

【提效】docker镜像构建优化-提速10倍

本文主要记录了自己通过查阅相关资料，一步步排查问题，最后通过优化Docerfile文件将docker镜像构建从十几分钟降低到1分钟左右，效率提高了10倍左右。

惜鸟

965

正己

2025-01-06

310

OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施

Kubernetes 体系基于 DNS 的服务发现为开发者提供了很大的便利，但其高度复杂的架构往往带来更高的稳定性风险。以 Nacos 为代表的独立服务发现系统架构简单，在 Kubernetes 中选择独立服务发现系统可以帮助增强业务可靠性、可伸缩性、性能及可维护性，对于规模大、增长快、稳定性要求高的业务来说是一个较理想的服务发现方案。希望大家都能找到适合自己业务的服务发现系统。

正己

310

望宸

2025-02-07

735

浏览量超 10w 的热图，描述 RAG 的主流架构

大模型性能的持续提升，进一步挖掘了 RAG 的潜力，RAG 将检索系统与生成模型相结合，带来诸多优势，如实时更新知识、降低成本等。点击本文，为您梳理 RAG 的基本信息，并介绍提升大模型生成结果的方法，快一起看看吧~

望宸

735

阿里云云原生

2025-02-19

455

一键构建智能导购 AI 助手，轻松重塑购物体验

在数字化时代，线上购物已成为消费者生活中不可或缺的消费方式，而消费者的购物习惯和需求逐渐呈现多样化的趋势，为了帮助商家全天候、自动化地满足顾客的购物需求，本方案将详细介绍如何基于商品内容构建一个智能商品导购助手。

阿里云云原生

455

阿里云开发者

2025-02-20

610

在IDE里使用DeepSeek-V3 和 DeepSeek-R1 满血版模型

如何在IDE里使用DeepSeek-V3 和 DeepSeek-R1 满血版模型

阿里云开发者

610

柯灵

2025-03-11

1561

QwQ-32B一键部署，真正的0代码，0脚本，0门槛

阿里云发布的QwQ-32B模型通过强化学习显著提升了推理能力，核心指标达到DeepSeek-R1满血版水平。用户可通过阿里云系统运维管理（OOS）一键部署OpenWebUI+Ollama方案，轻松将QwQ-32B模型部署到ECS，或连接阿里云百炼的在线模型。整个过程无需编写代码，全部在控制台完成，适合新手操作。

柯灵

1,561

澄潭计缘望宸

2025-03-14

956

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

通义千问最新推出的QwQ-32B推理模型，拥有320亿参数，性能媲美DeepSeek-R1（6710亿参数）。QwQ-32B支持在小型移动设备上本地运行，并可将企业大模型API调用成本降低90%以上。本文介绍了如何通过Higress AI网关实现DeepSeek-R1与QwQ-32B之间的无缝切换，涵盖环境准备、模型接入配置及客户端调用示例等内容。此外，还详细探讨了Higress AI网关的多模型服务、消费者鉴权、模型自动切换等高级功能，帮助企业解决TPS与成本平衡、内容安全合规等问题，提升大模型应用的稳定性和效率。

澄潭计缘望宸等

956

官方博客-第32页-阿里云开发者社区

类目筛选

内容类型

阿里云函数计算 x NVIDIA 加速企业 AI 应用落地

10 倍性能提升， GraalVM 应用可观测实践

【提效】docker镜像构建优化-提速10倍

OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施

浏览量超 10w 的热图，描述 RAG 的主流架构

一键构建智能导购 AI 助手，轻松重塑购物体验

在IDE里使用DeepSeek-V3 和 DeepSeek-R1 满血版模型

QwQ-32B一键部署，真正的0代码，0脚本，0门槛

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

官方博客-第32页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

阿里云函数计算 x NVIDIA 加速企业 AI 应用落地

10 倍性能提升， GraalVM 应用可观测实践

【提效】docker镜像构建优化-提速10倍

OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施

浏览量超 10w 的热图，描述 RAG 的主流架构

一键构建智能导购 AI 助手，轻松重塑购物体验

在IDE里使用DeepSeek-V3 和 DeepSeek-R1 满血版模型

QwQ-32B一键部署，真正的0代码，0脚本，0门槛

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要