官方博客-第27页-阿里云开发者社区

片风

2025-01-14

502

政采云业务网关实践：使用 Higress 统一替代 APISIX/Kong/Istio Ingress

政采云基础架构团队技术专家朱海峰介绍了业务网关项目的背景和解决方案。

片风

502

元乙

2025-02-14

463

2025 年可观测 10 大趋势预测

下述报告主要整理自各大网站发布的对 2025 年可观测趋势的预测，作者合并同类项汇总 10 个共性的趋势，欢迎大家一起讨论。

元乙

463

澄潭计缘望宸

2025-03-14

965

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

通义千问最新推出的QwQ-32B推理模型，拥有320亿参数，性能媲美DeepSeek-R1（6710亿参数）。QwQ-32B支持在小型移动设备上本地运行，并可将企业大模型API调用成本降低90%以上。本文介绍了如何通过Higress AI网关实现DeepSeek-R1与QwQ-32B之间的无缝切换，涵盖环境准备、模型接入配置及客户端调用示例等内容。此外，还详细探讨了Higress AI网关的多模型服务、消费者鉴权、模型自动切换等高级功能，帮助企业解决TPS与成本平衡、内容安全合规等问题，提升大模型应用的稳定性和效率。

澄潭计缘望宸等

965

德歌

2023-09-14

25843

沉浸式学习PostgreSQL|PolarDB 16: 植入通义千问大模型+文本向量化模型, 让数据库具备AI能力

本文将带领大家来体验一下如何将“千问大模型+文本向量化模型”植入到PG|PolarDB中, 让数据库具备AI能力.

德歌

25,843

孟威

2024-05-15

105523

SLS 大模型可观测&安全推理审计标准解决方案

本文介绍大模型可观测&安全推理审计解决方案和Demo演示，SLS 提供全面的 LLM 监控和日志记录功能。监控大模型使用情况和性能，自定义仪表盘；SLS 汇总 Actiontrail 事件、云产品可观测日志、LLM 网关明细日志、详细对话明细日志、Prompt Trace 和推理实时调用明细等数据，建设完整统一的大模型可观测方案，为用户的大模型安全推理审计提供全面合规支持。

孟威

105,523

阿里云瑶池数据库

2024-05-15

63429

数据库索引，一文揭秘PolarDB XPlan索引选择

深度解读PolarDB分布式版XPlan的索引选择

阿里云瑶池数据库

63,429

奶司

2024-05-15

1098

人人都是AI大师 - Prompt工程

prompt工程不需要复杂的编程知识，人人都可以使用prompt工程成为AI大师。本文只探讨prompt工程，不涉及模型训练等内容。只讨论文本生成，不涉及图像等领域。

奶司

1,098

ModelScope

2024-05-15

1132

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,132

ModelScope

2024-05-15

1115

LISA微调技术解析：比LoRA更低的显存更快的速度

LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写，由UIUC联合LMFlow团队于近期提出的一项LLM微调技术，可实现把全参训练的显存使用降低到之前的三分之一左右，而使用的技术方法却是非常简单。

ModelScope

1,115

官方博客-第27页-阿里云开发者社区

类目筛选

内容类型

政采云业务网关实践：使用 Higress 统一替代 APISIX/Kong/Istio Ingress

2025 年可观测 10 大趋势预测

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

沉浸式学习PostgreSQL|PolarDB 16: 植入通义千问大模型+文本向量化模型, 让数据库具备AI能力

SLS 大模型可观测&安全推理审计标准解决方案

数据库索引，一文揭秘PolarDB XPlan索引选择

人人都是AI大师 - Prompt工程

vLLM部署Yuan2.0：高吞吐、更便捷

LISA微调技术解析：比LoRA更低的显存更快的速度

官方博客-第27页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

政采云业务网关实践：使用 Higress 统一替代 APISIX/Kong/Istio Ingress

2025 年可观测 10 大趋势预测

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

沉浸式学习PostgreSQL|PolarDB 16: 植入通义千问大模型+文本向量化模型, 让数据库具备AI能力

SLS 大模型可观测&安全推理审计标准解决方案

数据库索引，一文揭秘PolarDB XPlan索引选择

人人都是AI大师 - Prompt工程

vLLM部署Yuan2.0：高吞吐、更便捷

LISA微调技术解析：比LoRA更低的显存更快的速度