官方博客-第18页-阿里云开发者社区

望宸

2025-02-20

655

大模型推理服务全景图

推理性能的提升涉及底层硬件、模型层，以及其他各个软件中间件层的相互协同，因此了解大模型技术架构的全局视角，有助于我们对推理性能的优化方案进行评估和选型。

望宸

655

阿里云云原生

2025-06-30

423

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

本文介绍了如何使用 llmaz 快速部署基于 vLLM 的大语言模型推理服务，并结合 Higress AI 网关实现流量控制、可观测性、故障转移等能力，构建稳定、高可用的大模型服务平台。

阿里云云原生

423

茏久

2023-07-21

138765

如何使用AnalyticDB PostgreSQL 版实现“一站式全文检索”业务

本文从阿里云用户使用云原生数据仓库AnalyticDB PostgreSQL版（以下简称ADB PG）的实际体验出发，介绍ADB PG如何实现“一站式全文检索”业务，并详细阐述ADB PG使用的优势技术，最后提供对应业务案例分析。

茏久

138,765

石樵

2023-12-01

3006

分布式锁实现原理与最佳实践

在单体的应用开发场景中涉及并发同步时，大家往往采用Synchronized（同步）或同一个JVM内Lock机制来解决多线程间的同步问题。而在分布式集群工作的开发场景中，就需要一种更加高级的锁机制来处理跨机器的进程之间的数据同步问题，这种跨机器的锁就是分布式锁。接下来本文将为大家分享分布式锁的最佳实践。

石樵

3,006

ModelScope

2024-05-15

940

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

基于单个开源小模型的工具调用Agent，由于模型容量和预训练能力获取的限制，无法在推理和规划、工具调用、回复生成等任务上同时获得比肩大模型等性能。

ModelScope

940

德灵

2024-05-15

118056

阿里云PAI大模型RAG对话系统最佳实践

本文为大模型RAG对话系统最佳实践，旨在指引AI开发人员如何有效地结合LLM大语言模型的推理能力和外部知识库检索增强技术，从而显著提升对话系统的性能，使其能更加灵活地返回用户查询的内容。适用于问答、摘要生成和其他依赖外部知识的自然语言处理任务。通过该实践，您可以掌握构建一个大模型RAG对话系统的完整开发链路。

德灵

118,056

ModelScope

2024-05-15

506

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

近日，元象发布其首个Moe大模型 XVERSE-MoE-A4.2B，采用混合专家模型架构（Mixture of Experts），激活参数4.2B，效果即可媲美13B模型。该模型全开源，无条件免费商用，支持中小企业、研究者和开发者可在元象高性能“全家桶”中按需选用，推动低成本部署。

ModelScope

506

阿里云实时数仓Hologres

2024-05-15

1013

Flink+Paimon+Hologres 构建实时湖仓数据分析

本文整理自阿里云高级专家喻良，在 Flink Forward Asia 2023 主会场的分享。

阿里云实时数仓Hologres

1,013

ModelScope

2024-05-15

1144

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,144

官方博客-第18页-阿里云开发者社区

类目筛选

内容类型

大模型推理服务全景图

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

如何使用AnalyticDB PostgreSQL 版实现“一站式全文检索”业务

分布式锁实现原理与最佳实践

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

阿里云PAI大模型RAG对话系统最佳实践

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

Flink+Paimon+Hologres 构建实时湖仓数据分析

vLLM部署Yuan2.0：高吞吐、更便捷

官方博客-第18页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大模型推理服务全景图

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

如何使用AnalyticDB PostgreSQL 版实现“一站式全文检索”业务

分布式锁实现原理与最佳实践

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

阿里云PAI大模型RAG对话系统最佳实践

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

Flink+Paimon+Hologres 构建实时湖仓数据分析

vLLM部署Yuan2.0：高吞吐、更便捷