官方博客-第12页-阿里云开发者社区

德灵

2024-05-15

118063

阿里云PAI大模型RAG对话系统最佳实践

本文为大模型RAG对话系统最佳实践，旨在指引AI开发人员如何有效地结合LLM大语言模型的推理能力和外部知识库检索增强技术，从而显著提升对话系统的性能，使其能更加灵活地返回用户查询的内容。适用于问答、摘要生成和其他依赖外部知识的自然语言处理任务。通过该实践，您可以掌握构建一个大模型RAG对话系统的完整开发链路。

德灵

118,063

ModelScope

2024-05-15

1855

Multi-Agent实践第7期：智能体的高效协作

教程第7期

ModelScope

1,855

ModelScope

2024-05-15

1152

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,152

阿里云云原生

2024-05-24

47964

“黏土风格”轻松拿捏，基于函数计算部署 ComfyUI实现AI生图

使用阿里云函数计算FC，快速部署AI绘画工具ComfyUI，体验高质量图像生成。新用户可享180元试用额度，包括GPU、vCPU、内存和调用次数。开通FC和文件存储NAS，通过应用中心选择ComfyUI模板创建应用。

阿里云云原生

47,964

阿里云云原生

2025-01-24

794

智能理解 PPT 内容，快速生成讲解视频

本方案利用函数计算 FC 部署 Web 应用，调用百炼模型服务实现 PPT 到视频的自动转换。视觉模型智能理解 PPT 图文内容，快速生成相匹配的解说词；文本模型对解说词进行优化，提高其可读性和吸引力；语音模型则根据解说词生成生动流畅的旁白音频。整个过程高度集成，只需一键操作，系统即可自动整合图片、文本和音频素材，快速生成对应讲解视频。

阿里云云原生

794

新念

2025-02-14

1431

DeepSeek-V3 高效训练关键技术分析

本文从模型架构、并行策略、通信优化和显存优化四个方面展开，深入分析了DeepSeek-V3高效训练的关键技术，探讨其如何以仅5%的算力实现对标GPT-4o的性能。

新念

1,431

丕天

2025-03-21

1129

AI 推理场景的痛点和解决方案

一个典型的推理场景面临的问题可以概括为限流、负载均衡、异步化、数据管理、索引增强 5 个场景。通过云数据库 Tair 丰富的数据结构可以支撑这些场景，解决相关问题，本文我们会针对每个场景逐一说明。

丕天

1,129

阿里云云原生

2025-04-07

685

极氪汽车云原生架构落地实践

随着极氪数字业务的飞速发展，背后的 IT 技术也在不断更新迭代。极氪极为重视客户对服务的体验，并将系统稳定性、业务功能的迭代效率、问题的快速定位和解决视为构建核心竞争力的基石。

阿里云云原生

685

阿里云开发者

2025-04-24

1158

为什么一定要做Agent智能体？

作者通过深入分析、理解、归纳，最后解答了“为什么一定要做Agent”这个问题。

阿里云开发者

1,158

官方博客-第12页-阿里云开发者社区

类目筛选

内容类型

阿里云PAI大模型RAG对话系统最佳实践

Multi-Agent实践第7期：智能体的高效协作

vLLM部署Yuan2.0：高吞吐、更便捷

“黏土风格”轻松拿捏，基于函数计算部署 ComfyUI实现AI生图

智能理解 PPT 内容，快速生成讲解视频

DeepSeek-V3 高效训练关键技术分析

AI 推理场景的痛点和解决方案

极氪汽车云原生架构落地实践

为什么一定要做Agent智能体？

官方博客-第12页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

阿里云PAI大模型RAG对话系统最佳实践

Multi-Agent实践第7期：智能体的高效协作

vLLM部署Yuan2.0：高吞吐、更便捷

“黏土风格”轻松拿捏，基于函数计算部署 ComfyUI实现AI生图

智能理解 PPT 内容，快速生成讲解视频

DeepSeek-V3 高效训练关键技术分析

AI 推理场景的痛点和解决方案

极氪汽车云原生架构落地实践

为什么一定要做Agent智能体？