ModelScope

2024-05-15

用消费级显卡微调属于自己的Agent

本文为魔搭社区轻量级训练推理工具SWIFT微调实战教程系列

ModelScope

156

隆基

2024-05-15

140491

深度剖析 RocketMQ 5.0，架构解析：云原生架构如何支撑多元化场景？

了解 RocketMQ 5.0 的核心概念和架构概览；然后我们会从集群角度出发，从宏观视角学习 RocketMQ 的管控链路、数据链路、客户端和服务端如何交互；学习 RocketMQ 如何实现数据的存储，数据的高可用，如何利用云原生存储进一步提升竞争力。

隆基

140,491

德灵

2024-05-15

114811

阿里云PAI大模型RAG对话系统最佳实践

本文为大模型RAG对话系统最佳实践，旨在指引AI开发人员如何有效地结合LLM大语言模型的推理能力和外部知识库检索增强技术，从而显著提升对话系统的性能，使其能更加灵活地返回用户查询的内容。适用于问答、摘要生成和其他依赖外部知识的自然语言处理任务。通过该实践，您可以掌握构建一个大模型RAG对话系统的完整开发链路。

德灵

114,811

阿里云存储

2024-05-15

138423

用软硬协同设计下的飞天盘古降低存储系统开销

历经 15 载，如今的飞天盘古系统已迭代至第三代，数千万行代码和 1,000 余项专利，从大规模、到高性能、到高效能的分布式存储系统的演进，更高效地让数据中心成为一台计算机。

阿里云存储

138,423

吴昆

2024-05-15

145393

弹性调度助力企业灵活应对业务变化，高效管理云上资源

本文主要介绍了弹性调企业灵活应对企业业务变化，并高效管理云上资源。

吴昆

145,393

赫曦

2024-05-15

92576

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

本文主要介绍了通过弹性，实现成本优化，解决集群资源利用率难题。

赫曦

92,576

橙鲤

2024-05-15

157

如何在数字世界复刻一个高还原、高拟真的“你”

通过阿里云智能媒体服务IMS完成数字人形象训练、人声克隆定制，并使用Timeline实现视频合成及创作，打造一个“声形俱佳”的数字分身。

橙鲤

157

子白

2024-05-15

100836

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

100,836

孟威

2024-05-15

104079

SLS 大模型可观测&安全推理审计标准解决方案

本文介绍大模型可观测&安全推理审计解决方案和Demo演示，SLS 提供全面的 LLM 监控和日志记录功能。监控大模型使用情况和性能，自定义仪表盘；SLS 汇总 Actiontrail 事件、云产品可观测日志、LLM 网关明细日志、详细对话明细日志、Prompt Trace 和推理实时调用明细等数据，建设完整统一的大模型可观测方案，为用户的大模型安全推理审计提供全面合规支持。

孟威

104,079

类目筛选

内容类型

用消费级显卡微调属于自己的Agent

深度剖析 RocketMQ 5.0，架构解析：云原生架构如何支撑多元化场景？

阿里云PAI大模型RAG对话系统最佳实践

用软硬协同设计下的飞天盘古降低存储系统开销

弹性调度助力企业灵活应对业务变化，高效管理云上资源

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

如何在数字世界复刻一个高还原、高拟真的“你”

大语言模型推理提速，TensorRT-LLM 高性能推理实践

SLS 大模型可观测&安全推理审计标准解决方案