阿里云云原生

2024-05-15

OpenKruise v1.6 版本解读：增强多域管理能力

OpenKruise 在 2024.3 发布了最新的 v1.6 版本（ChangeLog），本文对新版本的核心特性做整体介绍。

阿里云云原生

164,889

一为

2024-05-15

146

基于ASK+TFJob快速完成分布式Tensorflow训练任务

本文介绍如何使用TFJob在ASK+ECI场景下，快速完成基于GPU的TensorFlow分布式训练任务。

一为

146

ModelScope

2024-05-15

970

在魔搭使用ComfyUI，玩转AIGC

ComfyUI是一个功能强大、模块化程度高的AIGC图形和视频生成的用户界面和后台。

ModelScope

970

ModelScope

2024-05-15

156

用消费级显卡微调属于自己的Agent

本文为魔搭社区轻量级训练推理工具SWIFT微调实战教程系列

ModelScope

156

探索云世界

2024-05-15

2348

阿里云大降价后，再谈“降本增效”

2024年2月29日，阿里云宣布史上最大力度降价，引发行业对用云成本的热议。

探索云世界

2,348

德灵

2024-05-15

114800

阿里云PAI大模型RAG对话系统最佳实践

本文为大模型RAG对话系统最佳实践，旨在指引AI开发人员如何有效地结合LLM大语言模型的推理能力和外部知识库检索增强技术，从而显著提升对话系统的性能，使其能更加灵活地返回用户查询的内容。适用于问答、摘要生成和其他依赖外部知识的自然语言处理任务。通过该实践，您可以掌握构建一个大模型RAG对话系统的完整开发链路。

德灵

114,800

吴昆

2024-05-15

145392

弹性调度助力企业灵活应对业务变化，高效管理云上资源

本文主要介绍了弹性调企业灵活应对企业业务变化，并高效管理云上资源。

吴昆

145,392

赫曦

2024-05-15

92576

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

本文主要介绍了通过弹性，实现成本优化，解决集群资源利用率难题。

赫曦

92,576

子白

2024-05-15

100820

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

100,820

类目筛选

内容类型

OpenKruise v1.6 版本解读：增强多域管理能力

基于ASK+TFJob快速完成分布式Tensorflow训练任务

在魔搭使用ComfyUI，玩转AIGC

用消费级显卡微调属于自己的Agent

阿里云大降价后，再谈“降本增效”

阿里云PAI大模型RAG对话系统最佳实践

弹性调度助力企业灵活应对业务变化，高效管理云上资源

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

大语言模型推理提速，TensorRT-LLM 高性能推理实践