ModelScope

2024-05-15

在魔搭使用ComfyUI，玩转AIGC

ComfyUI是一个功能强大、模块化程度高的AIGC图形和视频生成的用户界面和后台。

ModelScope

1,134

米基

2024-05-15

734

大模型推理优化实践：KV cache复用与投机采样

在本文中，我们将详细介绍两种在业务中实践的优化策略：多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架实现，并分享一些实现时的关键技巧。

米基

734

探索云世界

2024-05-15

331

使用CDN来加速OSS上存储的文件资源分发

本文为真实设备电商行业的实践，在网站有大量产品图片上传的场景下，用OSS配合CDN加速，提高了用户的访问速度、站点稳定性，并且提供了节省成本的思路。

探索云世界

331

阿里云云原生

2024-07-29

102

从供应商深度绑定，到走向真正的云原生，他们是这样做的

没有 K8s 的运维权限，开发者也能排查和定位问题。

阿里云云原生

102

隆基

2024-05-15

140686

深度剖析 RocketMQ 5.0，架构解析：云原生架构如何支撑多元化场景？

了解 RocketMQ 5.0 的核心概念和架构概览；然后我们会从集群角度出发，从宏观视角学习 RocketMQ 的管控链路、数据链路、客户端和服务端如何交互；学习 RocketMQ 如何实现数据的存储，数据的高可用，如何利用云原生存储进一步提升竞争力。

隆基

140,686

阿里云百炼

2024-07-03

346

阿里云百炼模型入门篇-大语言模型

本文主要介绍如何快速的通过阿里云百炼，带你如何快速入门通义千问系列大语言模型。

阿里云百炼

346

元丹

2024-05-15

280298

深入浅出LangChain与智能Agent：构建下一代AI助手

LangChain为大型语言模型提供了一种全新的搭建和集成方式，通过这个强大的框架，我们可以将复杂的技术任务简化，让创意和创新更加易于实现。本文从LangChain是什么到LangChain的实际案例到智能体的快速发展做了全面的讲解。

元丹

280,298

孟威

2024-05-15

104166

SLS 大模型可观测&安全推理审计标准解决方案

本文介绍大模型可观测&安全推理审计解决方案和Demo演示，SLS 提供全面的 LLM 监控和日志记录功能。监控大模型使用情况和性能，自定义仪表盘；SLS 汇总 Actiontrail 事件、云产品可观测日志、LLM 网关明细日志、详细对话明细日志、Prompt Trace 和推理实时调用明细等数据，建设完整统一的大模型可观测方案，为用户的大模型安全推理审计提供全面合规支持。

孟威

104,166

子白

2024-05-15

101021

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

101,021

类目筛选

内容类型

在魔搭使用ComfyUI，玩转AIGC

大模型推理优化实践：KV cache复用与投机采样

使用CDN来加速OSS上存储的文件资源分发

从供应商深度绑定，到走向真正的云原生，他们是这样做的

深度剖析 RocketMQ 5.0，架构解析：云原生架构如何支撑多元化场景？

阿里云百炼模型入门篇-大语言模型

深入浅出LangChain与智能Agent：构建下一代AI助手

SLS 大模型可观测&安全推理审计标准解决方案

大语言模型推理提速，TensorRT-LLM 高性能推理实践