子白

2024-05-15

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

100,821

德灵

2024-05-15

114800

阿里云PAI大模型RAG对话系统最佳实践

本文为大模型RAG对话系统最佳实践，旨在指引AI开发人员如何有效地结合LLM大语言模型的推理能力和外部知识库检索增强技术，从而显著提升对话系统的性能，使其能更加灵活地返回用户查询的内容。适用于问答、摘要生成和其他依赖外部知识的自然语言处理任务。通过该实践，您可以掌握构建一个大模型RAG对话系统的完整开发链路。

德灵

114,800

抱泽

2024-05-15

135

Kubernetes 文件采集实践：Sidecar + hostPath 卷

在Kubernetes 日志查询分析实践中，我们介绍了如何通过 DaemonSet 方式部署 logtail 并采集标准输出/文件两种形式的数据。DaemonSet 部署的优势在于其能够尽可能地减少采集 agent 所占用的资源且支持标准输出采集，但因为每个 DaemonSet pod 需要负责 n...

抱泽

135

子丑

2024-06-13

64693

基于 Nginx Ingress + 云效 AppStack 实现灰度发布

本文将演示结合云效 AppStack，来看下如何在阿里云 ACK 集群上进行应用的 Ingress 灰度发布。

子丑

64,693

ModelScope

2024-05-15

637

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

MiniCPM-V 2.0 不仅带来优秀端侧多模态通用能力，更带来惊艳的 OCR 表现。通过自研的高清图像解码技术，可以突破传统困境，让更为精准地识别充满纷繁细节的街景、长图在端侧成为可能。

ModelScope

637

ModelScope

2024-05-15

1867

Qwen1.5-MoE开源，魔搭社区推理训练最佳实践教程来啦

通义千问团队推出Qwen系列的首个MoE模型，Qwen1.5-MoE-A2.7B。

ModelScope

1,867

ModelScope

2024-05-15

970

在魔搭使用ComfyUI，玩转AIGC

ComfyUI是一个功能强大、模块化程度高的AIGC图形和视频生成的用户界面和后台。

ModelScope

970

ModelScope

2024-05-15

657

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

本期文章，我们将向大家展示如何使用AgentScope中构建和使用具有RAG功能的智能体，创造AgentScope助手群，为大家解答和AgentScope相关的问题。

ModelScope

657

祎程

2024-06-19

162

通过OOS定时升级Redis实例临时带宽

阿里云OOS提供了定时升级Redis实例临时带宽的功能，以应对数据驱动业务中的流量高峰。这个功能允许用户根据预测的业务负载，在特定日期和时间自动增加Redis实例的带宽，确保服务性能和稳定性。在高流量事件结束后，带宽会自动恢复到原设置，节省成本。此功能适用于电商平台促销、大型游戏更新等场景，确保在流量高峰期间的系统稳定运行。

祎程

162

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

阿里云PAI大模型RAG对话系统最佳实践

Kubernetes 文件采集实践：Sidecar + hostPath 卷

基于 Nginx Ingress + 云效 AppStack 实现灰度发布

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

Qwen1.5-MoE开源，魔搭社区推理训练最佳实践教程来啦

在魔搭使用ComfyUI，玩转AIGC

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

通过OOS定时升级Redis实例临时带宽