子白

2024-05-15

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

101,259

ModelScope

2024-05-15

108951

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

Arm 架构的服务器通常具备低功耗的特性，能带来更优异的能效比。相比于传统的 x86 架构服务器，Arm 服务器在相同功耗下能够提供更高的性能。这对于大模型推理任务来说尤为重要，因为大模型通常需要大量的计算资源，而能效比高的 Arm 架构服务器可以提供更好的性能和效率。

ModelScope

108,951

ModelScope

2024-05-15

2154

Qwen1.5-MoE开源，魔搭社区推理训练最佳实践教程来啦

通义千问团队推出Qwen系列的首个MoE模型，Qwen1.5-MoE-A2.7B。

ModelScope

2,154

茏城

2024-06-28

193

深度｜大模型时代下，基于湖仓一体的数据智能新范式

本次文根据峰会演讲内容整理：分享在大模型时代基于湖仓一体的数据产品演进，以及我们观察到的一些智能开发相关的新范式。

茏城

193

施晨尹丰彬筱文李林杨黄俊等

2023-11-07

42168

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

基于原始的阿里云计算平台产技文档，搭建一套基于大模型检索增强答疑机器人。本方案已在阿里云线上多个场景落地，将覆盖阿里云官方答疑群聊、研发答疑机器人、钉钉技术服务助手等。线上工单拦截率提升10+%，答疑采纳率70+%，显著提升答疑效率。

施晨尹丰彬筱文李林杨黄俊等

42,168

悟鸣

2024-05-15

238584

一文掌握大模型提示词技巧：从战略到战术

本文将用通俗易懂的语言，带你从战略（宏观）和战术（微观）两个层次掌握大模型提示词的常见技巧，真正做到理论和实践相结合，占领 AI 运用的先机。

悟鸣

238,584

灵杰开发者

2024-08-22

17499

Apache Paimon V0.9最新进展

Apache Paimon V0.9 版本即将发布，此版本带来了多项新特性并解决了关键挑战。Paimon自2022年从Flink社区诞生以来迅速成长，已成为Apache顶级项目，并广泛应用于阿里集团内外的多家企业。

灵杰开发者

17,499

ModelScope

2024-05-15

449

元象大模型开源30款量化版本加速低成本部署丨附教程

元象大模型一次性发布30款量化版本，全开源，无条件免费商用。

ModelScope

449

ModelScope

2024-05-15

824

Multi-Agent实践第7期：智能体的高效协作

教程第7期

ModelScope

824

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

Qwen1.5-MoE开源，魔搭社区推理训练最佳实践教程来啦

深度｜大模型时代下，基于湖仓一体的数据智能新范式

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

一文掌握大模型提示词技巧：从战略到战术

Apache Paimon V0.9最新进展

元象大模型开源30款量化版本加速低成本部署丨附教程

Multi-Agent实践第7期：智能体的高效协作

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

Qwen1.5-MoE开源，魔搭社区推理训练最佳实践教程来啦

深度｜大模型时代下，基于湖仓一体的数据智能新范式

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

一文掌握大模型提示词技巧：从战略到战术

Apache Paimon V0.9最新进展

元象大模型开源30款量化版本 加速低成本部署丨附教程

Multi-Agent实践第7期：智能体的高效协作

元象大模型开源30款量化版本加速低成本部署丨附教程