子白

2024-05-15

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

101,235

灵杰开发者

2024-08-22

17475

Apache Paimon V0.9最新进展

Apache Paimon V0.9 版本即将发布，此版本带来了多项新特性并解决了关键挑战。Paimon自2022年从Flink社区诞生以来迅速成长，已成为Apache顶级项目，并广泛应用于阿里集团内外的多家企业。

灵杰开发者

17,475

任庆盛

2023-02-22

22053

Flink CDC+Kafka 加速业务实时化

阿里巴巴开发工程师，Apache Flink Committer 任庆盛，在 9 月 24 日 Apache Flink Meetup 的分享。

任庆盛

22,053

阿里云百炼

2024-07-03

489

阿里云百炼模型入门篇-大语言模型

本文主要介绍如何快速的通过阿里云百炼，带你如何快速入门通义千问系列大语言模型。

阿里云百炼

489

ModelScope

2024-05-15

1040

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

本期文章，我们将向大家展示如何使用AgentScope中构建和使用具有RAG功能的智能体，创造AgentScope助手群，为大家解答和AgentScope相关的问题。

ModelScope

1,040

阿里云实时数仓Hologres

2024-06-27

1692

实时数仓Hologres OLAP场景核心能力介绍

Hologres提供统一、实时、弹性、易用的一站式实时数仓引擎，解决复杂OLAP难题。

阿里云实时数仓Hologres

1,692

阿里云实时数仓Hologres

2024-06-07

128841

一站式实时数仓Hologres整体能力介绍—2024实时数仓Hologres公开课 01

阿里云实时数仓Hologres

128,841

希秀吴诗倩柳佚洲公等

2024-09-03

70

【算法精讲系列】通义模型Prompt调优的实用技巧与经验分享

本文详细阐述了Prompt的设计要素，包括引导语、上下文信息等，还介绍了多种Prompt编写策略，如复杂规则拆分、关键信息冗余、使用分隔符等，旨在提高模型输出的质量和准确性。通过不断尝试、调整和优化，可逐步实现更优的Prompt设计。

希秀吴诗倩柳佚洲公等

70

悟鸣

2024-05-15

238565

一文掌握大模型提示词技巧：从战略到战术

本文将用通俗易懂的语言，带你从战略（宏观）和战术（微观）两个层次掌握大模型提示词的常见技巧，真正做到理论和实践相结合，占领 AI 运用的先机。

悟鸣

238,565

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Apache Paimon V0.9最新进展

Flink CDC+Kafka 加速业务实时化

阿里云百炼模型入门篇-大语言模型

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

实时数仓Hologres OLAP场景核心能力介绍

一站式实时数仓Hologres整体能力介绍—2024实时数仓Hologres公开课 01

【算法精讲系列】通义模型Prompt调优的实用技巧与经验分享

一文掌握大模型提示词技巧：从战略到战术