希秀吴诗倩柳佚洲公等

2024-09-03

【算法精讲系列】通义模型Prompt调优的实用技巧与经验分享

本文详细阐述了Prompt的设计要素，包括引导语、上下文信息等，还介绍了多种Prompt编写策略，如复杂规则拆分、关键信息冗余、使用分隔符等，旨在提高模型输出的质量和准确性。通过不断尝试、调整和优化，可逐步实现更优的Prompt设计。

希秀吴诗倩柳佚洲公等

65

子白

2024-05-15

101231

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

101,231

阿里云数据库

2024-05-15

82330

Ganos H3地理网格能力解析与最佳实践

本文介绍了Ganos H3的相关功能，帮助读者快速了解Ganos地理网格的重要特性与应用实践。H3是Uber研发的一种覆盖全球表面的二维地理网格，采用了一种全球统一的、多层次的六边形网格体系来表示地球表面，这种地理网格技术在诸多业务场景中得到广泛应用。Ganos不仅提供了H3网格的全套功能，还支持与其它Ganos时空数据类型进行跨模联合分析，极大程度提升了客户对于时空数据的挖掘分析能力。

阿里云数据库

82,330

张昕东

2024-07-25

13001

通义灵码：AI 研发趋势与效果提升实践丨SDCon 全球软件技术大会演讲全文整理

SDCon 全球软件技术大会上，阿里云通义灵码团队分享了关于 AI 辅助编码的最新研究与实践，随着 AIGC 技术的发展，软件研发领域将迎来智能化的新高度，助力 DevOps 流程优化，提升研发效率和研发幸福感。

张昕东

13,001

ModelScope

2024-05-15

1033

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

本期文章，我们将向大家展示如何使用AgentScope中构建和使用具有RAG功能的智能体，创造AgentScope助手群，为大家解答和AgentScope相关的问题。

ModelScope

1,033

坤硕

2024-07-29

17728

LLM 应用可观测性：从 Trace 视角展开的探索与实践之旅

基于大语言模型的应用在性能、成本、效果等方面存在一系列实际痛点，本文通过分析 LLM 应用模式以及关注点差异来阐明可观测技术挑战，近期阿里云可观测推出了面向 LLM 应用的可观测解决方案以及最佳实践，一起来了解下吧。

坤硕

17,728

阿里云百炼

2024-07-03

484

阿里云百炼模型入门篇-大语言模型

本文主要介绍如何快速的通过阿里云百炼，带你如何快速入门通义千问系列大语言模型。

阿里云百炼

484

凡玺

2024-05-15

121603

Ganos实时热力聚合查询能力解析与最佳实践

本文主要介绍Ganos实时热力聚合查询并动态输出热力瓦片能力，依托阿里云PolarDB PostgreSQL产品、ADB PostgreSQL和RDS PostgreSQL 三款数据库建设输出。

凡玺

121,603

望宸彦林

2024-06-24

50721

从云原生视角看 AI 原生应用架构的实践

本文核心观点： • 基于大模型的 AI 原生应用将越来越多，容器和微服务为代表的云原生技术将加速渗透传统业务。 • API 是 AI 原生应用的一等公民，并引入了更多流量，催生企业新的生命力和想象空间。 • AI 原生应用对网关的需求超越了传统的路由和负载均衡功能，承载了更大的 AI 工程化使命。 • AI Infra 的一致性架构至关重要，API 网关、消息队列、可观测是 AI Infra 的重要组成。

望宸彦林

50,721

类目筛选

内容类型

【算法精讲系列】通义模型Prompt调优的实用技巧与经验分享

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Ganos H3地理网格能力解析与最佳实践

通义灵码：AI 研发趋势与效果提升实践丨SDCon 全球软件技术大会演讲全文整理

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

LLM 应用可观测性：从 Trace 视角展开的探索与实践之旅

阿里云百炼模型入门篇-大语言模型

Ganos实时热力聚合查询能力解析与最佳实践

从云原生视角看 AI 原生应用架构的实践