2024-05-15
101252

大语言模型推理提速,TensorRT-LLM 高性能推理实践

大型语言模型(Large language models,LLM)是基于大量数据进行预训练的超大型深度学习模型,本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

101,252
2024-08-16
19712

Apache RocketMQ 批处理模型演进之路

RocketMQ 早期批处理模型存在一定的约束条件,为进一步提升性能,RocketMQ 进行了索引构建流水线改造,同时 BatchCQ 模型和 AutoBatch 模型也优化了批处理流程,提供了更简便的使用体验,快点击本文查看详情及配置展示~

19,712
2024-09-03
89

【算法精讲系列】通义模型Prompt调优的实用技巧与经验分享

本文详细阐述了Prompt的设计要素,包括引导语、上下文信息等,还介绍了多种Prompt编写策略,如复杂规则拆分、关键信息冗余、使用分隔符等,旨在提高模型输出的质量和准确性。通过不断尝试、调整和优化,可逐步实现更优的Prompt设计。

2024-05-15
163358

设计与构建 FinOps 流程、团队、体系与目标

企业 FinOps 实施不是一蹴而就的项目,如果您正在推进企业云原生 FinOps 落地,除了选择合适的技术手段,企业内部的流程和体系建设也尤为重要。

163,358
2024-07-30
481

阿里云百炼应用实践系列-AI助手快速搭建

本文主要介绍如何基于百炼平台快速在10分钟为您的网站添加一个 AI 助手。我们基于百炼平台的能力,以官方帮助文档为参考,搭建了一个以便全天候(7x24)回应客户咨询的AI助手,介绍了相关技术方案和主要代码,供开发者参考。

481
2024-08-12
121

5 大场景上手通义灵码企业知识库 RAG

大家好,我是通义灵码,你的智能编程助手!今天就跟大家分享下企业知识库能帮开发者做些什么。

2024-05-15
280430

深入浅出LangChain与智能Agent:构建下一代AI助手

LangChain为大型语言模型提供了一种全新的搭建和集成方式,通过这个强大的框架,我们可以将复杂的技术任务简化,让创意和创新更加易于实现。本文从LangChain是什么到LangChain的实际案例到智能体的快速发展做了全面的讲解。

280,430
2024-07-22
14591

Spring Cloud Alibaba 集成分布式定时任务调度功能

Spring Cloud Alibaba 发布了 Scheduling 任务调度模块 [#3732]提供了一套开源、轻量级、高可用的定时任务解决方案,帮助您快速开发微服务体系下的分布式定时任务。

14,591
2024-09-10
53

阿里云百炼|析言GBI产品入门指导

析言基础入门的操作体验,带领大家一起探索阿里云百炼|析言GBI的奥秘。

1
...
4
5
6
...
34
到第
5/34