官方博客-第18页-阿里云开发者社区

子白

2024-05-15

102443

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,443

德灵

2024-05-15

118057

阿里云PAI大模型RAG对话系统最佳实践

本文为大模型RAG对话系统最佳实践，旨在指引AI开发人员如何有效地结合LLM大语言模型的推理能力和外部知识库检索增强技术，从而显著提升对话系统的性能，使其能更加灵活地返回用户查询的内容。适用于问答、摘要生成和其他依赖外部知识的自然语言处理任务。通过该实践，您可以掌握构建一个大模型RAG对话系统的完整开发链路。

德灵

118,057

ModelScope

2024-05-15

1201

元象大模型开源30款量化版本加速低成本部署丨附教程

元象大模型一次性发布30款量化版本，全开源，无条件免费商用。

ModelScope

1,201

ModelScope

2024-05-15

2584

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

本期文章，我们将向大家展示如何使用AgentScope中构建和使用具有RAG功能的智能体，创造AgentScope助手群，为大家解答和AgentScope相关的问题。

ModelScope

2,584

ModelScope

2024-05-15

1851

Multi-Agent实践第7期：智能体的高效协作

教程第7期

ModelScope

1,851

CloudImagine

2024-07-05

391

泛娱乐出海Plus时代，音视频能力基座与时俱进

泛娱乐的音视频技术随着出海在演进，交互和内容的技术是内核，也在融合。

CloudImagine

391

千习

2024-07-22

15869

Spring Cloud Alibaba 集成分布式定时任务调度功能

Spring Cloud Alibaba 发布了 Scheduling 任务调度模块 [#3732]提供了一套开源、轻量级、高可用的定时任务解决方案，帮助您快速开发微服务体系下的分布式定时任务。

千习

15,869

易定

2024-12-06

1039

【实战干货】AI大模型工程应用于车联网场景的实战总结

本文介绍了图像生成技术在AIGC领域的发展历程、关键技术和当前趋势，以及这些技术如何应用于新能源汽车行业的车联网服务中。

易定

1,039

李德

2024-12-06

1337

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

本文章基于业务实践，总结有关客服质检场景的解决方案和处理经验，为相似场景提供可行的借鉴方法。

李德

1,337

官方博客-第18页-阿里云开发者社区

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

阿里云PAI大模型RAG对话系统最佳实践

元象大模型开源30款量化版本加速低成本部署丨附教程

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

Multi-Agent实践第7期：智能体的高效协作

泛娱乐出海Plus时代，音视频能力基座与时俱进

Spring Cloud Alibaba 集成分布式定时任务调度功能

【实战干货】AI大模型工程应用于车联网场景的实战总结

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

官方博客-第18页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

阿里云PAI大模型RAG对话系统最佳实践

元象大模型开源30款量化版本 加速低成本部署丨附教程

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

Multi-Agent实践第7期：智能体的高效协作

泛娱乐出海Plus时代，音视频能力基座与时俱进

Spring Cloud Alibaba 集成分布式定时任务调度功能

【实战干货】AI大模型工程应用于车联网场景的实战总结

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

元象大模型开源30款量化版本加速低成本部署丨附教程