官方博客-第10页-阿里云开发者社区

子白

2024-05-15

102467

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,467

资源编排ROS

2024-05-15

1727

简单几步，钉钉机器人秒变通义千问对话机器人

大模型不知不觉已经火了快一年了，拥有一个能够随时对话使用的大模型已经成为不少人的刚需。然而，最大的问题可能是如何访问和调用对话模型。如果，我是说如果，能在您的即时通讯软件钉钉中直接与通义千问对话，是不是会让这一切更方便快捷？！按照传统方案，我们要实现上述场景可能需要非常繁琐的接入步骤，甚至还需要自行开发很多代码，这样的准入门槛实在，太！高！啦！而今天，我要向各位隆重介绍一个新的解决方案——阿里云计算巢AppFlow应用与数据集成平台，无需任何代码开发，简单快捷，自动连接企业内部应用与外部应用或数据，搭建企业的自动化服务流程，帮助个人、企业降低了集成实施的周期和成本。

资源编排ROS

1,727

ModelScope

2024-05-15

1225

元象大模型开源30款量化版本加速低成本部署丨附教程

元象大模型一次性发布30款量化版本，全开源，无条件免费商用。

ModelScope

1,225

山泽

2024-05-15

1339

从零构建现代深度学习框架(TinyDL-0.01)

本文主要以一个Java工程师视角，阐述如何从零(无任何二三方依赖)构建一个极简(麻雀虽小五脏俱全)现代深度学习框架（类比AI的操作系统）。

山泽

1,339

青熙

2024-11-15

1246

AI经营｜多Agent择优生成商品标题

商品标题中关键词的好坏是商品能否被主搜检索到的关键因素，使用大模型自动优化标题成为【AI经营】中的核心能力之一，本文讲述大模型如何帮助商家优化商品素材，提升商品竞争力。

青熙

1,246

阿里云云原生

2024-07-30

3611

5 大场景上手通义灵码企业知识库问答

通义灵码在企业版里还引入了一个超酷的新技能：RAG（Retrieval-Augmented Generation）检索增强生成的能力，本文就跟大家分享下企业知识库能帮开发者做些什么。

阿里云云原生

3,611

阿里云云原生

2025-02-25

1141

解锁 DeepSeek 安全接入、稳定运行新路径

聚焦于企业部署 DeepSeek 的应用需求，本文介绍了模型权重下载及多种部署方案，还阐述了大模型应用落地的常见需求，帮助用户逐步提升模型应用效果。

阿里云云原生

1,141

ModelScope

2024-05-15

1167

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,167

赵世振

2024-08-21

1483

阿里云百炼应用实践系列-10分钟构建能主动提问的智能导购

通过使用阿里云百炼平台，您可以快速构建一个多代理（Multi-Agent）架构的智能导购助手。该助手能够通过多轮互动了解顾客的具体需求，收集详细信息后，利用阿里云百炼的知识检索增强功能或已有的商品数据库进行商品搜索，为顾客推荐最合适的产品。

赵世振

1,483

官方博客-第10页-阿里云开发者社区

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

简单几步，钉钉机器人秒变通义千问对话机器人

元象大模型开源30款量化版本加速低成本部署丨附教程

从零构建现代深度学习框架(TinyDL-0.01)

AI经营｜多Agent择优生成商品标题

5 大场景上手通义灵码企业知识库问答

解锁 DeepSeek 安全接入、稳定运行新路径

vLLM部署Yuan2.0：高吞吐、更便捷

阿里云百炼应用实践系列-10分钟构建能主动提问的智能导购

官方博客-第10页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

简单几步，钉钉机器人秒变通义千问对话机器人

元象大模型开源30款量化版本 加速低成本部署丨附教程

从零构建现代深度学习框架(TinyDL-0.01)

AI经营｜多Agent择优生成商品标题

5 大场景上手通义灵码企业知识库问答

解锁 DeepSeek 安全接入、稳定运行新路径

vLLM部署Yuan2.0：高吞吐、更便捷

阿里云百炼应用实践系列-10分钟构建能主动提问的智能导购

元象大模型开源30款量化版本加速低成本部署丨附教程