官方博客-第20页-阿里云开发者社区

子白

2024-05-15

102445

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,445

ModelScope

2024-05-15

1203

元象大模型开源30款量化版本加速低成本部署丨附教程

元象大模型一次性发布30款量化版本，全开源，无条件免费商用。

ModelScope

1,203

ModelScope

2024-05-15

1149

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,149

ModelScope

2024-05-15

1129

LISA微调技术解析：比LoRA更低的显存更快的速度

LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写，由UIUC联合LMFlow团队于近期提出的一项LLM微调技术，可实现把全参训练的显存使用降低到之前的三分之一左右，而使用的技术方法却是非常简单。

ModelScope

1,129

阿里云云原生

2024-05-24

47958

“黏土风格”轻松拿捏，基于函数计算部署 ComfyUI实现AI生图

使用阿里云函数计算FC，快速部署AI绘画工具ComfyUI，体验高质量图像生成。新用户可享180元试用额度，包括GPU、vCPU、内存和调用次数。开通FC和文件存储NAS，通过应用中心选择ComfyUI模板创建应用。

阿里云云原生

47,958

阿里云实时数仓Hologres

2024-06-27

102985

Hologres+Flink企业级实时数仓核心能力介绍

通过Hologres+Flink构建易用、统一的企业级实时数仓。

阿里云实时数仓Hologres

102,985

明巍临城水德

2024-11-14

530

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理

在本文中，作者介绍了 Lingma SWE-GPT，一款专为解决复杂软件改进任务设计的开源大型语言模型系列。

明巍临城水德等

530

阿里云瑶池数据库

2024-11-21

1529

拥抱Data+AI｜“全球第一”雅迪如何实现智能营销？DMS+PolarDB注入数据新活力

针对雅迪“云销通App”的需求与痛点，本文将介绍阿里云瑶池数据库DMS+PolarDB for AI提供的一站式Data+AI解决方案，助力销售人员高效用数，全面提升销售管理效率。

阿里云瑶池数据库

1,529

阿里云云原生

2025-01-15

466

一键生成毛茸萌宠形象，基于函数计算极速部署 ComfyUI 生图系统

本次方案将帮助大家实现使用阿里云产品函数计算FC，只需简单操作，就可以快速配置ComfyUI大模型，创建出你的专属毛茸茸萌宠形象。内置基础大模型+常用插件+部分 Lora，以风格化图像生成只需用户让体验键配置简单方便，后续您可以根据自己的需要更换需要的模型、Lora、增加插件。

阿里云云原生

466

官方博客-第20页-阿里云开发者社区

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

元象大模型开源30款量化版本加速低成本部署丨附教程

vLLM部署Yuan2.0：高吞吐、更便捷

LISA微调技术解析：比LoRA更低的显存更快的速度

“黏土风格”轻松拿捏，基于函数计算部署 ComfyUI实现AI生图

Hologres+Flink企业级实时数仓核心能力介绍

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理

拥抱Data+AI｜“全球第一”雅迪如何实现智能营销？DMS+PolarDB注入数据新活力

一键生成毛茸萌宠形象，基于函数计算极速部署 ComfyUI 生图系统

官方博客-第20页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

元象大模型开源30款量化版本 加速低成本部署丨附教程

vLLM部署Yuan2.0：高吞吐、更便捷

LISA微调技术解析：比LoRA更低的显存更快的速度

“黏土风格”轻松拿捏，基于函数计算部署 ComfyUI实现AI生图

Hologres+Flink企业级实时数仓核心能力介绍

通义灵码 SWE-GPT：从 静态代码建模 迈向 软件开发过程长链推理

拥抱Data+AI｜“全球第一”雅迪如何实现智能营销？DMS+PolarDB注入数据新活力

一键生成毛茸萌宠形象，基于函数计算极速部署 ComfyUI 生图系统

元象大模型开源30款量化版本加速低成本部署丨附教程

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理