官方博客-第18页-阿里云开发者社区

王明橙鲤黄俊

2024-05-15

64124

通义千问开源模型在PAI灵骏的最佳实践

本文将展示如何基于阿里云PAI灵骏智算服务，在通义千问开源模型之上进行高效分布式继续预训练、指令微调、模型离线推理验证以及在线服务部署。

王明橙鲤黄俊等

64,124

子白

2024-05-15

102444

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,444

ModelScope

2024-05-15

943

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

基于单个开源小模型的工具调用Agent，由于模型容量和预训练能力获取的限制，无法在推理和规划、工具调用、回复生成等任务上同时获得比肩大模型等性能。

ModelScope

943

阿里云实时数仓Hologres

2024-05-15

1017

Flink+Paimon+Hologres 构建实时湖仓数据分析

本文整理自阿里云高级专家喻良，在 Flink Forward Asia 2023 主会场的分享。

阿里云实时数仓Hologres

1,017

太业

2024-05-15

1106

【最佳实践】iLogtail使用Grok语法解析日志

目标读者数字化系统开发运维（DevOps）工程师、稳定性工程师（SRE）、可观测平台运维人员等。背景介绍日志的形式往往多种多样，如果只是简单的读入日志数据，将很难进行搜索、分析及可视化。将原始的日志数据解析为结构化的数据，将大幅提升数据的可用性，方便用户进行快捷的“字段-值”的查询和分析。最基础的解...

太业

1,106

阿里云瑶池数据库

2024-05-15

71390

数据存储成本飙升，莫慌，RDS数据归档功能来了

一文解锁阿里云RDS数据归档功能。

阿里云瑶池数据库

71,390

ModelScope

2024-05-15

1128

LISA微调技术解析：比LoRA更低的显存更快的速度

LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写，由UIUC联合LMFlow团队于近期提出的一项LLM微调技术，可实现把全参训练的显存使用降低到之前的三分之一左右，而使用的技术方法却是非常简单。

ModelScope

1,128

ModelScope

2024-05-15

739

联合XTuner，魔搭社区全面支持数据集的长文本训练

XTuner和魔搭社区（SWIFT）合作引入了一项长序列文本训练技术，该技术能够在多GPU环境中将长序列文本数据分割并分配给不同GPU，从而减少每个GPU上的显存占用。通过这种方式，训练超大规模模型时可以处理更长的序列，提高训练效率。魔搭社区的SWIFT框架已经集成了这一技术，支持多种大模型和数据集的训练。此外，SWIFT还提供了一个用户友好的界面，方便用户进行训练和部署，并且支持评估功能。

ModelScope

739

阿里云云原生

2024-07-30

3588

5 大场景上手通义灵码企业知识库问答

通义灵码在企业版里还引入了一个超酷的新技能：RAG（Retrieval-Augmented Generation）检索增强生成的能力，本文就跟大家分享下企业知识库能帮开发者做些什么。

阿里云云原生

3,588

官方博客-第18页-阿里云开发者社区

类目筛选

内容类型

通义千问开源模型在PAI灵骏的最佳实践

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

Flink+Paimon+Hologres 构建实时湖仓数据分析

【最佳实践】iLogtail使用Grok语法解析日志

数据存储成本飙升，莫慌，RDS数据归档功能来了

LISA微调技术解析：比LoRA更低的显存更快的速度

联合XTuner，魔搭社区全面支持数据集的长文本训练

5 大场景上手通义灵码企业知识库问答

官方博客-第18页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

通义千问开源模型在PAI灵骏的最佳实践

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

Flink+Paimon+Hologres 构建实时湖仓数据分析

【最佳实践】iLogtail使用Grok语法解析日志

数据存储成本飙升，莫慌，RDS数据归档功能来了

LISA微调技术解析：比LoRA更低的显存更快的速度

联合XTuner，魔搭社区全面支持数据集的长文本训练

5 大场景上手通义灵码企业知识库问答