官方博客-第22页-阿里云开发者社区

ModelScope

2024-05-15

1137

LISA微调技术解析：比LoRA更低的显存更快的速度

LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写，由UIUC联合LMFlow团队于近期提出的一项LLM微调技术，可实现把全参训练的显存使用降低到之前的三分之一左右，而使用的技术方法却是非常简单。

ModelScope

1,137

ModelScope

2024-05-15

747

联合XTuner，魔搭社区全面支持数据集的长文本训练

XTuner和魔搭社区（SWIFT）合作引入了一项长序列文本训练技术，该技术能够在多GPU环境中将长序列文本数据分割并分配给不同GPU，从而减少每个GPU上的显存占用。通过这种方式，训练超大规模模型时可以处理更长的序列，提高训练效率。魔搭社区的SWIFT框架已经集成了这一技术，支持多种大模型和数据集的训练。此外，SWIFT还提供了一个用户友好的界面，方便用户进行训练和部署，并且支持评估功能。

ModelScope

747

阿里云云原生

2024-08-26

670

AI 网关基于 IP 地理位置，增强 Prompt 修饰能力

本⽂对 Prompt 的使用方式进行了简单介绍，让大家了解到 Prompt 对于 LLM 的重要性。并尝试在 Prompt 中结合用户 Geo IP 信息，实现 LLM 的个性化回复，提升问答的准确度。

阿里云云原生

670

计缘

2024-09-02

1653

基于阿里云函数计算（FC）x 云原生 API 网关构建生产级别 LLM Chat 应用方案最佳实践

本文带大家了解一下如何使用阿里云Serverless计算产品函数计算构建生产级别的LLM Chat应用。该最佳实践会指导大家基于开源WebChat组件LobeChat和阿里云函数计算（FC）构建企业生产级别LLM Chat应用。实现同一个WebChat中既可以支持自定义的Agent，也支持基于Ollama部署的开源模型场景。

计缘

1,653

涯海

2025-01-17

687

链路诊断最佳实践：1 分钟定位错慢根因

本文聚焦于线上应用的风险管理，特别是针对“错”（程序运行不符合预期）和“慢”（性能低下或响应迟缓）两大类问题，提出了一个系统化的根因诊断方案。

涯海

687

以珩

2025-04-10

511

用自定义插件生成一篇图文并茂的文章

本文是《5步教你创建大模型自定义插件》的下篇，主要就已有的自定义插件中的生图能力为例，演示如何生成一个图文并茂的文章。

以珩

511

缘祺

2024-05-15

112859

浅析MySQL代价估计器

代价估计是优化其中非常重要的一个步骤，研究代价估计的原理和MySQL的具体实现对做SQL优化是非常有帮助。本文有案例有代码，由浅入深的介绍了代价估计的原理和MySQL的具体实现。

缘祺

112,859

隆基

2024-05-15

108479

深度剖析 RocketMQ 5.0，Apache RocketMQ：如何从互联网时代演进到云时代？

从整体技术架构上学习 RocketMQ 5.0 的云原生架构、一体化架构，最后再分别从业务场景切入，详细介绍 RocketMQ 5.0 在不同的业务场景提供的能力和关键技术原理，包括业务消息、流处理、物联网以及面向云时代的事件驱动场景。

隆基

108,479

隆基

2024-05-15

88944

RocketMQ 流存储解析：面向流场景的关键特性与典型案例

隆基

88,944

官方博客-第22页-阿里云开发者社区

类目筛选

内容类型

LISA微调技术解析：比LoRA更低的显存更快的速度

联合XTuner，魔搭社区全面支持数据集的长文本训练

AI 网关基于 IP 地理位置，增强 Prompt 修饰能力

基于阿里云函数计算（FC）x 云原生 API 网关构建生产级别 LLM Chat 应用方案最佳实践

链路诊断最佳实践：1 分钟定位错慢根因

用自定义插件生成一篇图文并茂的文章

浅析MySQL代价估计器

深度剖析 RocketMQ 5.0，Apache RocketMQ：如何从互联网时代演进到云时代？

RocketMQ 流存储解析：面向流场景的关键特性与典型案例

官方博客-第22页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

LISA微调技术解析：比LoRA更低的显存更快的速度

联合XTuner，魔搭社区全面支持数据集的长文本训练

AI 网关基于 IP 地理位置，增强 Prompt 修饰能力

基于阿里云函数计算（FC）x 云原生 API 网关构建生产级别 LLM Chat 应用方案最佳实践

链路诊断最佳实践：1 分钟定位错慢根因

用自定义插件生成一篇图文并茂的文章

浅析MySQL代价估计器

深度剖析 RocketMQ 5.0，Apache RocketMQ：如何从互联网时代演进到云时代？

RocketMQ 流存储解析：面向流场景的关键特性与典型案例