官方博客-第25页-阿里云开发者社区

ModelScope

2024-05-15

1205

LISA微调技术解析：比LoRA更低的显存更快的速度

LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写，由UIUC联合LMFlow团队于近期提出的一项LLM微调技术，可实现把全参训练的显存使用降低到之前的三分之一左右，而使用的技术方法却是非常简单。

ModelScope

1,205

陈浩章颖强

2024-05-29

55775

ICDE’24｜中国企业首获最佳论文，详解PolarDB Serverless如何在0.5秒内实现跨机迁移

PolarDB Serverless如何在0.5秒内实现跨机迁移？

陈浩章颖强

55,775

阿里云云原生

2024-09-14

734

通义灵码获得国产 AI 编码工具最高成绩丨阿里云云原生 8 月产品月报

阿里云云原生 8 月产品月报。

阿里云云原生

734

阿里云云原生

2024-10-18

1046

海量大模型如何一键部署上云，函数计算 x ModelScope 社区给出答案

得益于阿里云函数计算的产品能力，魔搭 SwingDeploy 后的模型推理 API 服务默认具备极致弹性伸缩（缩零能力）、GPU 虚拟化（最小 1GB 显存粒度）、异步调用能力、按用付费、闲置计费等能力，这些能力帮助算法工程师大大加快了魔搭开源模型投入生产的生命周期。

阿里云云原生

1,046

明巍临城水德

2024-11-14

601

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理

在本文中，作者介绍了 Lingma SWE-GPT，一款专为解决复杂软件改进任务设计的开源大型语言模型系列。

明巍临城水德等

601

朱云锋

2025-01-20

624

聊一聊日志背后的抽象

本文从思考日志的本质开始，一览业界对日志使用的最佳实践，然后尝试给出分布式存储场景下对日志模块的需求抽象，最后是技术探索路上个人的一点点感悟。

朱云锋

624

功路

2025-01-23

717

MySQL索引学习笔记

本文深入探讨了MySQL数据库中慢查询分析的关键概念和技术手段。

功路

717

亦达

2025-02-20

800

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

800

凡玺

2024-05-15

121986

Ganos实时热力聚合查询能力解析与最佳实践

本文主要介绍Ganos实时热力聚合查询并动态输出热力瓦片能力，依托阿里云PolarDB PostgreSQL产品、ADB PostgreSQL和RDS PostgreSQL 三款数据库建设输出。

凡玺

121,986

官方博客-第25页-阿里云开发者社区

类目筛选

内容类型

LISA微调技术解析：比LoRA更低的显存更快的速度

ICDE’24｜中国企业首获最佳论文，详解PolarDB Serverless如何在0.5秒内实现跨机迁移

通义灵码获得国产 AI 编码工具最高成绩丨阿里云云原生 8 月产品月报

海量大模型如何一键部署上云，函数计算 x ModelScope 社区给出答案

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理

聊一聊日志背后的抽象

MySQL索引学习笔记

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

Ganos实时热力聚合查询能力解析与最佳实践

官方博客-第25页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

LISA微调技术解析：比LoRA更低的显存更快的速度

ICDE’24｜中国企业首获最佳论文，详解PolarDB Serverless如何在0.5秒内实现跨机迁移

通义灵码获得国产 AI 编码工具最高成绩丨阿里云云原生 8 月产品月报

海量大模型如何一键部署上云，函数计算 x ModelScope 社区给出答案

通义灵码 SWE-GPT：从 静态代码建模 迈向 软件开发过程长链推理

聊一聊日志背后的抽象

MySQL索引学习笔记

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

Ganos实时热力聚合查询能力解析与最佳实践

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理