官方博客-第13页-阿里云开发者社区

阿里云实时计算Flink

2023-04-13

1256

海量数据实时分析引擎 Apache Flink

当系统出现大量或者重大的错误却不被人感知，将会对业务产生影响，从而导致资产损失。当竞争对手实施了新战术，却无法及时感知，跟不上竞争对手的节奏，总是追着对方尾巴走。当要做决策的时候，海量的业务数据增长却无法实时看到聚合结果，决策总是凭借过往经验或者过时的数据分析之上。

阿里云实时计算Flink

1,256

德灵

2024-05-15

118073

阿里云PAI大模型RAG对话系统最佳实践

本文为大模型RAG对话系统最佳实践，旨在指引AI开发人员如何有效地结合LLM大语言模型的推理能力和外部知识库检索增强技术，从而显著提升对话系统的性能，使其能更加灵活地返回用户查询的内容。适用于问答、摘要生成和其他依赖外部知识的自然语言处理任务。通过该实践，您可以掌握构建一个大模型RAG对话系统的完整开发链路。

德灵

118,073

阿里云云原生

2024-05-15

79784

让研发规范管得住，在流水线之上做研发流程

研发规范的目标，是为了解决或降低出现软件危机的风险。但传统流水线受限于工具的定位，无法解决研发规范的落地问题，需要在更高的层面来解决。阿里云云效团队经过内部启发后推出的新产品：云效应用交付平台 AppStack 给出了解决方案，快来使用体验吧！

阿里云云原生

79,784

ModelScope

2024-05-15

1141

LISA微调技术解析：比LoRA更低的显存更快的速度

LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写，由UIUC联合LMFlow团队于近期提出的一项LLM微调技术，可实现把全参训练的显存使用降低到之前的三分之一左右，而使用的技术方法却是非常简单。

ModelScope

1,141

龙蜥社区OpenAnolis

2024-11-06

760

云+AI时代下，Alibaba Cloud Linux 进一步演进思考

用好开源、做深开源、自研创新，打造全方位安全可信的服务器操作系统。

龙蜥社区OpenAnolis

760

阿里云云原生

2025-01-08

351

GitLab 国际站中国大陆等地区停服，如何将数据快速迁移到云效

对于正在使用 GitLab 国际站托管代码的企业和研发团队，除迁移至极狐 GitLab 外，国内其他主流的 DevOps 平台也具有完备的产品能力，为开发者提供了更多的选择。其中，阿里云云效也提供了针对常见代码托管平台如 GitHub、GitLab 简单便捷的迁移方案，帮助用户快速完成核心代码数据的迁移，确保代码资产安全。

阿里云云原生

351

新念

2025-02-14

1444

DeepSeek-V3 高效训练关键技术分析

本文从模型架构、并行策略、通信优化和显存优化四个方面展开，深入分析了DeepSeek-V3高效训练的关键技术，探讨其如何以仅5%的算力实现对标GPT-4o的性能。

新念

1,444

亦达

2025-02-20

729

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

729

望雲十雨言澈

2025-04-10

568

AI Infra之模型显存管理分析

本文围绕某线上客户部署DeepSeek-R1满血版模型时进行多次压测后，发现显存占用一直上升，从未下降的现象，记录了排查过程。

望雲十雨言澈等

568

官方博客-第13页-阿里云开发者社区

类目筛选

内容类型

海量数据实时分析引擎 Apache Flink

阿里云PAI大模型RAG对话系统最佳实践

让研发规范管得住，在流水线之上做研发流程

LISA微调技术解析：比LoRA更低的显存更快的速度

云+AI时代下，Alibaba Cloud Linux 进一步演进思考

GitLab 国际站中国大陆等地区停服，如何将数据快速迁移到云效

DeepSeek-V3 高效训练关键技术分析

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

AI Infra之模型显存管理分析

官方博客-第13页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

海量数据实时分析引擎 Apache Flink

阿里云PAI大模型RAG对话系统最佳实践

让研发规范管得住，在流水线之上做研发流程

LISA微调技术解析：比LoRA更低的显存更快的速度

云+AI时代下，Alibaba Cloud Linux 进一步演进思考

GitLab 国际站中国大陆等地区停服，如何将数据快速迁移到云效

DeepSeek-V3 高效训练关键技术分析

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

AI Infra之模型显存管理分析