官方博客-第25页-阿里云开发者社区

ModelScope

2024-05-15

1898

Multi-Agent实践第7期：智能体的高效协作

教程第7期

ModelScope

1,898

ModelScope

2024-05-15

770

联合XTuner，魔搭社区全面支持数据集的长文本训练

XTuner和魔搭社区（SWIFT）合作引入了一项长序列文本训练技术，该技术能够在多GPU环境中将长序列文本数据分割并分配给不同GPU，从而减少每个GPU上的显存占用。通过这种方式，训练超大规模模型时可以处理更长的序列，提高训练效率。魔搭社区的SWIFT框架已经集成了这一技术，支持多种大模型和数据集的训练。此外，SWIFT还提供了一个用户友好的界面，方便用户进行训练和部署，并且支持评估功能。

ModelScope

770

剑洁雲尧

2024-09-04

650

浅谈Elasticsearch的入门与实践

本文主要围绕ES核心特性：分布式存储特性和分析检索能力，介绍了概念、原理与实践案例，希望让读者快速理解ES的核心特性与应用场景。

剑洁雲尧

650

寒空横槊娜米公仪等

2024-12-26

452

道旅科技借助云消息队列 Kafka 版加速旅游大数据创新发展

阿里云云消息队列 Kafka 版 Serverless 系列凭借其卓越的弹性能力，为道旅科技提供了灵活高效的数据流处理解决方案。无论是应对突发流量还是规划长期资源需求，该方案均能帮助企业实现资源动态调整和成本优化，同时保障业务的高可用性和连续性。

寒空横槊娜米公仪等

452

阿里云云原生

2025-01-07

296

Envoy 开启 HTTP2 后偶现 404 解决方法

在大部分基于 Envoy 实现的网关里，都存在这样一个问题，当开启 http2 时，客户端访问会出现偶发的 404，并且可以从日志注意到这些 404 的请求，:authority 头里的域名和 SNI 里的域名不一致。且在使用泛域名证书，且配置了多个域名的路由的情况下，这个问题特别容易出现。

阿里云云原生

296

片风

2025-01-14

539

政采云业务网关实践：使用 Higress 统一替代 APISIX/Kong/Istio Ingress

政采云基础架构团队技术专家朱海峰介绍了业务网关项目的背景和解决方案。

片风

539

亦达

2025-02-20

751

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

751

橙唯

2025-02-21

928

基于LLM打造沉浸式3D世界

阿里云数据可视化产品DataV团队一直在三维交互领域进行前沿探索，为了解决LLMs与3D结合的问题，近期在虚幻引擎内结合通义千问大模型家族打造了一套基于LLM的实时可交互3D世界方案，通过自然语言来与引擎内的3D世界进行交互。

橙唯

928

望雲十雨言澈

2025-04-10

587

AI Infra之模型显存管理分析

本文围绕某线上客户部署DeepSeek-R1满血版模型时进行多次压测后，发现显存占用一直上升，从未下降的现象，记录了排查过程。

望雲十雨言澈等

587

官方博客-第25页-阿里云开发者社区

类目筛选

内容类型

Multi-Agent实践第7期：智能体的高效协作

联合XTuner，魔搭社区全面支持数据集的长文本训练

浅谈Elasticsearch的入门与实践

道旅科技借助云消息队列 Kafka 版加速旅游大数据创新发展

Envoy 开启 HTTP2 后偶现 404 解决方法

政采云业务网关实践：使用 Higress 统一替代 APISIX/Kong/Istio Ingress

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

基于LLM打造沉浸式3D世界

AI Infra之模型显存管理分析

官方博客-第25页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

Multi-Agent实践第7期：智能体的高效协作

联合XTuner，魔搭社区全面支持数据集的长文本训练

浅谈Elasticsearch的入门与实践

道旅科技借助云消息队列 Kafka 版加速旅游大数据创新发展

Envoy 开启 HTTP2 后偶现 404 解决方法

政采云业务网关实践：使用 Higress 统一替代 APISIX/Kong/Istio Ingress

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

基于LLM打造沉浸式3D世界

AI Infra之模型显存管理分析