官方博客-第20页-阿里云开发者社区

郑嘉扬何杉

2024-05-15

59017

享道出行：容器弹性技术驱动下的智慧出行稳定性实践

享道出行利用阿里云容器服务ACK，结合AHPA智能弹性与ECS、ECI混合部署，解决了业务潮汐效应带来的弹性滞后和成本问题。

郑嘉扬何杉

59,017

ModelScope

2024-05-15

717

联合XTuner，魔搭社区全面支持数据集的长文本训练

XTuner和魔搭社区（SWIFT）合作引入了一项长序列文本训练技术，该技术能够在多GPU环境中将长序列文本数据分割并分配给不同GPU，从而减少每个GPU上的显存占用。通过这种方式，训练超大规模模型时可以处理更长的序列，提高训练效率。魔搭社区的SWIFT框架已经集成了这一技术，支持多种大模型和数据集的训练。此外，SWIFT还提供了一个用户友好的界面，方便用户进行训练和部署，并且支持评估功能。

ModelScope

717

澄潭董艺荃

2024-05-16

88526

通义千问 2.5 “客串” ChatGPT4，看这篇让你分清楚

这篇文章介绍了使用开源工具NextChat和Higress搭建的一个模拟ChatGPT和通义千问对话PK的测试场景。

澄潭董艺荃

88,526

在峰

2024-06-24

56439

解锁分布式云多集群统一监控的云上最佳实践

为应对分布式云多集群监控的挑战，阿里云可观测监控 Prometheus 版结合 ACK One，凭借高效纳管与全局监控方案有效破解了用户在该场景的监控运维痛点，为日益增长的业务需求提供了一站式、高效、统一的监控解决方案，实现成本与运维效率的双重优化。助力企业的数字化转型与业务快速增长，在复杂多变的云原生时代中航行，提供了一个强有力的罗盘与风帆。

在峰

56,439

阿里云实时数仓Hologres

2024-07-23

25212

分析性能提升40%，阿里云Hologres流量场景最佳实践

阿里云实时数仓Hologres

25,212

一默

2024-08-26

290

打破传统叙事逻辑，构建基于原子化任务的人机交互

在复杂中后台设计中，为解决配置变更影响多场景问题，提出结合正向和逆向信息架构，采用原子化任务，动态组合任务，降低用户和开发成本，优化体验并改变已有的产品迭代和人机交互模式。未来可能发展为AI自动根据业务规则和用户行为生成最佳方案。

一默

290

才胜南也

2024-09-05

963

RAG效果优化：高质量文档解析详解

本文关于如何将非结构化数据（如PDF和Word文档）转换为结构化数据，以便于RAG（Retrieval-Augmented Generation）系统使用。

才胜南也

963

赵世振

2024-12-25

2041

通义视觉推理大模型QVQ-72B-preview重磅上线

Qwen团队推出了新成员QVQ-72B-preview，这是一个专注于提升视觉推理能力的实验性研究模型。提升了视觉表示的效率和准确性。它在多模态评测集如MMMU、MathVista和MathVision上表现出色，尤其在数学推理任务中取得了显著进步。尽管如此，该模型仍存在一些局限性，仍在学习和完善中。

赵世振

2,041

亦达

2025-02-20

695

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

695

官方博客-第20页-阿里云开发者社区

类目筛选

内容类型

享道出行：容器弹性技术驱动下的智慧出行稳定性实践

联合XTuner，魔搭社区全面支持数据集的长文本训练

通义千问 2.5 “客串” ChatGPT4，看这篇让你分清楚

解锁分布式云多集群统一监控的云上最佳实践

分析性能提升40%，阿里云Hologres流量场景最佳实践

打破传统叙事逻辑，构建基于原子化任务的人机交互

RAG效果优化：高质量文档解析详解

通义视觉推理大模型QVQ-72B-preview重磅上线

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

官方博客-第20页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

享道出行：容器弹性技术驱动下的智慧出行稳定性实践

联合XTuner，魔搭社区全面支持数据集的长文本训练

通义千问 2.5 “客串” ChatGPT4，看这篇让你分清楚

解锁分布式云多集群统一监控的云上最佳实践

分析性能提升40%，阿里云Hologres流量场景最佳实践

打破传统叙事逻辑，构建基于原子化任务的人机交互

RAG效果优化：高质量文档解析详解

通义视觉推理大模型QVQ-72B-preview重磅上线

破解 vLLM + DeepSeek 规模化部署的“不可能三角”