官方博客-第21页-阿里云开发者社区

望宸

2025-02-20

684

大模型推理服务全景图

推理性能的提升涉及底层硬件、模型层，以及其他各个软件中间件层的相互协同，因此了解大模型技术架构的全局视角，有助于我们对推理性能的优化方案进行评估和选型。

望宸

684

亦达

2025-02-20

748

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

748

柯灵

2025-03-11

1603

QwQ-32B一键部署，真正的0代码，0脚本，0门槛

阿里云发布的QwQ-32B模型通过强化学习显著提升了推理能力，核心指标达到DeepSeek-R1满血版水平。用户可通过阿里云系统运维管理（OOS）一键部署OpenWebUI+Ollama方案，轻松将QwQ-32B模型部署到ECS，或连接阿里云百炼的在线模型。整个过程无需编写代码，全部在控制台完成，适合新手操作。

柯灵

1,603

丕天

2025-03-21

1175

AI 推理场景的痛点和解决方案

一个典型的推理场景面临的问题可以概括为限流、负载均衡、异步化、数据管理、索引增强 5 个场景。通过云数据库 Tair 丰富的数据结构可以支撑这些场景，解决相关问题，本文我们会针对每个场景逐一说明。

丕天

1,175

望宸魁宇

2025-04-07

442

IngressNightmare：Ingress Nginx 再曝5个安全漏洞，可接管你的 K8s 集群

是否还记得 2022 年 K8s Ingress Nginx 披露了的 3 个高危安全漏洞（CVE-2021-25745, CVE-2021-25746, CVE-2021-25748），并在那一年宣布停止接收新功能 PR，专注修复并提升稳定性。

望宸魁宇

442

阿里云云原生

2025-05-14

711

阿里云 SLS 多云日志接入最佳实践：链路、成本与高可用性优化

本文探讨了如何高效、经济且可靠地将海外应用与基础设施日志统一采集至阿里云日志服务(SLS)，解决全球化业务扩展中的关键挑战。重点介绍了高性能日志采集Agent（iLogtail/LoongCollector）在海外场景的应用，推荐使用LoongCollector以获得更优的稳定性和网络容错能力。同时分析了多种网络接入方案，包括公网直连、全球加速优化、阿里云内网及专线/CEN/VPN接入等，并提供了成本优化策略和多目标发送配置指导，帮助企业构建稳定、低成本、高可用的全球日志系统。

阿里云云原生

711

闵子

2023-12-01

2905

从浏览器原理出发聊聊Chrome插件

本文从浏览器架构演进、插件运行机制、插件基本介绍和一些常见的插件实现思路几个方向聊聊Chrome插件。

闵子

2,905

如葑

2024-05-15

659

统一观测丨使用 Prometheus 监控云原生网关，我们该关注哪些指标？

MSE 云原生网关默认提供了丰富的 Metrics 指标大盘，配合阿里云 Prometheus 监控提供开箱即用的完整可观测性能力，能够帮助用户快捷、高效的搭建自身的微服务网关与对应的可观测体系。

如葑

659

ModelScope

2024-05-15

767

联合XTuner，魔搭社区全面支持数据集的长文本训练

XTuner和魔搭社区（SWIFT）合作引入了一项长序列文本训练技术，该技术能够在多GPU环境中将长序列文本数据分割并分配给不同GPU，从而减少每个GPU上的显存占用。通过这种方式，训练超大规模模型时可以处理更长的序列，提高训练效率。魔搭社区的SWIFT框架已经集成了这一技术，支持多种大模型和数据集的训练。此外，SWIFT还提供了一个用户友好的界面，方便用户进行训练和部署，并且支持评估功能。

ModelScope

767

官方博客-第21页-阿里云开发者社区

类目筛选

内容类型

大模型推理服务全景图

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

QwQ-32B一键部署，真正的0代码，0脚本，0门槛

AI 推理场景的痛点和解决方案

IngressNightmare：Ingress Nginx 再曝5个安全漏洞，可接管你的 K8s 集群

阿里云 SLS 多云日志接入最佳实践：链路、成本与高可用性优化

从浏览器原理出发聊聊Chrome插件

统一观测丨使用 Prometheus 监控云原生网关，我们该关注哪些指标？

联合XTuner，魔搭社区全面支持数据集的长文本训练

官方博客-第21页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大模型推理服务全景图

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

QwQ-32B一键部署，真正的0代码，0脚本，0门槛

AI 推理场景的痛点和解决方案

IngressNightmare：Ingress Nginx 再曝5个安全漏洞，可接管你的 K8s 集群

阿里云 SLS 多云日志接入最佳实践：链路、成本与高可用性优化

从浏览器原理出发聊聊Chrome插件

统一观测丨使用 Prometheus 监控云原生网关，我们该关注哪些指标？

联合XTuner，魔搭社区全面支持数据集的长文本训练