官方博客-第24页-阿里云开发者社区

荣阳

2025-02-28

1020

使用A10单卡24G复现DeepSeek R1强化学习过程

本文描述DeepSeek的三个模型的学习过程，其中DeepSeek-R1-Zero模型所涉及的强化学习算法，是DeepSeek最核心的部分之一会重点展示。

荣阳

1,020

阿里云开发者

2025-04-24

1121

为什么一定要做Agent智能体？

作者通过深入分析、理解、归纳，最后解答了“为什么一定要做Agent”这个问题。

阿里云开发者

1,121

阿里云云原生

2025-06-30

405

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

本文介绍了如何使用 llmaz 快速部署基于 vLLM 的大语言模型推理服务，并结合 Higress AI 网关实现流量控制、可观测性、故障转移等能力，构建稳定、高可用的大模型服务平台。

阿里云云原生

405

杨磊

2024-05-15

262753

青团社：亿级灵活用工平台的云原生架构实践

青团社是国内领先的一站式灵活用工招聘服务企业，灵活用工行业的 Top1。青团社于 2013 年在杭州成立，业务已经覆盖全国，在行业深耕 10 年。我的分享将分为以下三部分：青团社架构演进的历程、青团社如何实现云原生、总结与展望。

杨磊

262,753

ModelScope

2024-05-15

921

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

基于单个开源小模型的工具调用Agent，由于模型容量和预训练能力获取的限制，无法在推理和规划、工具调用、回复生成等任务上同时获得比肩大模型等性能。

ModelScope

921

隆基

2024-05-15

91446

深度剖析 RocketMQ 5.0，IoT 消息：物联网需要什么样的消息技术？

本文来学习一个典型的物联网技术架构，以及在这个技术架构里面，消息队列所发挥的作用。在物联网的场景里面，对消息技术的要求和面向服务端应用的消息技术有什么区别？学习 RocketMQ 5.0 的子产品 MQTT，是如何解决这些物联网技术难题的。

隆基

91,446

林清山

2024-05-15

112192

RocketMQ 流数据库解析：实现一体化流处理

RocketMQ 5.0 是一款云原生的消息中间件，旨在覆盖更多业务场景。它针对国内企业在数字化转型中面临的多场景消息处理需求，提供了一体化的解决方案。

林清山

112,192

ModelScope

2024-05-15

1127

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,127

探索云世界

2024-05-15

568

统一观测｜Prometheus 监控多云容器集群

容器集群可观测现状随着 Kubernetes（K8s）容器编排工具已经成为事实上行业通用技术底座，容器集群监控经历多种方案实践后，Prometheus 最终成为容器集群监控的事实标准。Promethues 监控服务可有效监控系统层指标、应用层指标、业务层指标等，采集监控指标后进行存储，搭配 Graf...

探索云世界

568

官方博客-第24页-阿里云开发者社区

类目筛选

内容类型

使用A10单卡24G复现DeepSeek R1强化学习过程

为什么一定要做Agent智能体？

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

青团社：亿级灵活用工平台的云原生架构实践

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

深度剖析 RocketMQ 5.0，IoT 消息：物联网需要什么样的消息技术？

RocketMQ 流数据库解析：实现一体化流处理

vLLM部署Yuan2.0：高吞吐、更便捷

统一观测｜Prometheus 监控多云容器集群

官方博客-第24页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

使用A10单卡24G复现DeepSeek R1强化学习过程

为什么一定要做Agent智能体？

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

青团社：亿级灵活用工平台的云原生架构实践

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

深度剖析 RocketMQ 5.0，IoT 消息：物联网需要什么样的消息技术？

RocketMQ 流数据库解析：实现一体化流处理

vLLM部署Yuan2.0：高吞吐、更便捷

统一观测｜Prometheus 监控多云容器集群