官方博客-第11页-阿里云开发者社区

灵杰开发者

2025-08-08

643

Flink 2.1 SQL：解锁实时数据与AI集成，实现可扩展流处理

简介：本文整理自阿里云高级技术专家李麟在Flink Forward Asia 2025新加坡站的分享，介绍了Flink 2.1 SQL在实时数据处理与AI融合方面的关键进展，包括AI函数集成、Join优化及未来发展方向，助力构建高效实时AI管道。

灵杰开发者

643

ModelScope

2024-05-15

1166

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,166

阿里云云原生

2024-05-16

57082

容器内存可观测性新视角：WorkingSet 与 PageCache 监控

本文介绍了 Kubernetes 中的容器工作内存（WorkingSet）概念，它用于表示容器内存的实时使用量，尤其是活跃内存。

阿里云云原生

57,082

赵世振

2024-12-24

1301

探索大型语言模型LLM推理全阶段的JSON格式输出限制方法

本篇文章详细讨论了如何确保大型语言模型（LLMs）输出结构化的JSON格式，这对于提高数据处理的自动化程度和系统的互操作性至关重要。

赵世振

1,301

阿里云云原生

2025-05-06

1326

MCP 规范新版本特性全景解析与落地实践

MCP Specification 在 2025-03-26 发布了最新的版本，本文对主要的改动进行详细介绍和解释

阿里云云原生

1,326

资源编排ROS

2024-05-15

1723

大模型不知不觉已经火了快一年了，拥有一个能够随时对话使用的大模型已经成为不少人的刚需。然而，最大的问题可能是如何访问和调用对话模型。如果，我是说如果，能在您的即时通讯软件钉钉中直接与通义千问对话，是不是会让这一切更方便快捷？！按照传统方案，我们要实现上述场景可能需要非常繁琐的接入步骤，甚至还需要自行开发很多代码，这样的准入门槛实在，太！高！啦！而今天，我要向各位隆重介绍一个新的解决方案——阿里云计算巢AppFlow应用与数据集成平台，无需任何代码开发，简单快捷，自动连接企业内部应用与外部应用或数据，搭建企业的自动化服务流程，帮助个人、企业降低了集成实施的周期和成本。

资源编排ROS

1,723

ModelScope

2024-05-15

1223

元象大模型开源30款量化版本加速低成本部署丨附教程

元象大模型一次性发布30款量化版本，全开源，无条件免费商用。

ModelScope

1,223

阿里云云原生

2025-06-03

1096

实现企业级 MCP 服务统一管理和智能检索的实践

本文将深入剖析 MCP Server 的五种主流架构模式，并结合 Nacos 服务治理框架，为企业级 MCP 部署提供实用指南。

阿里云云原生

1,096

ModelScope

2024-05-15

2604

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

本期文章，我们将向大家展示如何使用AgentScope中构建和使用具有RAG功能的智能体，创造AgentScope助手群，为大家解答和AgentScope相关的问题。

ModelScope

2,604

官方博客-第11页-阿里云开发者社区

类目筛选

内容类型

Flink 2.1 SQL：解锁实时数据与AI集成，实现可扩展流处理

vLLM部署Yuan2.0：高吞吐、更便捷

容器内存可观测性新视角：WorkingSet 与 PageCache 监控

探索大型语言模型LLM推理全阶段的JSON格式输出限制方法

MCP 规范新版本特性全景解析与落地实践

简单几步，钉钉机器人秒变通义千问对话机器人

元象大模型开源30款量化版本加速低成本部署丨附教程

实现企业级 MCP 服务统一管理和智能检索的实践

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

官方博客-第11页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

Flink 2.1 SQL：解锁实时数据与AI集成，实现可扩展流处理

vLLM部署Yuan2.0：高吞吐、更便捷

容器内存可观测性新视角：WorkingSet 与 PageCache 监控

探索大型语言模型LLM推理全阶段的JSON格式输出限制方法

MCP 规范新版本特性全景解析与落地实践

简单几步，钉钉机器人秒变通义千问对话机器人

元象大模型开源30款量化版本 加速低成本部署丨附教程

实现企业级 MCP 服务统一管理和智能检索的实践

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

元象大模型开源30款量化版本加速低成本部署丨附教程