官方博客-第15页-阿里云开发者社区

阿里云云原生

2025-06-30

534

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

本文介绍了如何使用 llmaz 快速部署基于 vLLM 的大语言模型推理服务，并结合 Higress AI 网关实现流量控制、可观测性、故障转移等能力，构建稳定、高可用的大模型服务平台。

阿里云云原生

534

灵杰开发者

2025-08-08

813

Flink 2.1 SQL：解锁实时数据与AI集成，实现可扩展流处理

简介：本文整理自阿里云高级技术专家李麟在Flink Forward Asia 2025新加坡站的分享，介绍了Flink 2.1 SQL在实时数据处理与AI融合方面的关键进展，包括AI函数集成、Join优化及未来发展方向，助力构建高效实时AI管道。

灵杰开发者

813

吴昆

2024-05-15

222172

Kube Queue：Kubernetes 任务排队的利器

吴昆

222,172

ModelScope

2024-05-15

1321

今天，来自 Qwen1.5 开源家族的新成员，代码专家模型 CodeQwen1.5开源！CodeQwen1.5 基于 Qwen 语言模型初始化，拥有 7B 参数的模型，其拥有 GQA 架构，经过了 ~3T tokens 代码相关的数据进行预训练，共计支持 92 种编程语言、且最长支持 64K 的上下文输入。效果方面，CodeQwen1.5 展现出了优秀的代码生成、长序列建模、代码修改、SQL 能力等,该模型可以大大提高开发人员的工作效率，并在不同的技术环境中简化软件开发工作流程。

ModelScope

1,321

雨鸦

2024-12-27

1737

极简开发，极速上线：构建端到端大模型应用

本文将以一个经典的 RAG（检索增强生成）知识问答系统为例，详细介绍从智能体设计到最终应用部署的全流程。

雨鸦

1,737

正己

2025-01-06

428

OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施

Kubernetes 体系基于 DNS 的服务发现为开发者提供了很大的便利，但其高度复杂的架构往往带来更高的稳定性风险。以 Nacos 为代表的独立服务发现系统架构简单，在 Kubernetes 中选择独立服务发现系统可以帮助增强业务可靠性、可伸缩性、性能及可维护性，对于规模大、增长快、稳定性要求高的业务来说是一个较理想的服务发现方案。希望大家都能找到适合自己业务的服务发现系统。

正己

428

应晖

2025-06-27

552

如何用通义灵码实现文本分析：以《红楼梦》人物出场统计为例

我们将分析一部红楼梦中关键角色出场次数前10位有哪些，并生成一个饼图。

应晖

552

ModelScope

2024-05-15

2039

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

MiniCPM-V 2.0 不仅带来优秀端侧多模态通用能力，更带来惊艳的 OCR 表现。通过自研的高清图像解码技术，可以突破传统困境，让更为精准地识别充满纷繁细节的街景、长图在端侧成为可能。

ModelScope

2,039

阿里云云原生

2025-05-12

1174

如何在通义灵码里使用 MCP 能力

通义灵码支持MCP工具使用，通过模型自主规划实现工具调用，深度集成魔搭MCP广场，涵盖2400+热门服务。提供STDIO和SSE两种通信模式，适用于不同场景需求。用户可通过智能体模式调用MCP工具，完成如网页内容抓取、天气查询等任务。文档详细介绍了服务配置、使用流程及常见问题解决方法，助力开发者高效拓展AI编码能力。

阿里云云原生

1,174

官方博客-第15页-阿里云开发者社区

类目筛选

内容类型

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

Flink 2.1 SQL：解锁实时数据与AI集成，实现可扩展流处理

Kube Queue：Kubernetes 任务排队的利器

快来与 CodeQwen1.5 结对编程

极简开发，极速上线：构建端到端大模型应用

OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施

如何用通义灵码实现文本分析：以《红楼梦》人物出场统计为例

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

如何在通义灵码里使用 MCP 能力

官方博客-第15页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

Flink 2.1 SQL：解锁实时数据与AI集成，实现可扩展流处理

Kube Queue：Kubernetes 任务排队的利器

快来与 CodeQwen1.5 结对编程

极简开发，极速上线：构建端到端大模型应用

OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施

如何用通义灵码实现文本分析：以《红楼梦》人物出场统计为例

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

如何在通义灵码里使用 MCP 能力