官方博客-第15页-阿里云开发者社区

阿里云云原生

2025-06-30

533

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

本文介绍了如何使用 llmaz 快速部署基于 vLLM 的大语言模型推理服务，并结合 Higress AI 网关实现流量控制、可观测性、故障转移等能力，构建稳定、高可用的大模型服务平台。

阿里云云原生

533

灵杰开发者

2025-08-08

812

Flink 2.1 SQL：解锁实时数据与AI集成，实现可扩展流处理

简介：本文整理自阿里云高级技术专家李麟在Flink Forward Asia 2025新加坡站的分享，介绍了Flink 2.1 SQL在实时数据处理与AI融合方面的关键进展，包括AI函数集成、Join优化及未来发展方向，助力构建高效实时AI管道。

灵杰开发者

812

ModelScope

2024-05-15

1320

快来与 CodeQwen1.5 结对编程

今天，来自 Qwen1.5 开源家族的新成员，代码专家模型 CodeQwen1.5开源！CodeQwen1.5 基于 Qwen 语言模型初始化，拥有 7B 参数的模型，其拥有 GQA 架构，经过了 ~3T tokens 代码相关的数据进行预训练，共计支持 92 种编程语言、且最长支持 64K 的上下文输入。效果方面，CodeQwen1.5 展现出了优秀的代码生成、长序列建模、代码修改、SQL 能力等,该模型可以大大提高开发人员的工作效率，并在不同的技术环境中简化软件开发工作流程。

ModelScope

1,320

阿里云大数据Al技术

2024-07-31

7572

OSS数据源一站式RAG最佳实践

本文介绍了如何使用OpenSearch LLM智能问答版通过OSS数据源一站式构建RAG系统。

阿里云大数据Al技术

7,572

阿里云云原生

2024-12-04

784

不写一行代码，通义灵码 5 分钟“手撕”年会抽奖程序

年会中的抽奖环节不可或缺，但每年为了选择合适的抽奖小程序，团队往往需要投入大量时间和精力。然而，抽奖结束后，参与者通常只记得自己是否中奖，其他细节多被遗忘。在 AI 技术日益成熟的今天，如何打造一个既高效又有技术含量的抽奖应用呢？今天，就让我们跟随通义灵码，仅用 5 分钟现场手撕一个抽奖应用吧！

阿里云云原生

784

正己

2025-01-06

428

OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施

Kubernetes 体系基于 DNS 的服务发现为开发者提供了很大的便利，但其高度复杂的架构往往带来更高的稳定性风险。以 Nacos 为代表的独立服务发现系统架构简单，在 Kubernetes 中选择独立服务发现系统可以帮助增强业务可靠性、可伸缩性、性能及可维护性，对于规模大、增长快、稳定性要求高的业务来说是一个较理想的服务发现方案。希望大家都能找到适合自己业务的服务发现系统。

正己

428

叶枫

2025-02-06

604

详解智能编码在前端研发的创新应用

接下来，人与智能体的交互将变得更为紧密，比如 N 年以后是否可以逐渐过渡。这个逐渐过渡的过程实际上是温和的，从依赖人类到依赖超大规模算力的转变，可能会取代我们的一些职责。这不仅仅是简单的叠加关系。对于AI和超大规模算力，这是否意味着我们可以大幅度提升软件质量，是否可以缩短研发周期并提高效率，还有创造出更优质的软件并持续发展，这无疑是肯定的。

叶枫

604

阿里云云原生

2025-05-12

1174

如何在通义灵码里使用 MCP 能力

通义灵码支持MCP工具使用，通过模型自主规划实现工具调用，深度集成魔搭MCP广场，涵盖2400+热门服务。提供STDIO和SSE两种通信模式，适用于不同场景需求。用户可通过智能体模式调用MCP工具，完成如网页内容抓取、天气查询等任务。文档详细介绍了服务配置、使用流程及常见问题解决方法，助力开发者高效拓展AI编码能力。

阿里云云原生

1,174

阿里云云原生

2025-08-26

621

云速搭 AI 助理发布：对话式生成可部署的阿里云架构图

阿里云云速搭 CADT（Cloud Architect Design Tools）推出智能化升级——云小搭，一款基于大模型的 AI 云架构助手，致力于让每一位用户都能“动动嘴”就完成专业级云架构设计。

阿里云云原生

621

官方博客-第15页-阿里云开发者社区

类目筛选

内容类型

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

Flink 2.1 SQL：解锁实时数据与AI集成，实现可扩展流处理

快来与 CodeQwen1.5 结对编程

OSS数据源一站式RAG最佳实践

不写一行代码，通义灵码 5 分钟“手撕”年会抽奖程序

OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施

详解智能编码在前端研发的创新应用

如何在通义灵码里使用 MCP 能力

云速搭 AI 助理发布：对话式生成可部署的阿里云架构图

官方博客-第15页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

Flink 2.1 SQL：解锁实时数据与AI集成，实现可扩展流处理

快来与 CodeQwen1.5 结对编程

OSS数据源一站式RAG最佳实践

不写一行代码，通义灵码 5 分钟“手撕”年会抽奖程序

OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施

详解智能编码在前端研发的创新应用

如何在通义灵码里使用 MCP 能力

云速搭 AI 助理发布：对话式生成可部署的阿里云架构图