进阶版|企业级 AI Agent 的构建实践

我们将构建 AI 应用扩展到了运行时和可观测,并尝试将 Agent、LLM、MCP 服务这几者之间如何有机协作尽量清晰化,未来还会扩展到Memory、LiteMQ 等更完整的技术栈,旨在帮助大家厘清完整的企业级 AI 应用构建的最佳实践。

28 0
来自: 微服务  版块

不增加 GPU,首 Token 延迟下降50%|LLM 服务负载均衡的新实践

针对LLM服务的特点,Higress AI网关以插件形式提供了面向LLM服务的负载均衡算法,包括全局最小请求数负载均衡、前缀匹配负载均衡以及GPU感知负载均衡,能够在不增加硬件成本的前提下,提升系统的吞吐能力、降低响应延迟,并实现更公平、高效的任务调度。

15 0
来自: 微服务  版块

送票!2025云栖大会9月24-26日杭州见

2025杭州·云栖大会,来了!

20 0

Function AI 助力用户自主开发 MCP 服务,一键上云高效部署

在 AI 与云原生融合的趋势下,开发者面临模型协同与云端扩展的挑战。MCP(模型上下文协议)提供统一的交互规范,简化模型集成与服务开发。Function AI 支持 MCP 代码一键上云,提供绑定代码仓库、OSS 上传、本地交付物部署及镜像部署等多种构建方式,助力开发者高效部署智能服务,实现快速迭代与云端协同。

31 0

JSON 日志分析的“正确姿势”:阿里云 SLS 高效实践指南

JSON 日志因灵活易扩展而广泛应用,但其海量数据也带来分析挑战。本文系统介绍阿里云日志服务(SLS)中处理 JSON 日志的最佳实践,涵盖数据预处理、索引配置、JSON 函数使用及 SQL 智能生成,助你高效挖掘日志价值。

34 0

阿里云可观测 2025 年 7 月产品动态

阿里云可观测 2025 年 7 月产品动态

24 0

最新技术栈驱动的 Java 绿色计算与性能优化实操指南涵盖内存优化与能效提升实战技巧

本文介绍了基于Java 24+技术栈的绿色计算与性能优化实操指南。主要内容包括:1)JVM调优,如分代ZGC配置和结构化并发优化;2)代码级优化,包括向量API加速数据处理和零拷贝I/O;3)容器化环境优化,如K8s资源匹配和节能模式配置;4)监控分析工具使用。通过实践表明,这些优化能显著提升性能(响应时间降低40-60%)同时降低资源消耗(内存减少30-50%,CPU降低20-40%)和能耗(服务器功耗减少15-35%)。建议采用渐进式优化策略。

23 0

AI Agent 运行时相比传统应用有什么不同:百家企业 AI 实践观察(二)

本文深入探讨了AI Agent运行时的核心挑战及解决方案,分析了AI Agent从理论走向实践过程中所面临的动态推理、资源成本与安全风险等问题,并详细介绍了阿里云函数计算FC如何作为AI Agent运行时及沙箱环境(Sandbox),有效应对脉冲式计算需求、突发性负载、数据隔离与会话亲和性等挑战。同时,文章结合典型场景,展示了函数计算FC在编码式与流程式AI Agent构建中的优势,涵盖Chat AI Agent、营销素材组装、仿真训练等应用,为AI Agent的高效、安全运行提供了完整的技术路径。

68 0

如何实现 AI Agent 自主发现和使用 MCP 服务 —— Nacos MCP Router 部署最佳实践

Nacos社区推出MCP Router与MCP Registry开源解决方案,助力AI Agent高效调用外部工具。Router可智能筛选匹配的MCP Server,减少Token消耗,提升安全性与部署效率。结合Nacos Registry实现服务自动发现与管理,简化AI Agent集成复杂度。支持协议转换与容器化部署,保障服务隔离与数据安全。提供智能路由与代理模式,优化工具调用性能,助力MCP生态普及。

123 0
|
3天前
|

【Azure Cloud Service】Azure云服务实例遇见:[0x80070070] Role could not be started

在 Azure 云服务中,某实例因磁盘空间不足(错误代码 0x80070070)无法启动,持续处于 Starting 与 Aborted 状态循环。通过 RDP 登录实例可确认磁盘 C 空间已满。建议使用 WinDirStat 工具分析并清理磁盘,尤其是日志文件夹 C:\Logs\ 及相关诊断路径,以释放空间解决问题。

25 0

金融级 ZooKeeper 来袭:性能提升100%,SLA 99.99%,数据防护升级

阿里云微服务引擎 MSE ZooKeeper 企业版正式发布,提供比专业版更高的稳定性与安全能力,SLA 达 99.99%,整体服务性能提升 100%。针对关键业务,企业版通过独享资源池实现更高规格配额,满足大规模需求。此外新增数据备份容灾、容量管理反脆弱限流等功能,提升整体企业级特性,助力企业应对复杂业务挑战。

35 0
来自: 微服务  版块

金融级 ZooKeeper 来袭:性能提升100%,SLA 99.99%,数据防护升级

阿里云微服务引擎 MSE ZooKeeper 企业版正式发布,提供比专业版更高的稳定性与安全能力,SLA 达 99.99%,整体性能提升 100%。企业版通过独享资源池实现更高规格配额,满足大规模需求,并新增数据备份容灾、容量管理、反脆弱限流等功能,助力企业应对复杂业务挑战。

66 0

Spring Boot 3.0+ 与 Spring Cloud 最新版本微服务架构搭建教程及技术要点解析

本文介绍了Spring Boot 3.0+与Spring Cloud最新版本的技术方案与应用实例。Spring Boot 3.0提升了Java版本要求,支持GraalVM原生镜像,优化了配置方式;Spring Cloud 2025.0.0增强了网关功能,但需注意与Alibaba组件的兼容性问题。文章详细说明了版本兼容性检查、依赖配置方法,重点讲解了Eureka服务注册与发现机制,以及OpenFeign声明式服务调用的实现步骤,为开发者提供了完整的微服务架构解决方案。通过实际案例展示了如何在项目中整合这些技术

214 0

Java 事件驱动架构设计实战与 Kafka 生态系统组件实操全流程指南

本指南详解Java事件驱动架构与Kafka生态实操,涵盖环境搭建、事件模型定义、生产者与消费者实现、事件测试及高级特性,助你快速构建高可扩展分布式系统。

39 0

最新研发flutter3.32+window_manager客户端OS管理系统

原创Flutter3.32+Dart3.8+Getx+Window_Manager实战桌面客户端os系统解决方案。支持macOS和windows两种主题风格、自定义桌面栅格布局。

100 1

现代化 Java Web 在线商城项目技术方案与实战开发流程及核心功能实现详解

本项目基于Spring Boot 3与Vue 3构建现代化在线商城系统,采用微服务架构,整合Spring Cloud、Redis、MySQL等技术,涵盖用户认证、商品管理、购物车功能,并支持Docker容器化部署与Kubernetes编排。提供完整CI/CD流程,助力高效开发与扩展。

69 0

Java 项目实战数字华容道与石头迷阵游戏开发详解及实战方法

本文介绍了使用Java实现数字华容道和石头迷阵游戏的技术方案与应用实例,涵盖GUI界面设计、二维数组操作、游戏逻辑控制及自动解法算法(如A*),适合Java开发者学习游戏开发技巧。

108 0

【Azure Bot Service】在中国区Azure上部署机器人的 Python 版配置

本文介绍了在中国区Azure上使用Python SDK配置Azure Bot Service时遇到的问题及解决方案,涵盖参数设置与适配器配置,适用于希望在Azure中国区部署Python机器人的开发者。

33 0

书本大纲:从芯片、分布式到云计算AI时代

本文深入探讨并发编程、JVM原理、RPC框架、高并发系统、分布式架构及云原生技术,涵盖内存模型、同步机制、垃圾回收、网络协议、存储优化、弹性伸缩等核心议题,揭示多线程运行逻辑与高并发实现路径,助你掌握现代软件底层原理与工程实践。

51 0

Vibecoding 新体验:实测 Qwen3 Coder 代码生成效果

Qwen3 Coder 是全球领先的开源编程大模型,具备强大的代码生成能力与1M超长上下文支持,适用于构建复杂应用。本文通过实际案例展示其在电商网站开发中的应用,并详解提示词设计、技术拆解与部署方案,探讨Agentic AI落地的挑战与经验。

189 0

Vibecoding 新体验:实测 Qwen3 Coder 代码生成效果

Qwen3 Coder 是一款强大的编程大语言模型,支持超长 1M 上下文,具备卓越的代码生成能力。结合 VibeCoding 方案,可助力开发者与企业快速构建复杂应用,实现自然语言生成系统,提升开发效率与生产力。

129 0
来自: Serverless  版块

书本介绍:技术札纪——有限硬件与无限计算的权衡艺术

本书《技术札纪》深入探讨在有限硬件条件下如何平衡系统性能与弹性的关键技术难题。内容涵盖并发编程本质、JVM调优哲学、高并发防护体系、分布式理论落地及云原生时代的技术演进,帮助开发者构建底层思维,提升系统设计与优化能力,在多变的技术浪潮中把握核心竞争力。

59 0
|
6天前
| |

Python项目配置Dockerfile

该Dockerfile基于阿里云Alinux3的Python 3.11.1镜像构建,使用阿里云PyPI镜像加速依赖安装,部署一个运行于5000端口、时区为上海的Python应用。

49 0

typora最新版解决方法,typora免费下载

Typora是一款简洁高效的Markdown编辑器,支持实时预览、语法高亮、数学公式、图表绘制等功能,适用于写作、编程和技术文档编写。界面极简,功能全面,支持多平台使用。

174 0

阿里云数据传输服务使用场景

阿里云数据传输服务(DTS)的核心优势在于其支持多种数据传输方式(迁移、同步、订阅),能够满足企业在数据库迁移、灾备、实时数仓构建、业务解耦等场景下的需求。无论是优化用户体验、降低使用成本,还是实现跨账号任务授权,DTS均提供了完整的解决方案

51 0

ACK GIE配置建议

Gateway with Inference Extension是基于Kubernetes社区Gateway API及其扩展规范实现的增强型组件,支持四层/七层路由服务,并面向生成式AI推理场景提供负载均衡优化、服务管理简化等能力,适用于AI推理服务的高可用部署与性能优化。在不同的场景使用ACK Gateway with Inference Extension时,可能需要根据业务需求和高可用需要对网关和推理扩展进行不同的配置调整。本文主要介绍在实际业务场景中针对ACK GIE的配置建议,以获得更好的使用效果。

55 0
来自: 容器服务  版块
|
7天前
| |

WebView2 控件(基于 Microsoft Edge (Chromium) 的嵌入式浏览器控件),保存资源(图片、脚本、CSS)

WebView2 控件(基于 Microsoft Edge (Chromium) 的嵌入式浏览器控件),保存资源(图片、脚本、CSS)

110 0
来自: 中间件  版块

五年磨一剑:Agent 时代追风不如造风

Serverless 是当前技术领域最有可能演进为 AI Native Infra 的技术架构,函数计算正着力于打造模块化的 Agent Infra 之剑,助力开发者从“生态应用者”进阶为“能力定义者”,最终推动 AI 技术走向开放共享的创新之路。

99 0
|
7天前
|
API
|

阿里云微服务引擎 MSE 及 API 网关 2025 年 7 月产品动态

阿里云微服务引擎 MSE 及 API 网关 2025 年 7 月产品动态

32 0

专业打造一款圈子源码软件系统 / 后端 PHP 搭建部署一样实现利益化

本教程详解基于PHP后端与Uni-app的小程序开发全流程,涵盖技术选型、环境搭建、源码导入、接口对接及功能实现。采用Laravel/Symfony框架,结合MySQL/PostgreSQL数据库,使用WebSocket实现实时通信,并集成IM SDK实现音视频聊天。前端使用Uni-app开发,支持跨平台运行。教程包含完整部署流程与安全优化方案,助力快速搭建高性能、安全稳定的小程序系统。

63 0

如何从零开始创建AWS账号

本文详细介绍如何从零开始创建AWS账号,涵盖访问官网、选择免费套餐、填写账户信息、设置密码、选择使用场景、输入账单信息、验证电话号码、选择支持计划及最终确认等完整注册流程,适合初学者快速入门。

72 0

阿里云微服务引擎 MSE 及 API 网关 2025 年 7 月产品动态

阿里云微服务引擎 MSE 面向业界主流开源微服务项目, 提供注册配置中心和分布式协调(原生支持 Nacos/ZooKeeper/Eureka )、云原生网关(原生支持Higress/Nginx/Envoy,遵循Ingress标准)、微服务治理(原生支持 Spring Cloud/Dubbo/Sentinel,遵循 OpenSergo 服务治理规范)能力。API 网关 (API Gateway),提供 APl 托管服务,覆盖设计、开发、测试、发布、售卖、运维监测、安全管控、下线等 API 生命周期阶段。帮助您快速构建以 API 为核心的系统架构.满足新技术引入、系统集成、业务中台等诸多场景需要。

52 0
来自: 微服务  版块

LoongCollector:构建智能时代的数据采集新范式

本文聚焦 LoongSuite 生态核心组件 LoongCollector,深度解析 LoongCollector 在智算服务中的技术突破,涵盖多租户观测隔离、GPU 集群性能追踪及事件驱动型数据管道设计,通过零侵入采集、智能预处理与自适应扩缩容机制,构建面向云原生 AI 场景的全栈可观测性基础设施,重新定义高并发、强异构环境下的可观测性能力边界。

93 0

Java 相关知识点总结含基础语法进阶技巧及面试重点知识

本文全面总结了Java核心知识点,涵盖基础语法、面向对象、集合框架、并发编程、网络编程及主流框架如Spring生态、MyBatis等,结合JVM原理与性能优化技巧,并通过一个学生信息管理系统的实战案例,帮助你快速掌握Java开发技能,适合Java学习与面试准备。

48 0
|
9天前
| |

[oeasy]python097_[词根溯源]count_计数_counter_encounter_country

本课程通过词根溯源方式讲解了“count”及相关词汇的含义和用法,包括计数、列表操作、词根演变以及相关单词如counter、account、country等的联系,并结合编程实例介绍了Python中list的count方法及成员函数中self的作用,帮助学习者更好地理解编程与词源之间的逻辑关系。

29 0

使用ASM全局限流实现源IP分别限流

本文介绍了如何在ASM中实现基于源IP的全局限流,防止恶意请求。内容包括前提条件、准备工作、部署步骤及验证方法,帮助用户通过配置限流策略保障业务入口的稳定性与安全性。

44 0
来自: 容器服务  版块

阿里云的国内云与国际云差异

本文对比了阿里云国内云与国际云的核心差异,从用户群体、合规要求、数据安全、延迟等方面提供决策参考,帮助企业根据业务需求选择合适的云服务。

72 1

喜报!阿里云首批通过 Serverless 云服务能力要求 - 消息队列评估

2025可信云大会发布Serverless云服务能力评估结果,阿里云作为首批入选单位,凭借ApsaraMQ for RocketMQ和Kafka展现出卓越能力。ApsaraMQ全系产品已完成Serverless化升级,具备全场景覆盖、低成本、高稳定、高效率及生态集成优势,广泛应用于电商、游戏、出行、旅游等多个行业,助力企业实现降本增效。未来将持续推动高弹性、智能化、免运维的消息服务创新。

50 0

Higress 入选《AI Cloud 大模型推理与交互典型案例》

Higress 入选《AI Cloud 大模型推理与交互典型案例》

26 0

全球首个搭载Kimi-K2&Qwen3-Coder的Serverless架构VibeCoding解决方案重磅来袭!

Kimi-K2模型近期表现抢眼,编程能力尤为突出,成功挑战了DeepSeek的开源模型榜首地位。其代码生成效果惊艳,配合Qwen3-Coder,展现强大开发潜力。本文介绍基于Serverless架构的VibeCoding方案,依托Function AI,实现从创意到上线的完整编码智能体解决方案,适用于个人、泛开发者及企业用户。方案支持普通与专家两种模式,AI可自主开发小游戏并构建游戏平台,具备数据库交互、多智能体协作、自动化部署等能力。部署简便,访问阿里云Function AI控制台即可快速搭建。

83 0
来自: Serverless  版块
|
10天前
| |

linux自动崩溃,模拟测试

该脚本创建一个 systemd 服务和定时器,在系统启动3分钟后触发崩溃。通过向 /proc/sysrq-trigger 写入 "c" 来实现内核崩溃,用于测试系统崩溃后的恢复机制。

33 0

企业AI落地实践(三):使用 AI 网关解决 AI Agent 与 LLM 的交互挑战

无论是编码方式构建 AI Agent,还是可视化流程式构建 AI Agent,一旦脱离了 LLM,就不存在 AI 一说了。所以 AI Agent 如何合理地、生产级地与 LLM 结合,将是我们今天文章的核心内容。

214 0

阿里云可观测 2025 年 6 月产品动态

阿里云可观测 2025 年 6 月产品动态

44 0
来自: 云原生可观测  版块

Apache RocketMQ for AI 战略升级,开启 AI MQ 新时代

Apache RocketMQ 顺应AIGC浪潮,针对长时会话、稀缺算力调度及AI Agent协作等挑战,推出专为AI时代打造的消息引擎。通过“会话即主题”的Lite-Topic机制,实现百万级队列动态管理,保障会话连续性与断点续传;结合智能资源调度能力,如定速消费与优先级队列,提升算力利用率与服务公平性;同时构建高效异步通信枢纽,支撑Agent-to-Agent及AI工作流的非阻塞协同。已在阿里集团与阿里云多个AI产品中大规模验证,助力开发者构建稳定、高效、可扩展的AI应用基础设施。

123 0

云原生 API 网关 x OKG:游戏连接治理的「最后一公里」

本文介绍了云原生技术在游戏连接治理中的应用,重点探讨了如何通过 OpenKruiseGame(OKG)与云原生 API 网关的结合,实现游戏服务的优雅下线与无感配置变更。文章分析了游戏服务的强状态特性所带来的挑战,并提出了基于状态感知与连接管理的解决方案,保障玩家会话的连续性与体验的稳定性。同时,还介绍了如何通过零改造接入、全栈可观测性与简化的 API 治理,缩短游戏服务云原生化的“最后一公里”。

45 0

Window 部署 coze-stdio(coze 开发平台)

本指南介绍了如何在本地环境部署 Coze Studio,包括环境配置、镜像源设置、模型配置及服务启动步骤。内容涵盖 Docker 配置、模型添加方法及常见问题解决方案,适用于 Windows 11 系统,需最低 2 核 CPU 和 4GB 内存。

668 0

操作系统层面视角下 Java IO 的演进路径及核心技术变革解析

本文从操作系统层面深入解析Java IO的演进历程,涵盖BIO、NIO、多路复用器及Netty等核心技术。分析各阶段IO模型的原理、优缺点及系统调用机制,探讨Java如何通过底层优化提升并发性能与数据处理效率,全面呈现IO技术的变革路径与发展趋势。

29 0

window 部署 coze-loop

本教程介绍了如何在 Linux 系统上安装 Go 环境、Docker 以及 Coze Loop,并配置多模型运行。内容包括安装步骤、环境变量设置、代码拉取、模型配置及服务启动等关键流程,适用于搭建本地化的 AI 模型服务环境。

171 4

阿里云联合信通院发布《面向LLM应用的可观测性能力要求》

随着大模型技术的广泛应用,大语言模型(LLM)在对话系统、检索增强生成(RAG)、智能体(Agent)等场景中展现出无限的想象力与创造力。同时,基于 LLM 以及 AI 生态技术栈构建的应用以及业务场景也如雨后春笋般不断涌现。然而,LLM 应用在生产落地过程中面临着模型不确定性大、架构链路复杂、用户体验难以评估等诸多痛点。如何构建 LLM 应用的全链路可观测性体系以及如何评估可观测性能力是否完善,业界缺乏统一且完整细致的标准。

83 0

云原生

阿里云拥有国内全面的云原生产品技术以及大规模的云原生应用实践,通过全面容器化、核心技术互联网化、应用 Serverless 化三大范式,助力制造业企业高效上云,实现系统稳定、应用敏捷智能。拥抱云原生,让创新无处不在。

0
今日
65370
内容
158
活动
340633
关注
你好!
登录掌握更多精彩内容
本周连续打卡5得抽奖机会100%中奖
详细规则>
+5
周一
+5
周二
+5
周三
+5
周四
今天
+5
周六
+5
周日

相关产品

  • 性能测试
  • 云消息队列 Kafka 版
  • 应用实时监控服务
  • AI助理

    你好,我是AI助理

    可以解答问题、推荐解决方案等

    登录插画

    登录以查看您的控制台资源

    管理云资源
    状态一览
    快捷访问