龙蜥邀您参加 AICon 全球人工智能开发与应用大会,探索 AI 应用边界

简介: 更前沿的 AI 开发新范式和落地干货。

AICon 全球人工智能开发与应用大会·深圳站将于 8 月 22-23 日召开,聚焦大模型训练与推理、AI Agent、RAG(检索增强生成)、多模态大模型等前沿技术方向。大会面向各行业对人工智能和大模型感兴趣的资深工程师、产品经理、数据分析师等。龙蜥社区多位专家受邀参加,围绕 AI 场景运维的分层实践方法论及大模型推理成本优化方案进行专题分享。

专题:高效推理技术与性能极限优化

主题:Mooncake:面向长上下文的 KVCache 中心化推理优化方案

时间:8 月 23 日 9:30-10:10

嘉宾:马腾,龙蜥社区 CXL SIG Maintainer、阿里云高级技术专家

地点:大宴会厅 A

简介:随着大模型应用的普及,推理过程中的高计算资源消耗和 KVCache(键值缓存)的冗余存储成为关键瓶颈,导致推理成本高昂、吞吐量受限,尤其在长上下文场景中表现尤为突出。Mooncake 项目通过创新的以 KVCache 为中心的“PD 分离”架构(计算与存储解耦)和“以存换算”设计,将 KVCache 池化共享,结合高性能传输技术(如 eRDMA、GPUDirect)和分布式存储优化,实现跨实例的资源复用。本次演讲通过介绍 Mooncake 的核心技术解析、行业实践与效果等,了解如何通过 KVCache 池化与 PD 分离架构解决大模型推理的高成本问题,获得可复用的架构设计思路,学习 eRDMA/GPUDirect 等高性能传输技术在大模型场景的落地方法,提升分布式系统优化能力,掌握主流推理框架(如 vLLM)与 Mooncake 的适配策略,推进开源解决方案持续发展。


专题:AI 赋能研发体系变革

演讲:AI Agent + AI Profiling,构建高效智能运维双支柱

时间:8 月 23 日 16:00-16:40

嘉宾:周絮,龙蜥社区系统运维联盟秘书处成员、阿里云架构师

地点:大宴会厅 A

简介:在操作系统运维中,传统运维面临监控指标繁杂难懂、缺乏现场信息、秒级抖动难查等诸多难题。而改进后的方案引入 AI Agent,提供了集群健康度全景视图,多维度呈现健康分;联合指标分析,结合 MCP 深入诊断 CPU、内存、网络等;指标异常时采集辅助信息,实现自动化诊断;利用持续追踪技术实时采集 CPU 调用栈,针对特定问题开发多种专家诊断工具,有效解决了传统运维困境,助力运维工作高效开展。

此外,AI 场景的运维在分布式架构的演进、巨额的成本下也充满挑战。本次分享讲解如何通过丰富的指标维度、集群化的监控指标观测、日志告警,实现一分钟极速发现问题,通过常态化 AI 火焰图、集群拓扑和触发式 Profiling 剖析、AI 诊断,完成五分钟高快速定界和定位问题,高效运维 AI 场景。




更多大会详细议程可点击下方链接查看,欢迎报名参加:https://aicon.infoq.cn/2025/shenzhen/schedule

相关文章
|
6天前
|
人工智能 安全 中间件
阿里云 AI 中间件重磅发布,打通 AI 应用落地“最后一公里”
9 月 26 日,2025 云栖大会 AI 中间件:AI 时代的中间件技术演进与创新实践论坛上,阿里云智能集团资深技术专家林清山发表主题演讲《未来已来:下一代 AI 中间件重磅发布,解锁 AI 应用架构新范式》,重磅发布阿里云 AI 中间件,提供面向分布式多 Agent 架构的基座,包括:AgentScope-Java(兼容 Spring AI Alibaba 生态),AI MQ(基于Apache RocketMQ 的 AI 能力升级),AI 网关 Higress,AI 注册与配置中心 Nacos,以及覆盖模型与算力的 AI 可观测体系。
|
12天前
|
存储 人工智能 Serverless
函数计算进化之路:AI 应用运行时的状态剖析
AI应用正从“请求-响应”迈向“对话式智能体”,推动Serverless架构向“会话原生”演进。阿里云函数计算引领云上 AI 应用 Serverless 运行时技术创新,实现性能、隔离与成本平衡,开启Serverless AI新范式。
204 12
|
6天前
|
存储 人工智能 Java
AI 超级智能体全栈项目阶段三:自定义 Advisor 与结构化输出实现以及对话记忆持久化开发
本文介绍如何在Spring AI中自定义Advisor实现日志记录、结构化输出、对话记忆持久化及多模态开发,结合阿里云灵积模型Qwen-Plus,提升AI应用的可维护性与功能性。
275 125
AI 超级智能体全栈项目阶段三:自定义 Advisor 与结构化输出实现以及对话记忆持久化开发
|
8天前
|
设计模式 机器学习/深度学习 人工智能
AI-Native (AI原生)图解+秒懂: 什么是 AI-Native 应用(AI原生应用)?如何设计一个 AI原生应用?
AI-Native (AI原生)图解+秒懂: 什么是 AI-Native 应用(AI原生应用)?如何设计一个 AI原生应用?
|
9天前
|
人工智能 负载均衡 API
Vercel 发布 AI Gateway 神器!可一键访问数百个模型,助力零门槛开发 AI 应用
大家好,我是Immerse,独立开发者、AGI实践者。分享编程、AI干货、开源项目与个人思考。关注公众号“沉浸式趣谈”,获取独家内容。Vercel新推出的AI Gateway,统一多模型API,支持自动切换、负载均衡与零加价调用,让AI开发更高效稳定。一行代码切换模型,告别接口烦恼!
106 1
Vercel 发布 AI Gateway 神器!可一键访问数百个模型,助力零门槛开发 AI 应用
|
18天前
|
人工智能 JSON 测试技术
AI智能体开发实战:从提示工程转向上下文工程的完整指南
曾被热捧的提示工程正逐渐退潮,本文揭示其局限性,并提出“上下文工程”新范式:通过结构化提示、精准上下文管理、工具调用与统一状态,构建可扩展、可恢复、生产级的智能体工作流,推动AI系统迈向工程化与可控化。
186 9
AI智能体开发实战:从提示工程转向上下文工程的完整指南
|
6天前
|
数据采集 人工智能 前端开发
Playwright与AI智能体的网页爬虫创新应用
厌倦重复测试与低效爬虫?本课程带您掌握Playwright自动化工具,并融合AI大模型构建智能体,实现网页自主分析、决策与数据提取,完成从脚本执行到智能架构的能力跃升。
|
7天前
|
设计模式 人工智能 API
AI智能体开发实战:17种核心架构模式详解与Python代码实现
本文系统解析17种智能体架构设计模式,涵盖多智能体协作、思维树、反思优化与工具调用等核心范式,结合LangChain与LangGraph实现代码工作流,并通过真实案例验证效果,助力构建高效AI系统。
88 7
|
12天前
|
边缘计算 人工智能 算法
AI在智慧能源管理中的边缘计算应用
AI在智慧能源管理中的边缘计算应用
80 13
|
7天前
|
人工智能 运维 安全
聚焦 AI 应用基础设施,云栖大会 Serverless AI 全回顾
2025 年 9 月 26 日,为期三天的云栖大会在杭州云栖小镇圆满闭幕。随着大模型技术的飞速发展,我们正从云原生时代迈向一个全新的 AI 原生应用时代。为了解决企业在 AI 应用落地中面临的高成本、高复杂度和高风险等核心挑战,阿里云基于函数计算 FC 发布一系列重磅服务。本文将对云栖大会期间 Serverless+AI 基础设施相关内容进行全面总结。