云上AI推理平台全掌握 (4):大模型分发加速
为应对大模型服务突发流量场景,阿里云人工智能平台 PAI 推理服务 PAI-EAS 提供本地目录内存缓存(Memory Cache)的大模型分发加速功能,有效解决大量请求接入情况下的推理延迟。PAI-EAS 大模型分发加速功能,零代码即可轻松完成配置。
我是怎么把我的 AI 从“傻瓜”重构成“专家”的
本文分享了一次 Agent 项目的重构经验,讲述如何将一个僵化、被动的指令式系统,升级为具备内在驱动力的“专家”Agent。通过引入“动机层”和“成长机制”,让 Agent 更加主动、灵活并能自我优化,最终实现从“流水线工人”到“资深顾问”的蜕变。
直播预告|阿里巴巴 OpenTelemetry 之旅
欢迎参加本期 OTel 实践分享,由阿里巴巴资深软件工程师 Huxing Zhang(OTel Go 编译时自动插桩维护者)和 高级软件工程师 Steve Rao(OTel Java 插桩审核员)带来。他们将分享阿里巴巴在内部服务中采用 OpenTelemetry 的经验,介绍大规模迁移中的挑战与收获,以及他们如何成长为 OpenTelemetry 的积极贡献者。
「智驱未来,云网随行」阿里云基础设施AI技术沙龙云网络专场在杭州举办
6月20日,阿里云基础设施AI Tech Day ·云网络专场在杭州太极禅院成功举办。活动吸引了来自吉利、极氪、浙江大学等35位技术负责人及师生参与。现场围绕AI场景下的算力资源网络建设,探讨了数据采集、模型调度、算力池化等关键技术方案,分享了阿里云在通义模型、PAI平台、弹性计算及云网络方面的最佳实践,助力企业构建智能、弹性的AI基础设施。