波动跃迁:基于 Knative 加速 AI Agent 应用落地

简介: Knative 提供了基于请求自动弹性、缩容到 0 以及多版本管理的 Serverless 能力,看如何助力 AI Agent 初创企业快速产品落地。

【阅读原文】戳:波动跃迁:基于 Knative 加速 AI Agent 应用落地


“采用阿里云 ACK+Knative 方案,实现用户虚拟机的秒级启停,既保障了服务稳定性,又使资源成本降低 50%,研发效率提升 90%。”

——波动跃迁(成都)科技有限公司 CEO 李辰

 

 

 

 

公司介绍

 

 

 

image.png

 

波动跃迁(成都)科技有限公司 [1],成立于 2024 年 8 月,并获得数百万种子轮融资。

 

公司产品包括:

 

  • 开源 Agent 框架: 基于 python 的 Agent 框架 GeneralAgent [2],453 star。
  • 开源pdf解析工具: gptpdf [3],3.5K star。
  • 口笛AI [4]: 一个软件 UGC 平台,让非程序员也可以在AI的帮助下,开发全栈应用和组件、通用 Agent。

 

 

 

 

业务场景

 

 

 

口笛 AI 平台主要主要是 C 端用户,业务场景包括应用开发和通用 Agent。

 

应用开发

 

用户在口笛 AI 上开发各种全栈的应用,支持以下特性:

 

  • 功能全栈: 前端、后端、数据库、支付、部署。
  • 对话式开发,不用拖拉拽就可以全部搞定。
  • 无需配置 superbase,平台自带数据库
  • 无需配置 stripe,平台自带收费逻辑,不仅应用可以收费,也可以分享成组件出去,按量收费。不同于模版收费,只要有人用,就实时到账收益。
  • python 后端: 完全兼容 python 生态,AI 自动帮你安装各种库,比如视频剪辑。
  • 可以开发带 AI 功能的应用: 简单 AI 功能、单 Agent、Agent 使用工具、Agent 提示词调优、多Agent 等各种 AI 功能,口笛 AI 都可以自动帮助你开发。
  • 支持 GPU 功能: 根据你提出的需求,口笛AI可以自动判断你是否需要使用 GPU 来进行加速。比如多个视频和配音文件的合成,如果使用 CPU 合成,需要 10~30 分钟,但是使用 GPU,只需要 1~2 分钟就可以搞定。

 

image.png

 

通用Agent

 

用户可以在应用开发里面,开发组件,并给这些组件定价。

 

在通用 Agent 里面,可以通过搜索开放组件、安装库等,来完成用户各种各种的需求,比如:

 

  • 生成音频、图片、海报、故事级别的长视频。
  • 深度搜索,生成 PPT、PPT 讲解视频、报告。
  • 完成各种定时任务,比如搜索并总结信息、周期性提醒休息、在网站上进行操作等。

 

image.png

 

 

 

 

面临问题

 

 

 

口笛 AI 主要面向 C 端大规模用户,用户在使用应用开发和通用 Agent 的时候,都可以涉及到每个人自己的虚拟机,安装库等。

 

如何快速启动用户的虚拟机、在闲时自动下线、用时自动启动,而且是大规模机器时,管理这些虚拟机,并且保证服务的稳定性成了一个难题。

 

 

 

 

解决方案

 

 

 

我们使用阿里云的 ACK+Knative 方案,解决了上面的问题。Knative 提供多版本流量管理能力,可以快速部署 Agent 进行功能验证,此外提供开箱即用的基于请求的自动弹性 KPA(Knative Pod Autoscaler),可以根据业务访问量自动扩/缩容资源,并做到无流量访问时缩容到 0 资源。

 

image.png

 

运行逻辑:

  • 用户进行应用开发时,Agent 会动态往 Knative 中添加对应的应用或者组件。
  • 在用户使用通用 Agent 时,Agent 会动态调用 Knative 中的组件和安装库,来完成各种任务。
  • 在用户直接使用一些应用时,会直接调用 Knative 对应的应用服务。

 

 

 

 

业务价值

 

 

 

通过上述方案,可以让用户的代码几乎实时上下线,快速分享应用和组件给其他人使用。让平台整体能力的迭代从小时级变成了用户驱动的分钟级迭代,效率提升 90% 以上。

 

资源成本上,让大量闲置虚拟机,可以做到用时启动,特别是一些低频使用的应用/组件,整体节约有 50% 以上。

 


相关链接:

 

[1] 波动跃迁(成都)科技有限公司

https://bodongyueqian.com

[2] GeneralAgent

https://github.com/CosmosShadow/GeneralAgent

[3] gptpdf

https://github.com/CosmosShadow/gptpdf

[4] 口笛AI

https://codyer.cn



我们是阿里巴巴云计算和大数据技术幕后的核心技术输出者。

欢迎关注 “阿里云基础设施”同名微信微博知乎

获取关于我们的更多信息~

相关文章
|
4月前
|
消息中间件 人工智能 安全
云原生进化论:加速构建 AI 应用
本文将和大家分享过去一年在支持企业构建 AI 应用过程的一些实践和思考。
996 50
|
5月前
|
人工智能 安全 中间件
阿里云 AI 中间件重磅发布,打通 AI 应用落地“最后一公里”
9 月 26 日,2025 云栖大会 AI 中间件:AI 时代的中间件技术演进与创新实践论坛上,阿里云智能集团资深技术专家林清山发表主题演讲《未来已来:下一代 AI 中间件重磅发布,解锁 AI 应用架构新范式》,重磅发布阿里云 AI 中间件,提供面向分布式多 Agent 架构的基座,包括:AgentScope-Java(兼容 Spring AI Alibaba 生态),AI MQ(基于Apache RocketMQ 的 AI 能力升级),AI 网关 Higress,AI 注册与配置中心 Nacos,以及覆盖模型与算力的 AI 可观测体系。
1157 53
|
4月前
|
人工智能 运维 Kubernetes
Serverless 应用引擎 SAE:为传统应用托底,为 AI 创新加速
在容器技术持续演进与 AI 全面爆发的当下,企业既要稳健托管传统业务,又要高效落地 AI 创新,如何在复杂的基础设施与频繁的版本变化中保持敏捷、稳定与低成本,成了所有技术团队的共同挑战。阿里云 Serverless 应用引擎(SAE)正是为应对这一时代挑战而生的破局者,SAE 以“免运维、强稳定、极致降本”为核心,通过一站式的应用级托管能力,同时支撑传统应用与 AI 应用,让企业把更多精力投入到业务创新。
582 30
|
4月前
|
机器学习/深度学习 人工智能 边缘计算
大模型在医疗领域的应用
🌟蒋星熠Jaxonic,AI开发者,深耕医疗大模型领域。见证代码如何重塑医疗:从影像分析到智能诊断,从药物研发到临床决策。分享技术实践与行业洞察,探索AI赋能健康的时代变革。
大模型在医疗领域的应用
|
4月前
|
设计模式 人工智能 自然语言处理
3个月圈粉百万,这个AI应用在海外火了
不知道大家还记不记得,我之前推荐过一个叫 Agnes 的 AI 应用,也是当时在 WAIC 了解到的。
563 1
|
4月前
|
存储 人工智能 NoSQL
AI大模型应用实践 八:如何通过RAG数据库实现大模型的私有化定制与优化
RAG技术通过融合外部知识库与大模型,实现知识动态更新与私有化定制,解决大模型知识固化、幻觉及数据安全难题。本文详解RAG原理、数据库选型(向量库、图库、知识图谱、混合架构)及应用场景,助力企业高效构建安全、可解释的智能系统。
|
4月前
|
人工智能 算法 Java
Java与AI驱动区块链:构建智能合约与去中心化AI应用
区块链技术和人工智能的融合正在开创去中心化智能应用的新纪元。本文深入探讨如何使用Java构建AI驱动的区块链应用,涵盖智能合约开发、去中心化AI模型训练与推理、数据隐私保护以及通证经济激励等核心主题。我们将完整展示从区块链基础集成、智能合约编写、AI模型上链到去中心化应用(DApp)开发的全流程,为构建下一代可信、透明的智能去中心化系统提供完整技术方案。
352 3
|
4月前
|
消息中间件 人工智能 安全
构建企业级 AI 应用:为什么我们需要 AI 中间件?
阿里云发布AI中间件,涵盖AgentScope-Java、AI MQ、Higress、Nacos及可观测体系,全面开源核心技术,助力企业构建分布式多Agent架构,推动AI原生应用规模化落地。
473 0
构建企业级 AI 应用:为什么我们需要 AI 中间件?
|
5月前
|
人工智能 自然语言处理 搜索推荐
携多项成果亮相云栖大会,探索大模型在云通信中的创新应用与全球实践
2025云栖大会云通信分论坛聚焦大模型与云通信融合,阿里云发布智能联络中心2.0与Chat App AI助理,携手伙伴推动通信智能化升级。
465 1
|
4月前
|
人工智能 安全 Serverless
再看 AI 网关:助力 AI 应用创新的关键基础设施
AI 网关作为云产品推出已有半年的时间,这半年的时间里,AI 网关从内核到外在都进行了大量的进化,本文将从 AI 网关的诞生、AI 网关的产品能力、AI 网关的开放生态,以及新推出的 Serverless 版,对其进行一个全面的介绍,期望对正在进行 AI 应用落地的朋友,在 AI 基础设施选型方面提供一些参考。
806 72

热门文章

最新文章