大家好!最近我一直在忙着推进两个生产级 AI Agent 项目,现在它们都已经正式上线。打榜发布在 Product Hunt 上(其中一个首日就在 200+ 产品中冲到了Day Rank 第 36 名 ),并且已经开始稳定承接用户流量啦。今天想和大家分享一下,我是如何从 0 到 1 构建这两个 AI Agent 的,包括技术选型、落地经验,以及如何把想法快速变成真正可用的产品。另外,我也会简单总结一下目前的运维成本情况。首先想说明的是:这两个项目并不是那种Vibe Coded 临时拼凑、赶工几小时做出来的 Demo。即便如此,从构思、设计、编码、部署到调试,一周内全部跑通,速度还是远超预期。
项目一:Craftsman-Agent (部署地址: https://craftsman-agent.aiagenta2z.com)
这是一个可以把一句话提示词,直接变成可执行的 3D 组装方案与分步教程的 AI Agent。
适用场景包括:
1. 乐高搭建指南(例如:“如何搭建一艘蓝白配色的乐高游艇?”)
2. Minecraft 建筑教程(例如:“用红色积木做一个乐高 F1 赛车”)
3. 特斯拉3D车衣Car Wrap 设计预览
目标用户主要是游戏爱好者、亲子家庭、3D 设计师和创意原型工作者,帮助大家把脑洞快速变成可落地的建造方案。
项目二:CoachOwl Agent Timetable (https://coachowl.aiagenta2z.com/)
这是一个 AI Agent 日程管理与协作工具,可以理解为“人类 + AI Agent 协同时间表”。
你可以:
设定长期目标(健身、职业发展、学习等)
将任务分配给 人类或 AI Agent(支持 Codex / Claude / Gemini 等)
自动编排日程,打通日历与执行流程
非常适合用来做个人成长管理、团队协作规划,甚至 AI 驱动的项目执行。
技术栈总结
后端服务: Python / Node.js、FastAPI、Pnpm Serve大模型: Gemini / OpenAI / Qwen,以及 3D 渲染相关 APIAPI 接入: DeepNLP OneKey Gateway(托管 Google 搜索、营养计算、Gemini Nano Banana 图像识别等)
Deployment & Hosting 部署与托管: AI Agent A2Z 平台(每个账号免费提供一个域名和一个项目,*.aiagenta2z.com)
编码 Agent: Claude / Codex
可以看到,这两个都是功能完整、可直接使用的应用,涵盖了:
官网部署与前端交互
AI Agent 工具调用(Tool Use)
3D 渲染与建模
多种 API 集成(如 USDA 食品数据、图像识别、3D 重建等)
如果你也在做 AI Agent 相关的产品,或者对如何从想法快速落地成可用应用感兴趣,欢迎一起交流探讨
Craftsman Agent 工匠智能体:把创意秒变 3D 搭建指南
开发和设计
这个项目的官网首页,借助 Claude Code / Codex,只花了几分钟就搭建完成了。 真正的重头戏在于核心 AI Agent 工作流——也就是把文本提示词转化为 3D 搭建指令的过程。这部分因为没有现成的免费 API 可用,逻辑也比较复杂,我大概花了 3 天 才搞定。
简单来说,整个 Agent 的工作流是这样的:
文本提示词(Prompt) + 用户上传图片 → 生成 3D 零件清单 JSON → 调用 3D 渲染 API
举个例子,如果你想搭建一艘乐高游艇,Agent 会先生成包含几十到几百个零件的数据结构,然后再调用渲染接口,把这些数据变成可视化的 3D 模型文件。
Agent 工作流
文本生成 3D 搭建方案教程
以生成一艘 3D 乐高船为例,Agent 需要产出一份包含 10 到 1000 个零部件的详细清单,其数据格式如下。将大语言模型(LLM)生成的 3D 模型数据转换为具体的渲染指令,通常还需要多次调用 3D 渲染 API 才能完成。此外,原生 LLM 生成的 3D 文件其实质量比较一般,因此在实际应用中,往往还需要配合 SFT(监督微调) 和 Few-shot(少样本示例) 来优化和提升最终的设计效果。
[ { "color": "red", "size": [ 4.0, 2.0, 1 ], "position": [ 2, 1, 0.5 ], "part_id": 3020, "part_name": "Plate 2x4", "image": "M3020", "categories": "Basic, Architectural, Transportation, Space, Plate, Solid Studs" }, { "color": "red", "size": [ 2.0, 1.0, 1 ], "position": [ 1, 2, 1.5 ], "part_id": 3023, "part_name": "Plate 1x2", "image": "M3023", "categories": "Basic, Architectural, Transportation, Space, Plate, Solid Studs" }, ]
大模型LLM 与 API 调用
这里基于 DeepNLP OneKey Agent Gateway,主要调用 Gemini LLM 断点 与 3D 构建渲染 API,构建好tools的定义和OneKey Access 验证,避免每个API都重新申请Access Key.
服务端 / API / Skills / MCP
后端架构:采用 Python + FastAPI 构建,提供统一的接口服务。支持能力:同时对外暴露 MCP(模型上下文协议)、Skills(技能) 以及 CLI(命令行工具) 的 API 端点。代码状态:核心服务端代码暂未开源,但已封装好的 Skills和 CLI 工具均已注册至 OneKey Gateway,可直接调用。计费机制:内置 PayPal 支付回调接口,针对每一次成功生成的 3D 组装方案进行按需计费(Pay-per-use)。
app = Starlette( routes=[ Route("/chat", chat_endpoint, methods=["POST"]), # New Chat Endpoint Mount("/static", app=StaticFiles(directory= STATIC_DIR.resolve() , html=True), name="static"), Mount("/assets", app=StaticFiles(directory= ASSETS_DIR.resolve(), html=True), name="assets"), Route("/api/v1/generate_minecraft_build_plan", api_generate_minecraft_build_plan, methods=["POST"]), Route("/api/v1/generate_lego_build_plan", api_generate_lego_build_plan, methods=["POST"]), Route("/api/v1/generate_tesla_wraps", api_generate_tesla_wraps_build_plan, methods=["POST"]), Route("/paypal/agent/purchase/callback", paypal_webhook, methods=["POST"]), Mount("/", app=mcp_app), ## MCP Endpoint Always mounts /mcp ], lifespan=lifespan, )
网站部署域名服务
Website: 主页网站基于 Typescript JS搭建,支持 /static 静态文件比如 index.html/styles.css等等和 /image 图片展示 模板地址:https://github.com/aiagenta2z/agent-mcp-deployment-templates/tree/main/quickstart/website_typescript部署文档Doc: https://deepnlp.org/doc/agent_mcp_deployment部署好之后,就可以通过访问独立子域名来查看刚刚部署的项目了。例如 https://{subdomain}.aiagenta2z.com,这里我们部署的项目首页就是 https://craftsman-agent.aiagenta2z.com
项目成本总结
成本复盘(人力耗时+成本)
Phase |
Cost |
开发耗时 |
官网首页:几分钟(全靠 AI 生成)核心 AI 工作流:3 天(主要耗在 3D 逻辑梳理,数据SFT和Few Shots, API 联调上) |
模型与 API 费用 |
Gemini + 3D 渲染 API(非免费): • Gemini 3.1 图像生成:约 $67 / 1000 次 • OneKey 积分:5000 积分 ≈ 1000 次图像调用,约 $70 / 1000 张 |
托管与域名 |
Basic Plan 免费 (基础版计划,虽然限制了内存和 CPU,但对于初期验证完全够用)https://craftsman-agent.aiagenta2z.com |
流量分发 |
通过 DeepNLP Agent Router 获得免费的冷启动流量,无需自己折腾 SEO 或投放广告。 |
CoachOwl AI Agent Timetable & Orchestration:猫头鹰教练 AI Agent 时间表编排
开发设计
webpage: https://craftsman-agent.aiagenta2z.com
OpenSourced GitHub: https://github.com/AI-Hub-Admin/CoachOwl-Agent-Timetable
功能点
- 在线日程与时间轴:CoachOwl Agent 具备日历与时间轴功能,支持 AI 代理连接、追踪、指派及安排任务,促进人类与 AI 代理之间的无缝协作。系统完美兼容 Google 日历与 Outlook,实现跨平台同步。
- AI 代理智能编排:相比传统的消息发送,人类可通过调度与追踪,更轻松地将重复性、周期性任务委派给个人 AI 代理。适用场景包括:连续两周每日自动发送 ProductHunt 竞品分析报告、为期两周的食物卡路里分析,以及 SAT/CFA/GRE 考试备考规划。
- 目标与任务管理:用户可随时添加任务与目标(AI 教练将为您智能规划一系列周期性任务,且所有任务内容均支持自定义编辑)。
- 专属 AI 教练:拥有特定技能的 AI 教练可同时向人类及其他代理指派任务。例如:
- Fitness 教练:食物卡路里分析、图像识别。
- Career 职业教练:行业信息检索、邮件简报推送、社交媒体公告筹备及博客撰写。
- 学习教练:提供学科辅导与备考支持。
- Easy Voice Input:支持语音快捷输入、习惯追踪及 AI 任务调度,并可无缝连接 Claude Code、Codex、OpenClaw 等主流开发工具。
| Category | Agent Tools & Features |
BASE |
`base_search` 深度搜索能力,Deep Research of Google Search Tavily Search APIs, `send_email_with_attachments` 邮件发送能力 Send summary reports to your Email accounts. |
Fitness |
`analyze_foods_nutrition_workflow` 文字+ 图片:营养分析卡路里计算,generate nutritions & calories reports from uploaded images or text input |
Career |
`track_competitor_launches_producthunt` Fetch ProductHunt releases, `job_search` APIs |
The AI Agent Orchestration 功能
1. 时间线与日历
该应用是使用 Codex 构建的。仅花费了 1 天 时间,我就完成了所有的数据库表结构设计、前端网页布局及交互逻辑的开发。
2. Agent 执行编排系统 Execution & Orchestration
例如,设置一个任务:“深度调研过去 7 天 Product Hunt 上的 AI Agent 发布情况,并将报告发送至我的邮箱 xxxx@gmail.com”。
Agent 的执行链路如下:
/claim task (认领任务) ↓ /Execution (执行任务) ↓ /Report Heartbeat (汇报心跳/进度) ↓ /Update Results (更新结果)
数据库设计、Agent编排实现:耗时 4–5 天。
本地 Agent 运行:为了让本地 Agent 能够拉取并执行任务,需要使用命令 `onekey gateway coachowl/coachowl` 从云端拉取任务队列,这额外耗费了 1 天 来完成对接与调试。
项目成本总结
Phase |
Cost |
开发耗时 |
官网首页:几分钟(由 AI 辅助生成), 核心编排与数据库:3 天(主要涉及 Agent 调度逻辑和 DB 设计) |
模型与 API 费用 |
Gemini / OpenAI / Qwen(按实际使用量计费) |
托管与域名 |
免费(基础版计划,内存和 CPU 有一定限制,但足够支撑早期用户访问)https://coachowl.aiagenta2z.com |
流量分发 |
通过 DeepNLP Agent Router 获得免费的冷启动流量;同时,首页已完成 Google Search 域名验证,具备 SEO 收录能力。 |