Gemini 3 Nano Banana 的MCP服务器开发设计和 国内直连方案

简介: 基于Gemini 3 API开发的MCP绘图工具,支持在Coding客户端中边写代码边生成流程图。项目采用Python实现,兼容Gemini 2.5 Flash与3 Pro图像API,集成超时控制、国内直连路由转发功能,可高效调用AI生图。提供完整GitHub开源代码及在线试用地址,欢迎提交Issue交流。

最近在集成Gemini 3API,发现还没有一个可以在各个 Coding 客户端配置的 MCP的画图工具,支持一边写代码,一边画流程图,于是把Gemini 3 Nano Banana

的API继承了进来,干脆自己写了一个,下面分享一下技术方案。有兴趣的兄弟可以去Github提交issue哈。


Github地址: https://github.com/aiagenta2z/gemini_mcp_onekey


thanksgiving_turkey_escape.png



下面会介绍这个工具架构设计和链接方案,成功之后部署在OneKey Agent Router 上试用地址:Website-Playground Gemini 3 Nano Banana MCP

Agent的信息和API也托管到网站上了 Nano Banana MCP Server,可以设置了API来方便 Agent MCP Router 来调用分发。



设计概念:主要是它是基于Python写的,支持最新的Gemini 2.5 Flash,还有 Gemini 3 Pro 的图片API调用功能


1. Tool工具设计

封装的一个生成图片的函数,支持参数:prompt 生成指令,model_name 模型名 ,还有其他属性作为图片指定的作为入参。这里 prompt 是把用户输入短的要求,给扩写为精确的 prompt,可以调用Qwen/Gemini等模型来使用,比如把 "火鸡逃跑" 扩写成为  例如 "Turkey Escape, White House Scene, Two man, Chaos," 等长并且具体的。


@server.tool()
def generate_image_nano_banana(
        model: Annotated[str, "The image generation model to use. Defaults to 'gemini-2.5-flash-image'. Supported models include 'gemini-3-pro-image-preview', 'gemini-2.5-flash-image' "] = "gemini-2.5-flash-image",
        prompt: Annotated[str, "A detailed text description for the image to be generated."] = "A detailed, cinematic image of a futuristic city.",
        image_name: Annotated[str, "The filename for the output image. Defaults to 'gemini_output_images.png'."] = "gemini_output_images.png",
        output_folder: Annotated[Optional[str], "The optional folder path where the image will be saved. If None, uses a default location."] = None,
        aspect_ratio: Annotated[str, "The aspect ratio of the generated image (e.g., '16:9', '1:1', '4:3')."] = "16:9",
        image_size: Annotated[str, "The size/resolution of the generated image (e.g., '1K', '2K')."] = "1K"
) -> Dict:

2. Gemini 3 Nano Banana 工具调用


对应链接Google Gemini客户端方法, 这里有一个细节处理:超时设置,因为有一些图片比如4K生成过慢,

所以要设置好超时时间,方便agent loop继续,需要外部设置 http_options,然后初始化传递给客户端。


http_options = types.HttpOptions(timeout=120000)
client = genai.Client(api_key=GOOGLE_API_KEY, http_options=http_options)
## more code
            response = client.models.generate_content(
                model=model,
                contents=prompt,             
                config=types.GenerateContentConfig(
                    tools=[{"google_search": {}}],
                    image_config=types.ImageConfig(
                        aspect_ratio=aspect_ratio,
                        image_size=image_size    ## 4K 2K 1K
                    ),
                    # thinking_config=types.ThinkingConfig(thinking_level="low")
                )
            )

3. 国内直连方案


Gemini客户端直接从国内IP是无法请求通的,这里利用了MCP Router的路由转发能力,支持 Cursor等客户端 链接 Router服务器,再转发给Gemini 请求

这里接住了 DeepNLP OneKey MCP Router转发部署,就可以请求到了哈,使用方法配置,需要做key验证,目前通过测试KEY,但是限流。

自己注册的KEY(https://www.deepnlp.org/workspace/keys) 和对应 API Endpoint 开发文档 (https://www.deepnlp.org/doc/onekey_mcp_router) 就不会限流了。


{
   "mcpServers": {
        "deepnlp-onekey-gemini": {
          "url": "https://agent.deepnlp.org/mcp?server_name=gemini&onekey=BETA_TEST_KEY_OCT_2025"
        },
        "deepnlp-onekey-nano-banana": {
          "url": "https://agent.deepnlp.org/mcp?server_name=gemini-nano-banana&onekey=BETA_TEST_KEY_OCT_2025"
        }
    }
}


如果有什么问题随时欢迎提交Issue给我

相关文章
|
3月前
|
机器学习/深度学习 人工智能 程序员
StackOverflow已经死亡了吗
StackOverflow曾是程序员的“圣地”,但AI崛起正改变这一格局。ChatGPT等工具以高效即时的优势分流用户,使其面临流量下滑与社区文化挑战。而新兴的大模型实验室Lab4AI则融合算力、实践与协作,构建AI时代下的开发者新生态。从问答到实践,开发者社区正在进化。
268 2
StackOverflow已经死亡了吗
|
3月前
|
人工智能 JSON 机器人
从零开始:用Python和Gemini 3四步搭建你自己的AI Agent
AI Agent并非玄学,核心仅为“循环 + 大模型 + 工具函数”。本文教你用Gemini 3从零搭建能读写文件、执行指令的命令行助手,拆解其“观察-思考-行动”循环机制,揭示智能体背后的简洁本质。
633 17
从零开始:用Python和Gemini 3四步搭建你自己的AI Agent
|
2月前
|
人工智能 安全 前端开发
写单元测试太痛苦?教你用DeepSeek/通义千问一键生成高质量测试代码
单元测试难写且枯燥?本文分享一套经过验证的AI生成指令,将DeepSeek/通义千问化身为10年经验的测试专家。支持自动Mock、全场景覆盖和参数化测试,让代码质量保障从"体力活"变成高效的"指挥活"。
457 3
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
Z-Image:冲击体验上限的下一代图像生成模型
通义实验室推出全新文生图模型Z-Image,以6B参数实现“快、稳、轻、准”突破。Turbo版本仅需8步亚秒级生成,支持16GB显存设备,中英双语理解与文字渲染尤为出色,真实感和美学表现媲美国际顶尖模型,被誉为“最值得关注的开源生图模型之一”。
3375 9
|
2月前
|
传感器 数据采集 算法
LET数据集来魔搭了!开源首批超60,000分钟全尺寸人形机器人真机数据
国内最大全尺寸人形机器人真机数据集“LET数据集”正式发布,首批开源超6万分钟高质量数据,覆盖6大真实场景,支持多模态融合与标准化应用,助力具身智能研发,已在魔搭社区开放共享。
323 1
LET数据集来魔搭了!开源首批超60,000分钟全尺寸人形机器人真机数据
|
3月前
|
人工智能 文字识别 物联网
ModelScope魔搭社区发布月报 -- 25年11月
魔搭ModelScope三周年庆!见证开源大模型从追赶到领跑,11月硬核更新不断:Qwen3-VL、MiniMax-M2等新模态齐发,AIGC生态爆发,OCR、语音、Agent全面进化。11月22日杭州AI开源生态大会,不见不散!
548 4
|
3月前
|
JavaScript 搜索推荐 开发者
ChatPPT+魔搭社区:MCP 2.0全面升级!
ChatPPT MCP2.0正式发布,联合魔搭ModelScope推出云端智能体服务,支持生成、编辑、演讲、动画等全链路功能,开放Streamable HTTP协议与本地Stdio双模式,已接入20+平台,服务300+开发者。
717 11
ChatPPT+魔搭社区:MCP 2.0全面升级!
|
3月前
|
人工智能 搜索推荐 API
蚂蚁百宝箱联手深铁打造全国首个地铁 AI 智能体「深铁宝」:你的全能城市向导来啦~
蚂蚁百宝箱联合深铁集团、深圳通推出全国首个“公共出行+城市服务”AI智能体「深铁宝」,上线于深圳地铁、深圳通及支付宝APP,实现一句话直达、秒级响应的智慧出行体验,涵盖出行规划、乘车码快捷调取、周边生活服务推荐等一站式功能,助力城市交通与服务数字化升级。
492 30
|
2月前
|
机器学习/深度学习 测试技术 API
DeepSeek V3.2 正式版:强化 Agent 能力,融入思考推理
DeepSeek发布正式版V3.2与高性能Speciale版本,支持思考模式下工具调用,推理能力达全球领先水平。V3.2平衡效率与性能,适用于通用任务;Speciale专注复杂推理,在数学与编程竞赛中表现卓越,已开源并上线API。
757 9
|
2月前
|
机器学习/深度学习 安全 算法
PPO最强,DPO一般?一文带你了解常见三种强化学习方法,文末推荐大模型微调神器!
大模型如何更懂人类?关键在于“对齐”。PPO、DPO、KTO是三大主流对齐方法:PPO效果强但复杂,DPO平衡高效,KTO低成本易上手。不同团队可根据资源选择路径。LLaMA-Factory Online让微调像浏览器操作一样简单,助力人人皆可训练专属模型。
666 3
PPO最强,DPO一般?一文带你了解常见三种强化学习方法,文末推荐大模型微调神器!

热门文章

最新文章