Nano Banana 2 来了,Google 把口喷修图卷上天了!4K 效果称王!

简介: 今天凌晨 Google 悄悄上线了 Nano Banana 2 的 Flash 模型。 老金我当时的反应是:又来?上次 Nano Banana 刚出的时候,社区吹得天花乱坠。 抱着"先试试看"的心态,老金我打开了 Gemini。结果这一试,真的不一样了。## 先说 Nano Banana 到底是什么很多人可能还不知道这玩意儿。 简单说,Nano Banana 是 Google

今天凌晨 Google 悄悄上线了 Nano Banana 2 的 Flash 模型。
老金我当时的反应是:又来?上次 Nano Banana 刚出的时候,社区吹得天花乱坠。
抱着"先试试看"的心态,老金我打开了 Gemini。

结果这一试,真的不一样了。

先说 Nano Banana 到底是什么

很多人可能还不知道这玩意儿。
简单说,Nano Banana 是 Google 基于 Gemini 模型做的 AI 图像生成和编辑工具。
跟 Midjourney、DALL-E 这些纯生图工具不同。

它最大的特点是:能对话式编辑图片。

你生成一张图之后,可以直接用自然语言告诉它"把背景换成海边"、"把文字改成红色"、"加一个人在左边"。
不用重新生成,不用学复杂的参数,就像跟一个设计师聊天一样。

Image

Nano Banana 2 升级了什么

这次的 Nano Banana 2,老金我根据官方文档和社区反馈,总结了 5 个核心升级。
这里需要注意,老金指的是 Nano Banana 1,而非 Nano Banana Pro。
相对比下来,本次的 Nano Banana 2 更像是 Nano Banana Pro 蒸馏出来的一个质量可用的高性价比版本。
重点是,价格几乎减半。
然后貌似好像Gemini还没全量,如果没有的,再等等。

文字渲染能力大幅提升 这是老金我觉得最重要的升级。 上一代最大的槽点就是文字渲染,英文还凑合,中文总会有那么一两个字儿崩掉。 Nano Banana 2 引入了多步自检流程,生成图片后会自动检查文字是否正确,不对就重新渲染。 根据社区测试,英文文字准确率大幅提升,中文也有明显改善。

多轮对话编辑更稳定 以前用 Nano Banana 编辑图片,改两三轮之后图片质量就开始下降,颜色偏移、细节丢失。 Nano Banana 2 优化了多轮编辑的一致性,支持多轮连续编辑,画面质量基本不衰减。 这个能力在做产品图、海报设计的时候特别有用。

风格迁移更精准 你可以上传一张参考图,让 Nano Banana 2 按照这个风格生成新图片。 比如上传一张赛博朋克风格的图,然后说"用这个风格画一只猫",出来的效果比上一代好太多。 这个功能对做系列配图、品牌视觉统一特别实用。

这里老金把上面这仨亲测里一遍,你们感受一下:

生成红楼梦的 9 宫格黑白稿:

Image

转换成卡渲风格:

Image

转换成 3D 渲染并上色:

Image

上 2 下 Pro 的对比

image.png

官网可以生成 8:1 长图

image.png

分辨率和细节提升 Nano Banana Pro 版本支持最高 4K 分辨率输出。 Flash 版本虽然分辨率稍低,但生成速度明显更快,适合快速出草图。 根据社区对比测试,Nano Banana 2 在人物面部细节、光影处理上已经接近 Midjourney V6 的水平。
AI Studio 中可用 4K!
但是需要 APIKey,地址在下方。

Image

5 个核心玩法老金帮你整理好了

玩法 1:产品图一键生成 做电商的朋友注意了。 你只需要拍一张产品的白底图,然后告诉 Nano Banana 2"帮我做个人 IP,不需要人物,有着一台高科技电脑,屏幕上写着 “”老金带你玩 AI 陪伴群&AI 编程直播课 aiking.dev”,放在大理石桌面上,旁边放一杯咖啡,自然光从左边打过来。". 出来的效果,老金我看了社区案例,比很多淘宝详情页的图都好看。

玩法 2:海报文字排版 以前 AI 生图最头疼的就是加文字。 现在你可以直接在提示词里写"在图片中间加标题:AI 编程课第二期 3 月 8 号开启,字体用黑体,白色,带阴影,背景不要抢标题"。 Nano Banana 2 的文字渲染能力终于能用了,不用再去 PS 里手动加字。

玩法 3:多轮精修工作流 生成一张基础图 -> "把天空换成夕阳" -> "人物表情改成微笑" -> "整体色调暖一点" -> "加一个模糊前景"。 5 轮修改下来,图片质量依然在线。 这个工作流比 Midjourney 的 vary 和 zoom 灵活太多了。

玩法 4:风格统一的系列图 做公众号配图、小红书封面的朋友,这个功能救命。 先生成一张满意的图,然后用它作为风格参考,批量生成同风格的其他图片。 品牌视觉统一,再也不用一张一张调了。

玩法 5:二次元和 IP 设计 根据 GitHub 上的提示词合集,Nano Banana 2 在二次元风格上表现很强。 社区已经有人用它设计了完整的 IP 形象,从正面、侧面到各种表情包,风格一致性很高。

如果对你有帮助,记得关注一波~

怎么免费用上 Nano Banana 2

方法 1:Google AI Studio(推荐) 打开 aistudio.google.com,登录 Google 账号。 左边选择模型,找到 Nano Banana 2。 开启图片生成功能,直接在对话框里输入提示词就行。

Image

方法 2:Gemini App(灰度中,貌似尚未全量上线) 手机上下载 Gemini App,直接对话就能生图。 但功能比 AI Studio 少一些,适合简单场景。

方法 3:API 调用 开发者可以通过 Gemini API 调用 Nano Banana 2。 Flash 版本(Nano Banana 2)输入$0.50/百万 token,输出$3.00/百万 token,单张图片约$0.0672。
Pro 版本输入$2.00/百万 token,输出$12.00/百万 token,单张图片约$0.134。

Image

4K 测试图直接封神 @TeksEdge @けいすけ / AIマンガ家 发了一组 Nano Banana 2 的 4K 测试图,产品图的质感、光影的层次,说实话老金我第一眼以为是真实摄影。

image.png
image.png

说说不足的地方

老金我不会只说好话。

根据社区反馈,Nano Banana 2 还有几个明显的问题。
1、中文文字渲染虽然改善了,但复杂排版还是会出错
2、人物手指问题依然存在,虽然比上一代好,但偶尔还是会出现 6 根手指的情况
3、生成速度在高峰期会变慢,Flash 版本有时候要等 30 秒以上
4、风格迁移对写实风格支持最好,但对水彩、油画等艺术风格还不够稳定

老金最后说

Google 这次是真的把 AI 修图的门槛打下来了。
以前想用 AI 生图,要么花钱订阅 Midjourney,要么折腾 Stable Diffusion 的本地部署。
现在打开浏览器,登录 Google 账号,直接开干。

你们用过 Nano Banana 吗?
觉得跟其他的比怎么样?
评论区聊聊,老金我很好奇大家的实际体验。


往期推荐:

AI编程教程列表
提示词工工程(Prompt Engineering)
LLMOPS(大语言模运维平台)
AI绘画教程列表
WX机器人教程列表

开源知识库地址(实时更新交流群):
https://tffyvtlai4.feishu.cn/wiki/OhQ8wqntFihcI1kWVDlcNdpznFf

Claude Code & Openclaw 双顶流全中文从零开始的教程:不懂代码照样造网站,老金15万字Claude Code+OpenClaw教程免费开源

开源项目在这里最下面公众号写作2年,从几十到几千阅读量,我靠这3件事做到的


每次我都想提醒一下,这不是凡尔赛,是希望有想法的人勇敢冲。
我不会代码,我英语也不好,但是我做出来了很多东西,在文末的开源知识库可见。
我真心希望能影响更多的人来尝试新的技巧,迎接新的时代。

谢谢你读我的文章。
如果觉得不错,随手点个赞、在看、转发三连吧🙂
如果想第一时间收到推送,也可以给我个星标⭐~谢谢你看我的文章。

相关文章
|
2天前
|
人工智能 自然语言处理 JavaScript
2026年Windows+Ollama本地部署OpenClaw保姆级教程:本地AI Agent+阿里云上快速搭建
2026年OpenClaw凭借本地部署、私有化运行的特性,成为打造个人智能体的核心工具,而Ollama作为轻量级本地大模型管理工具,能让OpenClaw摆脱对云端大模型的依赖,实现**本地推理、数据不泄露、全流程私有化**的智能体验。本文基于Windows 11系统,从硬件环境准备、Ollama安装与模型定制、OpenClaw部署配置、技能扩展到常见问题排查,打造保姆级本地部署教程,同时补充阿里云OpenClaw(Clawdbot)快速部署步骤,兼顾本地私有化需求与云端7×24小时运行需求,文中所有代码命令均可直接复制执行,确保零基础用户也能快速搭建属于自己的本地智能体。
3756 14
|
8天前
|
存储 人工智能 负载均衡
阿里云OpenClaw多Agent实战宝典:从极速部署到AI团队搭建,一个人=一支高效军团
在AI自动化时代,单一Agent的“全能模式”早已无法满足复杂任务需求——记忆臃肿导致响应迟缓、上下文污染引发逻辑冲突、无关信息加载造成Token浪费,这些痛点让OpenClaw的潜力大打折扣。而多Agent架构的出现,彻底改变了这一现状:通过“单Gateway+多分身”模式,让一个Bot在不同场景下切换独立“大脑”,如同组建一支分工明确的AI团队,实现创意、写作、编码、数据分析等任务的高效协同。
3295 27
|
13天前
|
人工智能 自然语言处理 监控
OpenClaw skills重构量化交易逻辑:部署+AI全自动炒股指南(2026终极版)
2026年,AI Agent领域最震撼的突破来自OpenClaw(原Clawdbot)——这个能自主规划、执行任务的智能体,用50美元启动资金创造了48小时滚雪球至2980美元的奇迹,收益率高达5860%。其核心逻辑堪称教科书级:每10分钟扫描Polymarket近千个预测市场,借助Claude API深度推理,交叉验证NOAA天气数据、体育伤病报告、加密货币链上情绪等多维度信息,捕捉8%以上的定价偏差,再通过凯利准则将单仓位严格控制在总资金6%以内,实现低风险高频套利。
6935 61
|
2天前
|
人工智能 JSON JavaScript
手把手教你用 OpenClaw + 飞书,打造专属 AI 机器人
手把手教你用 OpenClaw(v2026.2.22-2)+ 飞书,10分钟零代码搭建专属AI机器人!内置飞书插件,无需额外安装;支持Claude等主流模型,命令行一键配置。告别复杂开发,像聊同事一样自然对话。
1291 5
手把手教你用 OpenClaw + 飞书,打造专属 AI 机器人
|
3天前
|
人工智能 网络安全 数据安全/隐私保护
Docker部署OpenClaw(Clawdbot)攻略+阿里云部署OpenClaw 2026版教程
OpenClaw(前身为Clawdbot、Moltbot)作为一款高性能的AI代理平台,凭借自然语言驱动的任务自动化、多平台无缝协作、轻量化容器化架构等核心优势,成为2026年办公自动化、智能协作、跨端指令执行的主流工具,可实现邮件处理、日程管理、航班值机、多IM平台消息联动等丰富功能,无需复杂开发即可快速搭建专属AI助手。Docker作为轻量级容器化技术,能完美解决OpenClaw部署过程中的环境冲突、依赖配置、跨平台兼容等问题,实现一键搭建、快速启动、灵活迁移的部署体验。
1036 2
|
30天前
|
人工智能 自然语言处理 Shell
🦞 如何在 OpenClaw (Clawdbot/Moltbot) 配置阿里云百炼 API
本教程指导用户在开源AI助手Clawdbot中集成阿里云百炼API,涵盖安装Clawdbot、获取百炼API Key、配置环境变量与模型参数、验证调用等完整流程,支持Qwen3-max thinking (Qwen3-Max-2026-01-23)/Qwen - Plus等主流模型,助力本地化智能自动化。
45809 158
🦞 如何在 OpenClaw (Clawdbot/Moltbot) 配置阿里云百炼 API
|
4天前
|
存储 人工智能 BI
2026年OpenClaw(Clawdbot)极简部署:接入小红书全自动运营,一个人=一支团队
2026年的小红书运营赛道,AI自动化工具已成为核心竞争力。OpenClaw(原Clawdbot)凭借“Skill插件化集成、全流程自动化、跨平台联动”的核心优势,彻底颠覆传统运营模式——从热点追踪、文案创作、封面设计到自动发布、账号互动,仅需一句自然语言指令,即可实现全链路闭环。而阿里云作为OpenClaw官方推荐的云端部署载体,2026年推出专属秒级部署方案,预装全套运行环境与小红书运营插件,让零基础用户也能10分钟完成部署,轻松拥有7×24小时在线的“专属运营团队”。
1179 4
|
8天前
|
人工智能 自然语言处理 安全
2026年OpenClaw Skills安装指南:Top20必装清单+阿里云上部署实操(附代码命令)
OpenClaw(原Clawdbot)的强大之处,不仅在于其开源免费的AI执行引擎核心,更在于其庞大的Skills生态——截至2026年2月,官方技能市场ClawHub已收录1700+各类技能插件,覆盖办公自动化、智能交互、生活服务等全场景。但对新手而言,面对海量技能往往无从下手,盲目安装不仅导致功能冗余,还可能引发权限冲突与安全风险。
1777 9
|
5天前
|
人工智能 JavaScript API
2026年Windows系统本地部署OpenClaw指南:附阿里云简易部署OpenClaw方案,零技术基础也能玩转AI助手
在AI办公自动化全面普及的2026年,OpenClaw(原Clawdbot、Moltbot)凭借“自然语言指令操控、多任务自动化执行、多工具无缝集成”的核心优势,成为个人与轻量办公群体打造专属AI助手的首选。它彻底打破了传统AI“只会对话不会执行”的局限——“手”可读写本地文件、执行代码、操控命令行,“脚”能联网搜索、访问网页并分析内容,“大脑”则可灵活接入通义千问、OpenAI等云端API,或利用本地GPU运行模型,真正实现“聊天框里办大事”。
1154 2

热门文章

最新文章