ChatGPT讲故事,DALLE-2负责画出来,两AI合作出绘本

简介: ChatGPT讲故事,DALLE-2负责画出来,两AI合作出绘本


机器之心报道

编辑:张倩、袁铭怿

生成式 AI 正在变革内容的生产方式。

在过去的一周,相信大家都被 ChatGPT 刷了屏。这个强大的对话 AI 仅用 5 天时间用户量就突破了 100 万。大家用各种方式测试着它的能力上限,其中一种测试方式就是让它写故事。与之前的一些 AI 相比,ChatGPT 写出的故事在一致性、流畅度等方面都有了明显的提升,对于人物名字、人物关系和处境的理解也很合理,只不过写出的故事会缺乏一些细节和亮点。

Meta FAIR 研究院研究员 / 高级经理田渊栋用 ChatGPT 续写了自己的小说《破晓之钟》。图源:知乎 https://www.zhihu.com/question/570189639/answer/2787584375

但如果你对故事的要求没那么高,ChatGPT 是完全够用的,比如写个儿童故事。来自斯坦福大学计算机科学系的博士生 Eric Zelikman 就进行了这方面的尝试,而且他不仅用 ChatGPT 写了儿童故事,还让之前火了大半年的 DALLE-2 将其画了出来。也就是说,他相当于用两个 AI 做出了一本绘本。

故事的梗概是这样的:

从前,在一个遥远的地方,有一位名叫罗比的机器人,他生活的世界里到处都是机器。与其他机器人不同的是,罗比不想每天都听从命令,执行任务。


罗比梦想成为人类。 他渴望去感受照耀在脸上的阳光,渴望去呼吸新鲜的空气,渴望去体验一切人类所做的美好的事。 但最重要的是,罗比希望能够做出自己的选择,过上属于自己的生活。

一天,罗比决定碰碰运气,去实现自己的梦想。他从居住的机器人工厂里偷偷溜出来,开启了他的人类世界之旅。

罗比走了很久很久,一路上也遇到了很多挑战。他需要穿越广阔的沙漠,翻越险峻的高山,并勇敢地面对湍急的河流。但他从未放弃,下定决心,一定要抵达目的地。

最后,恍如隔世一般,罗比来到了人类世界,周围的景象和声音令他惊叹不已,他不敢相信,自己终于成功了。

但就在他开始探索新环境时,一群人类发现了它,并且开始追赶它。他们害怕罗比,他们不知道罗比只是一个想和他们交朋友的机器人。

罗比拼尽全力地跑着,在街道上躲来躲去。他不想伤害任何人,他只想一个人待着。但那群人类毫不留情,并未停下追赶的脚步。

就在罗比以为人类要抓住自己的时候,他偶遇了一位善良的老人。这位老人很同情它,听了罗比的故事后,明白了他为什么来到人类世界。

老人帮助罗比躲避追赶他的人类,并教会罗比如何做人。罗比学会了如何说话,如何笑,以及如何享受生活中的点点滴滴。

日子一天天过去,罗比发现做人的感觉比他想象中的还要好。他交了很多新朋友,终于能够过上向往已久的生活。

罗比一开始可能只是个机器人,但最终,他证明了只要相信自己,不放弃梦想,任何人都可以成为人类。

故事到这里就结束了,读下来是不是感觉还不错?ChatGPT 甚至会在故事结尾升华主旨,非常符合人类的写作习惯。当然,为了生成这个「绘本」,Eric Zelikman 也克服了一些困难,比如 ChatGPT 有时生成的 prompt 太长了,他需要缩减一下才能喂给 DALL-2,因为后者对输入长度是有限制的,这也在一定程度上增加了故事风格、人物一致性的难度。为了让 DALL-2 的生成效果更佳,Eric Zelikman 首先让 ChatGPT 为故事的每一段生成一个插图描述,然后反复要求它重复第一个 / 下一个插图描述。之后,再让它提供一个简短(<70 token)但精确的图像描述,就像向不了解故事上下文的人解释该图像一样。

Eric Zelikman 感觉,这是一次非常有趣的体验,因为人们可以借此构建一个互动工具,激发孩子们对写作和艺术的兴趣。

对于 Eric Zelikman 遇到的问题,有人建议他用 Midjourney(一款 AI 绘画工具)再试一遍,因为后者可以接受非常长的 prompt。

还有人表示,自己其实也和 Eric Zelikman 做了类似的事情,让 ChatGPT 生成一个童话故事,然后让 Dall-E 2 画出来。只不过他的故事的主人公是只狐狸,主旨是帮孩子培养自信心。

这些强大的 AI 工具如今正走向融合,我们很难预料接下来还会出现什么样的工具和它们接在一起。今天 AI 已经包揽了写故事、画插图,明天,说不定连出版也搞定了呢?

参考链接:https://twitter.com/ericzelikman/status/1600948156656537600

相关文章
|
1月前
|
机器学习/深度学习 人工智能 搜索推荐
哈佛推出全新类ChatGPT癌症诊断AI,登上Nature!准确率高达96%
哈佛大学研究团队开发的新型AI模型CHIEF,在《自然》期刊发表,癌症诊断准确率达96%。CHIEF基于深度学习,能自动识别、分类癌症并预测生存期,具高准确性、多任务能力和泛化性。它结合病理图像与基因组学等数据,显著提升诊断效率和个性化治疗水平,有望改善医疗资源不平等。但数据隐私和临床效果验证仍是挑战。论文见:https://www.nature.com/articles/s41586-024-07894-z
169 101
|
5天前
|
存储 人工智能 API
ChatGPT-on-WeChat:Star32.4k, DeepSeek加持!这款开源神器秒变AI助手,聊天体验直接起飞!
嗨,大家好,我是小华同学。今天为大家介绍一款结合DeepSeek引擎的开源项目——ChatGPT-on-WeChat,由开发者zhayujie打造。它将微信变成智能AI助手,支持文本、图片、语音对话,具备定时提醒、天气查询等扩展功能,完全开源且易于定制。项目地址:https://github.com/zhayujie/chatgpt-on-wechat。关注我们,获取更多优质开源项目和高效学习方法。
93 11
|
6天前
|
人工智能 自然语言处理 算法
DeepSeek vs ChatGPT:AI对决中的赢家是……人类吗?
DeepSeek VS ChatGPT:DeepSeek以开源黑马姿态崛起,凭借低成本、高性能的「DeepSeek-V3」和专为深度推理设计的「DeepSeek-R1」,成为中小开发者的首选。而ChatGPT则较贵。 然而,AI依赖也带来隐忧,长期使用可能导致记忆衰退和“脑雾”现象。为此,推荐Neuriva解决方案,专注力提升30%,记忆留存率提升2.1倍,助力人类在AI时代保持脑力巅峰。 DeepSeek赢在技术普惠,ChatGPT胜于生态构建,人类的关键在于平衡AI与脑力健康,实现“双核驱动”突破极限!
133 7
|
23天前
|
存储 人工智能 Cloud Native
“爆款”批量生成,如何实现一键创作 AI 有声绘本?
有声读物作为备受欢迎的内容形式之一,已在教育、影视、文化及娱乐等多个领域广泛应用。本方案通过云原生应用开发平台 CAP、函数计算 FC 和百炼模型服务,实现了有声绘本读物的自动化创作,解决了传统制作中步骤繁琐、周期长和高技术门槛的问题,显著提高了创作效率。
|
24天前
|
人工智能 Serverless 调度
|
2月前
|
人工智能 搜索推荐 iOS开发
OpenAI推出适用于iPhone的ChatGPT,与Apple实现具有里程碑意义的AI整合
OpenAI推出适用于iPhone的ChatGPT,与Apple实现具有里程碑意义的AI整合
|
3月前
|
人工智能 自然语言处理 算法
【通义】AI视界|OpenAI最新发布!ChatGPT搜索功能强势来了,挑战谷歌?
本文由【通义】自动生成,精选24小时内的重要资讯:OpenAI推出ChatGPT搜索功能挑战谷歌,微软披露130亿美元投资OpenAI,Reddit首次盈利股价暴涨20%,软银CEO孙正义看好英伟达及“超级AI”前景,谷歌云与沙特PIF共建全球AI中心。更多内容请访问通通知道。
|
4月前
|
人工智能 自然语言处理 数据挖掘
利用小蜜蜂AI智能问答ChatGPT+AI高清绘图生成图文故事案例
利用小蜜蜂AI智能问答ChatGPT+AI高清绘图生成图文故事案例
87 1
|
6月前
|
机器学习/深度学习 人工智能 自然语言处理
还不懂如何与AI高效交流?保姆级且全面的chatGPT提示词工程教程来啦!(一)基础篇
这篇文章是一篇保姆级的教程,旨在全面介绍如何与AI进行高效交流,包括ChatGPT的前世今生、应用场景以及提问的基础技巧。
还不懂如何与AI高效交流?保姆级且全面的chatGPT提示词工程教程来啦!(一)基础篇
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
【AI大模型】ChatGPT模型原理介绍(下)
【AI大模型】ChatGPT模型原理介绍(下)

热门文章

最新文章