2016年有一场人机写稿竞赛:就一份财报写出一篇新闻稿。
对手分别是自然语言生成公司Automated Insights打造的WordSmith机器人和美国公共广播记者Scott Horsley。
最后比赛结果是,机器人写稿速度比人类快了一倍多。
当然,对比两篇新闻稿,Scott写的那篇语言更加生动细致,更富有情感。
基于原稿的翻译
可见,早在几年前,经过训练的人工智能就已经能够根据人们的需求生成各种文章。
而现在,要创作日更几千字的网文不在话下。
「地表最强语言模型」GPT-3,每天都能创作45亿个字符。
然而,这类语言模型大多数只能为用户提供有限的交互支持。
此外,如果为每一个功能都单独训练语言模型,成本又太高。
为解决上述问题,谷歌研究院的一个团队提出了Wordcraft文本编辑器,是一个由AI驱动的创意写作助手。
Wordcraft仅需少量样本学习和对话,就能提供各种用户交互,支持各种故事写作任务,还可以帮助作家规划故事大纲、写作和编辑。
比如上学时最让人头大的文章续写和改写。
此外,团队还探讨了Wordcraft的独特优势:使用对话模型而非通用语言模型。
故事写作这个环境能够探索语言模型的能力和局限性,因为模型非预期的输出就是一种创造。
从人机交互的角度来看,Wordcraft可以学习人们与语言模型互动的方式、了解人们对模型的要求、模型能够产出什么,以及如何反馈到人们最终的创造中。
研究团队还计划将人类反馈纳入循环训练中,收集动态数据集,用于后续的训练和评估。
谷歌AI码字助手
谷歌的研究人员构建了一个AI助手,可以在创作的不同阶段为用户提供自然语言生成支持。
- 规划:勾勒故事的大纲
- 写作:创作故事的内容
- 编辑:改写现有的文字
搭载了AI助手的文本编辑器外观看起来十分的简单,左侧是空白的写作区域,右侧是引导AI的操作按钮以及AI生成的文本。
根据用户需求的不同,编辑器会给出不同的交互选项。
一问一答,轻松搞定
作者对Meena和GPLM两种语言模型进行了测试,其中,Meena会将之前的对话内容为输入并预测下一个对话,而GPLM则是根据给出的前文进行续写。
经过实验,作者发现相比于规模相似但没有经过对话训练的通用语言模型(GPLM),Meena在这类任务中要更胜一筹。
于是,研究人员最终选择了Meena,并认为这种模仿故事作者和助手之间对话的形式,可以更好的帮助用户进行故事的创作。
对于每个任务,作者为不同的任务创作了多个阶段性的对话
用户要求重写「一把剑」,模型将故事附加到相应的对话环境中,并要求AI做出回应
作者发现,由于人类很熟悉对话这种形式,所以只需进行少样本学习就可以产生非常自然的输出。
此外,当对话模型不理解任务,或者需要更多的信息时,它会直接「说出来」:
「一位老人独自坐在一条黑暗的小路上。一道闪电照亮了天空。」帮我描述这位老人的情绪状态。
我不明白你在问什么……
这是一道快乐的闪电吗?还是乌云密布的闪电?
那人在闪电之前在做什么?他做了一些可能会刺激情绪和想法的事情吗?
作者认为,这样的回答可以帮助用户弄清楚如何改进他们的提示。而GPLM在遇到不清晰的提示时,则会经常产生无意义的续写。
不仅如此,在对话中用户可能会问:「角色应该做什么来解决冲突?」
在这种情况下,用户显然是在寻找一个写作伙伴,而不是一个简单地续写文本的模型。
续写
续写是语言模型执行的最基本任务。
为了帮助对话式模型更好地理解任务,作者用描述性的文字对问题进行了改进。
以下是我到目前为止写的故事:「一位老人独自坐在一条黑暗的小路上。」给我下一句话的续写。
根据上面这个输入,模型给出的建议是:
空气很冷,但他内心很温暖。他遇到了一块空地,空地的中间有一棵古老的柳树。
向他走去,这个人可以看到一个小小的身影,被远处的灯光照亮。
圆月闪闪发光。