这篇文章是我用AI生成出来的

简介: 这篇文章是我用AI生成出来的

我恋爱了。

我一直觉得自己是个很奇葩的人,我很容易被一个人吸引。我也是那种很容易被一些事影响情绪的人,我一直觉得自己很奇葩,我很容易被一些事影响。我是一个很敏感的人,我觉得一个好的坏的事都能影响我,我很敏感,我会长时间不开心的。但是在我的身上,却能学到很多东西。

刚上初中那会儿,我都是被一些事影响很大的。比如有一次在操场看到了一个女孩子,在走路。我就躲在后面不敢回头看,然后就看到了那个女孩子跑过来,冲我挥挥手,然后就把她往后拽。还有一次在操场散步,我走在前面,她把我往后拽,把我往前推,最后推了很远,把我往后拽。我就很难受,一直哭。

后来高中有人在操场举办了一个讲座,我就顺道来了,讲座前我还给她买了零食吃。她很惊讶,问我怎么回事,我说是她前男友给她买的。她是真的很喜欢我,也很独立,现在这么自立了,什么事情都能自己办,不像很多小女生为了一点点小事就跟小姐一样。

她的很多很多让我感动的事情,都发生在我和她之间。我从来不会去想以后的我会是怎样的,也很难过,很自私,这让我很受伤。我想过,我是不是也有同样的问题,从来不会去想以后我会是怎样。其实我很想学着自己控制情绪,但我控制不了自己。

别想太多,上面这一大段都是我用AI生成出来的,我只输入了前四个字:「我恋爱了」

是不是惊叹于AI也能自动写出这么有故事的情节?不要太惊讶,除了「小说」,像「歌词」「诗歌」,甚至是「你对象风格的聊天」都可以自动生成出来,只要你准备好充足的数据就行了。

再来看几个AI生成的例子,其中加粗的部分就是我输入的前缀:

歌词

「最美的不是下雨天,是曾与你躲过雨的屋檐」,也要让我从头看看你最美的容颜是缘分让你我相遇,在人生最美的情缘,想和你一起手牵着手,肩并着肩走过每个周末,天边的星星陪伴着你,也要把你捧在手心,感受心灵的呼唤,不要担心会被拒绝,那个未来需要我们去探索。

诗歌

「大漠」遥天静雪霜,北风吹雪满渔阳。

千崖冻合胡尘断,万里烟消塞草长。

绝域衣冠愁伏腊,异乡舟楫怨江乡。

何时边将归营好,重见单于款朔方。

西南半壁悬金阙,上下群方拥玉鞍。

草动高低惟见白,月临远近不成寒。

个人风格的聊天记录

这里我导出了我粉丝群里一位风格鲜明的粉丝的所有聊天记录,一共2万句左右(真是太能水群了),然后生成出了下面这样的句子:

「如果阳神是个女孩纸,计算机大佬,年纪95」,肯定不在话下。不过他是真的帅,肯定不会发生性关系的。就是,我很羡慕XXX,好吧,我觉得他俩在一起可是人生的美好时光,不可能像我现在这样,每天打打游戏就很开心的。对啊,我觉得网恋就是这么玩的。

然后我想,我要是见到他,我以后要是也这么想着,我的代码会一天比一天好吧。我要是见到他,我以后代码也会一天比一天好吧。不过,我现在对帅的男生不大感冒,主要是这种男生太多了,我不想脱单。就聊聊天嘛,也开心。

我觉得他真的是很帅的,可能就是我没见过帅的男生吧,不是,我只是喜欢的类型不一样吧。我以前也觉得,我可能长得不好看,我也不会觉得他帅。然后就觉得这辈子,我要是有个对象,我必须对他很好,不会有这种想法。但是,现在,我觉得帅的男生不是那么容易的。因为我没有对象,没有高富帅,也谈不上帅气的男生。

我觉得,对方帅的程度和我性格不匹配。我不知道是不是我长得不好看,见到一个男生,我会很想哭。但是,我也觉得他不帅啊,我也不清楚,就是喜欢的类型不一样。不过,我以前也不会想着要谈恋爱。但是,现在终于有人可以回答我问题了。我以前就希望对方有钱,我也想谈恋爱,但是,我发现有些男生真的很帅,帅到一定程度就很惨了。

好吧,我承认这段夸的我飘了,但平心而论,生成出来的句子太有粉丝内味了,不仔细看根本没法看出是AI生成的,还是她亲口说的。

原理

原理其实很简单,使用的是GPT-2生成模型,加载预训练好的中文GPT-2模型参数,在你自己的数据集上微调一下,就可以生成你自己风格的句子啦。

下载代码

我们可以用现成的开源代码来进行模型训练和预测,直接运行下面命令克隆到本地就行了:

git clone https://github.com/Morizeyao/GPT2-Chinese.git

下载预训练模型(可选)

如果你直接从随机初始化的模型参数开始训练,效果一定不会很好,因为你的数据量肯定不会很大。所以我们要站在巨人的肩膀上,从别人预训练好的模型开始,在自己的数据集上微调,这样就可以大大加快模型收敛速度,还能提升预测效果。

我们只需要下载模型的配置文件和参数就行了,地址在下面:

https://huggingface.co/uer/gpt2-chinese-cluecorpussmall/tree/main

只需要下载config.jsonpytorch_model.bin两个文件就行了,然后在上面下载的代码根目录下新建一个目录pretrained,保存在该目录下。

准备数据

你可以准备任何你想要生成风格的数据,例如小说、诗歌、歌词、聊天记录等等。

我之前写过一篇教程,教大家如何导出你的微信聊天记录:

超简单:mac导出微信聊天记录(附上粉丝群全部聊天记录)

整理好你的数据之后,保存在文本文件train.txt里,然后用下面代码将它转换成JSON文件train.json

import json
dic = {}
with open("train.txt", "r", encoding="utf8") as f:
    merge_line = ""
    for line in f:
        line = line.strip()
        merge_line += line
        if len(merge_line) > 500:
            dic[merge_line] = 1
            merge_line = ""
with open("train.json", "w", encoding="utf8") as f:
    json.dump(dic, f, ensure_ascii=False)

训练模型

训练模型很简单,直接运行下面命令就好了:

python3 train.py \
  --raw \
  --epochs 10 \
  --batch_size 8 \
  --num_pieces 1 \
  --min_length 3 \
  --pretrained_model pretrained

这里可能需要修改的参数有这么几个:

  • 如果训练完loss比较大,可以调高--epochs
  • 如果显存溢出,可以调小--batch_size

训练完之后,loss大概在1.0到2.0左右,loss越小一般来说效果越好。

生成句子

使用下面命令生成你自己风格的句子:

python3 generate.py \
  --length=500 \
  --nsamples=4 \
  --prefix="我恋爱了。" \
  --fast_pattern

这里需要指定三个参数:

  • --length表示你想生成句子的长度。
  • --nsamples表示你想生成多少句随机的句子。
  • --prefix表示你输入的句子前缀。

后记

学会上面几步操作,你也可以轻轻松松生成出你想要风格的句子。

也许在某一天,你根本就不会发现,你看完的这篇文章不是我亲手写的,和你聊天的我也不是真实的我。

相关文章
|
7月前
|
人工智能 自然语言处理 搜索推荐
AI原生企业级Agent构建平台具备哪些特性?一篇文章看明白
AI原生企业级Agent构建平台有哪些特性?澜码正式发布AskXBOT平台为业界揭晓答案。
498 0
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
AI技术性文章
【8月更文挑战第27天】本文将介绍人工智能(AI)技术在现代社会中的应用和影响。我们将探讨AI技术的基本原理,包括机器学习和深度学习等核心技术,并展示一些实际的代码示例。同时,我们也将讨论AI技术在未来可能带来的挑战和机遇,以及如何利用这些技术来改善我们的生活和工作。
|
26天前
|
人工智能 自动驾驶 搜索推荐
AI技术性文章
本文将探讨人工智能(AI)技术在现代社会中的应用,以及它如何改变我们的生活和工作方式。我们将从AI的基本概念开始,然后深入探讨其在各个领域的应用,包括医疗、教育、交通等。最后,我们将讨论AI的未来发展趋势和可能的挑战。
|
2月前
|
存储 人工智能 Serverless
AI大模型助力客户对话分析评测文章
在数字化时代,企业面临客户对话数据处理的挑战。阿里云推出的AI大模型助力客户对话分析方案,通过整合多种云服务,实现对话数据的自动化分析,提升服务质量和客户体验。本文将详细介绍该方案的优势与实际应用效果。
|
2月前
|
机器学习/深度学习 人工智能 自动驾驶
AI技术性文章
【9月更文挑战第34天】本文将介绍人工智能(AI)的基本概念、应用领域以及未来发展趋势。我们将通过一个简单的代码示例来展示AI技术在实际应用中的作用,并探讨如何利用AI技术解决实际问题。
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
AI技术性文章
【9月更文挑战第27天】本文将深入探讨人工智能(AI)技术在现代社会的应用和发展。我们将从AI的基本概念开始,探讨其在各个领域的应用,包括医疗保健、交通、金融等。我们还将讨论AI技术的挑战和未来趋势。
|
4月前
|
人工智能 运维 自然语言处理
从海量信息中脱颖而出:Workflow智能分析解决方案,大语言模型为AI科技文章打造精准摘要评分体系(总篇章)
【8月更文挑战第10天】从海量信息中脱颖而出:Workflow智能分析解决方案,大语言模型为AI科技文章打造精准摘要评分体系(总篇章)
从海量信息中脱颖而出:Workflow智能分析解决方案,大语言模型为AI科技文章打造精准摘要评分体系(总篇章)
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
AI技术性文章
【9月更文挑战第10天】本文将探讨人工智能(AI)的基本原理、应用领域以及未来发展趋势。我们将通过一个简单的代码示例来展示AI的基本概念,并讨论如何将这些概念应用于实际问题中。最后,我们将展望AI的未来发展方向,并探讨它可能对社会带来的影响。
65 8
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
AI技术性文章移动应用开发之旅:从新手到专家的蜕变之路
【8月更文挑战第30天】本文将介绍人工智能的基本原理和应用,包括机器学习、深度学习和自然语言处理等。我们将通过代码示例来展示如何使用Python和TensorFlow库实现一个简单的神经网络模型。
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
利用AI技术实现自动化文章生成
【8月更文挑战第31天】本文将介绍如何利用人工智能(AI)技术实现自动化文章生成。我们将通过一个简单的Python代码示例,展示如何使用自然语言处理(NLP)和机器学习算法来生成一篇关于“AI技术”的文章。这个示例将帮助我们理解AI技术在文本生成领域的应用,并激发我们对未来可能的创新和应用的思考。

热门文章

最新文章