引言
在数字经济的挑战面前,人工智能生成内容(Artificial Intelligence Generated Content,AIGC)应运而生。AIGC是一种新型的内容创造方式,通过使用人工智能(AI)技术,根据用户输入的关键词或需求生成内容。大型模型算法的发展极大地增强了AIGC的能力,使AIGC产品成为一种有前景的生成工具,并为我们的生活带来了便利。作为上游技术,AIGC具有无限的潜力来支持不同的下游应用。分析AIGC的当前能力和短板,理解如何在未来的应用中最好地利用它,这是非常重要的12。
AIGC的发展历程
实际上,AIGC的起源可以追溯到更早的时期。其发展历程大致可以分为三个阶段。在第一阶段,研究人员通过最原始的编程技术控制计算机实现内容的输出。例如,Hiller和Isaacson在1957年完成了世界上第一部由计算机完成的音乐,Iliac Suite。然后,世界上第一个人机交互机器人Eliza出现了。Eliza展示了通过模式匹配和智能短语搜索合适答案的能力,但并没有反映出语义理解。然而,大多数人仍然把Eliza视为现代AI的灵感来源。在接下来的二十年里,这是沉淀积累的阶段。
第二阶段认为,由于大规模数据库的普遍可用性和计算设备性能的进步,AIGC的进步被视为一种可用性。"The Road"是世界上第一部完全由AI创作的小说。之后,微软也展示了一个全自动的即时翻译系统,该系统能够在短时间内准确地将英语翻译成中文。然而,算法的瓶颈直接限制了AIGC生成丰富内容的能力。
第三阶段始于2010年,当时AIGC进入了快速发展阶段。Goodfellow提出了一种通用对抗网络(GAN),该网络使用现有数据生成图片。2022年,OpenAI发布了一个新的聊天机器人模型,名为ChatGPT。它能够理解人类语言,并生成类似人类的文本。在两个月内,每月活跃用户超过了1亿。到2023年1月,每天
Finished browsing
有大约13百万的独立访客每天使用ChatGPT。随着产品(如ChatGPT)的改进,AIGC已经显示出对应用和商业价值的巨大潜力。它已经吸引了各个领域,包括企业家、投资者、学者和公众的广泛关注1。
AIGC的主要技术和应用
目前,AIGC内容的质量已经比以前好得多。此外,AIGC内容的类型也已经丰富化,包括文本、图像、视频、代码等。例如,ChatGPT是一个基于大型语言模型(LLM)的机器学习系统。经过对大量幽默文本数据集的训练,LLM不仅擅长生成合理的对话,还能产生引人入胜的作品(如故事和文章)。由于其独特的人类反馈训练过程,ChatGPT能够更精确地理解人类的思维。此外,谷歌声称他们即将推出的产品Bard将具有同样的功能,但更侧重于生成对话。与ChatGPT相比,Bard可以利用外部知识源,通过提供对自然语言问题的答案而不是搜索结果,帮助用户解决问题。此外,微软的Turning-NLG是一个具有170亿参数的LLM,它被应用于摘要、翻译和问答2。