看起来,提问的「措辞」很重要:
另一位用户则提问:「曼联下一场比赛是什么时候?」youChat 答:「2022 年 1 月 15 日。」
这位用户真诚地建议:「是时候让它停止产生幻觉了。」
问答模型爆火之后
ChatGPT 能在 2022 年底成为 AI 界顶流,是因为它掌握广泛的基本知识,特别是在编程方面,甚至有人认为 ChatGPT 将取代搜索引擎。
据外媒 VentureBeat 报道,在 Forrester 公司分析师 Rowan Curran 看来,生成式 AI 此刻面临的时机至关重要:「我唯一能够比较的是 iPhone 的发布。苹果公司的 iPhone 不是第一款智能手机,但它以其触摸屏、易用性和引入的应用程序埋葬了竞争对手,将完整的计算体验放进了人们的口袋。」
短短几天就涌入了百万数量级的用户,的确验证了 ChatGPT 的受欢迎程度。另一方面,ChatGPT 也在改变公众对可能性的认知。
作为一个问答语言模型,ChatGPT 首先以出色的回答给人以深刻的印象。比如,它可以和人们就「现代物理学的发展史」高谈阔论 20 分钟:
询问计算机相关的知识,更是对答如流,例如解释正则表达式的含义:
在编程方面,ChatGPT 还能自动写程序,找 bug:
关于 ChatGPT 是否会取代现有的搜索引擎,我们需要分析一下 ChatGPT 的能力和短板。尽管作为一个语言模型,它能够给出逻辑清晰,又不乏知识性的回答,但不是所有的回答都是完全正确的。
上线几天之后,Stack Overflow 就宣布封禁了 ChatGPT,原因是 ChatGPT 生成的答案错误率很高,并且错误不容易发现。这会给使用 Stack Overflow 查询编程问题的用户带来非常大的困扰。
我们知道,搜索引擎能被广泛接受和使用,除了它方便快速,更重要的是搜索到的信息正确率是很高的,并且一些百科网站也在不断完善知识的覆盖面和准确性,这需要大量的人工校对和专业知识。而 ChatGPT 等 AI 语言模型的现状是生成功能强大,但知识的准确性很难有保证。
知识型模型是近期学术界和业内努力探索的一个方向。人们希望未来的 AI 是掌握大量科学知识的,进而实现通用人工智能(AGI)。但从目前的工作看,构建知识型模型还差得很远。例如,前段时间 Meta 的模型 Galactica 上线仅两天就火速下架,因为该模型生成的知识性内容存在严重错误。
现在,无论是 OpenAI 强势推出的 ChatGPT,还是最新出炉的 youChat,都不满足知识准确无误这一基本要求。从这个意义上讲,大规模语言模型和搜索引擎还相距甚远。
或许 youChat 和 ChatGPT 有几分相似,但它们在回答正确性方面还有很大的提升空间。
参考链接:
https://venturebeat.com/ai/why-this-chatgpt-moment-harks-back-to-the-original-iphone/