@[toc]
如何客观的分析 ChatGPT技术
1、GPT 自己的分析
2、我的理解
OpenAI 发布的基于 GPT-3 模型构建的 ChatAI ,使用起来有许多的惊艳之处,但是我们也不得不看到他的局限性
GPT-3 是一个预训练模型,预训练模型有很多的不足之处仍然需要攻关
3、预训练模型
预训练模型会事先采集海量的数据,对 AI 模型进行训练,但是运行这些预训练模型存在如下的限制或者困难
- 构建一个预训练模型需要至少数千万美元,这是一个极大的门槛(创建和使用)
- 预训练模型需要大量的 GPU 才可以加载(服务门槛)
- 作为后来者使用预训练模型进行创新时,如何保证数据对齐对他们来说是一个巨大的挑战
- 基于预训练的模型会在之前的海量数据中,对某些事情存在偏见 (这意味着海量媒体数据可以引导模型走向)
- 预训练模型无法得到数据的时效性,对于数据集后面发生的事情无法知道
4、ChatGPT 的隐患 (prompt 注入)
gpt 除了要解决时效性问题,还要解决信息源的问题,他的一些内容还需要进行各种的交叉验证,大众对于gpt的答案大多无法验证,
这会导致错误的内容普遍性的传递给大众
尽管 ChatGPT 内部被硬编码了与政策相关的内容,但是用户仍然可以通过让 AI 扮演某些角色而突破这个限制
甚至可以通过让 AI 扮演角色来执行未被开发人员启用的能力,而这些能力可能导致信息泄露、不受控制的言论
传递给大众并引起人们的偏见