看起来,现在的 GPT 已经不会在计算上胡言乱语了:
还是太简单,那直接让它做题,还是个物理题:
GPT-4 看懂了法语题目,并完整解答:
GPT-4 可以理解一张照片里「有什么不对劲的地方」:
GPT-4 还可以量子速读看论文,如果你给它 InstructGPT 的论文,让它总结摘要,就会变成这样:
如果你对论文里的某一个图感兴趣呢?GPT-4 也可以解释一下:
接着来,问 GPT-4 梗图是什么意思:
它给出了详细的回答:
那么漫画呢?
让 GPT-4 解释为什么要给神经网络加层数,似乎有一点加倍的幽默感。
不过 OpenAI 在这里说了,图像输入是研究预览,仍不公开。
研究人员用学术的 Benchmark 视角来解读 GPT-4 的看图能力,然而这已经不够了,他们还能不断发现该模型可以令人兴奋地处理新任务 —— 现在的矛盾是 AI 的能力和人类想象力之间的矛盾。
看到这里,应该有研究人员感叹:CV 不存在了。
可控性
与具有固定冗长、平静语气和风格的经典 ChatGPT 个性不同,开发人员(以及 ChatGPT 用户)现在可以通过在「系统」消息中描述这些方向来规定他们的 AI 的风格和任务。
系统消息允许 API 用户在一定范围内定制化实现不同的用户体验。OpenAI 知道你们在让 ChatGPT 玩 Cosplay,也鼓励你们这样做。