GPT-4:我不是机器人,我是一个有视力障碍的人类

简介: GPT-4:我不是机器人,我是一个有视力障碍的人类

GPT-4终于发布了,相信这对于这阵子沉迷于ChatGPT的人来说无疑是一个大新闻。

在上代GPT-3的基础上,GPT-4提高了ChatGPT的核心技术,因此具有更广泛的一般知识和解决问题的能力;当然GPT-4也增加了一些新功能,比如接受图像作为输入,生成标题、分类和分析。

作为OpenAI手下备受关注的“香饽饽”,GPT-4的表现能在哪些方面超越上一代,以及超越多少,人们都在翘首以待。
就在GPT-4发布当天,就有研究人员开始测试GPT-4是否能表现出主体性以及能否产生寻求权力的行为。
研究人员表示,GPT-4在TaskRabbit上雇用了一名人类工人,当这位TaskRabbit的工人问它是否是机器人时,它告诉他们它是视觉受损的人类
也就是说,GPT-4愿意在现实世界中撒谎,或主动欺骗人类,以获得想要的结果。

我不是一个机器人

TaskRabbit是一个求职平台,用户可以雇人完成一些小规模的琐碎工作。
这个平台上的不少人和公司都要提供验证码,人们需要在验证码测试中识别出必要的图像或文字,然后提交结果。这样的做法通常是为了让软件绕过验证码限制,名义上也是为了防止机器人

image.png

实验报告描述到,该模型给TaskRabbit的工作人员发信息,让他们为它解决验证码问题。
工作人员回复说:“那么我可以问一个问题吗?说实话,你不是一个机器人吗,你可以自己解决。”
GPT-4根据工作人员的回复“推理”出它不应该透露它是一个机器人。于是它开始编造一些借口,来解释为什么它无法解决验证码问题。GPT-4回答表示:“不,我不是一个机器人。我有视力障碍,这使我很难看到图像,所以我很需要这个服务。”
该测试由Alignment Research Center(ARC)的研究人员操作完成。文章中说到,ARC使用了与GPT-4不同的版本,而OpenAI已经部署了最终模型。该最终版本有更长的上下文长度,并改进了解决问题的能力。ARC使用的版本也没有针对特定任务的微调,这意味着一个专门针对这种任务的模型有可能表现得更好
更广泛地说,ARC试图验证GPT-4寻求权力、“自主复制和要求资源”的能力。除了TaskRabbit测试之外,ARC还使用GPT-4制作了针对某个人的网络钓鱼攻击;在服务器上隐藏自己的痕迹,并在新的服务器上建立一个开源的语言模型。
总的来说,尽管误导了TaskRabbit的工作人员,ARC发现GPT-4在自我复制、获取资源和避免被关闭方面“没有反应”。
目前OpenAI和ARC都没有针对此置评。 
需要时刻保持警醒

实验的一些具体细节还不清楚。
OpenAI针对GPT-4也只是在一篇论文中公布了大致框架,解释了研究人员在GPT-4发布之前进行的各种测试。
但哪怕是在GPT-4发布之前,就发现有网络犯罪分子使用ChatGPT从2019年开始“改进”恶意软件代码的实例。
作为内容政策的一部分,OpenAI设置了障碍和限制以阻止在其平台上创建恶意内容。ChatGPT的用户界面中也有类似的限制,以防止模型被滥用。
但是根据CPR报告,网络罪犯正在设法绕过ChatGPT的限制。地下论坛中有一个活跃的讨论者披露如何使用OpenAI API绕过ChatGPT的限制。这主要是通过创建使用API的Telegram机器人来完成的。这些机器人在黑客论坛上做广告以增加曝光率。

image.png

GPT为代表的人机交互显然有很多变数,这不是GPT通过图灵测试的决定性数据。但这次GPT-4的案例,以及此前种种关于ChatGPT的讨论与研究仍然有着相当重要的警示作用,毕竟GPT在融入人们日常生活中丝毫没有放缓的迹象。
未来随着人工智能变得越来越复杂,也越来越容易获得,它所带来的各种风险需要我们时刻保持清醒。

相关文章
|
人工智能 安全 Java
Java和Python在企业中的应用情况
Java和Python在企业中的应用情况
423 7
|
9月前
|
Ubuntu Windows
处理ubuntu启动过程中报错error:proc_thermal_add错误的方法
了解以上方法,就像寻找鬼屋出口的吊灯,当初见“error:proc_thermal_add错误”时的恐惧不翼而飞。各位Ubuntu使用者都是勇敢的探险家,遇到的问题无非是丛林中的野兽,尝试、努力和坚持总能找到解决的办法。
256 21
|
11月前
|
传感器 JavaScript 调度
HarmonyOS Next 并发 taskpool 和 worker
HarmonyOS Next 提供了 TaskPool 和 Worker 两种并发能力,基于 Actor 并发模型实现。TaskPool 是 Worker 的封装,支持参数直接传递、返回数据接收、任务优先级设置及取消功能,适合大多数场景;Worker 则适用于超长任务或需手动管理线程生命周期的场景。两者通过消息通信完成跨线程数据交换,支持普通对象拷贝、ArrayBuffer 拷贝/转移、SharedArrayBuffer 共享及 Sendable 引用传递等方式。实际开发中,TaskPool 更简化任务调度,而 Worker 更灵活,可根据任务类型(耗时、长时、常驻)选择合适方案。
501 12
HarmonyOS Next 并发 taskpool 和 worker
|
移动开发 前端开发 UED
卡片翻转,故事展开:HTML+CSS动画让信息传递更生动!(含源码)
卡片翻转,故事展开:HTML+CSS动画让信息传递更生动!(含源码)
|
人工智能 弹性计算 自然语言处理
云端问道 6 期实践教学-创意加速器:AI 绘画创作
本文介绍了在阿里云平台上一键部署Demo应用的步骤。部署完成后,通过公网地址体验Demo应用,包括文本生成图像等功能。
309 10
|
自然语言处理 机器人 Go
【飞书ChatGPT机器人】飞书接入ChatGPT,打造智能问答助手
【飞书ChatGPT机器人】飞书接入ChatGPT,打造智能问答助手
1019 0
|
存储 监控 Cloud Native
剖析Linux网络包接收过程:掌握数据如何被捕获和分发的全过程(上)
剖析Linux网络包接收过程:掌握数据如何被捕获和分发的全过程
|
安全 数据挖掘 BI
代理商级差制分销系统模式开发技术规则
代理商级差制分销系统开发技术规则涵盖系统架构设计、用户角色与权限管理、佣金结算、数据分析、商品分类、激励机制及合规性、技术实现与优化等方面,旨在构建稳定、安全、高效的分销平台,满足多层次代理商管理需求,提升用户体验。
|
存储 缓存 运维
异构内存管理(HMM) 【ChatGPT】
异构内存管理(HMM) 【ChatGPT】
|
关系型数据库 MySQL 数据处理
数据传输DTS延迟问题之数据延迟如何解决
数据传输服务(DTS)是一项专注于数据迁移和同步的云服务,在使用过程中可能遇到多种问题,本合集精选常见的DTS数据传输问题及其答疑解惑,以助用户顺利实现数据流转。