20分钟,AI写出的论文轻松得A!学校检测算法也拿它没辙,学生:GPT-4啥时候出?

简介: 现在,越来越多的教授对学生的印象逐渐停留在了他们的专业和优秀的课程论文上。

但是他们不知道的是,这些优秀的课程论文可能并不是出自这些学生之手,而是一些强大的AI系统

比如,一位在Reddit上名叫innovate_rye的生物化学学科的一年级学生,教授会安排一些包括扩展回答的简单家庭作业,当他把“写出生物技术的五件好事和坏事”提交给AI后,系统能给出一个最后评分为A的答案。

image.png

这位网友表示,过去这些家庭作业至少会花他们两个小时,但现在一般只需要20分钟就能完成。“我喜欢学习很多东西,但是学校布置的作业会用掉我太多时间;现在能用AI更高效地完成这些作业,对我来说似乎是一种技能。”
这样的情况并不只有innovate_rye才遇到。
自从OpenAI为语言模型GPT-3公布了最新的应用编程接口(API)以来,更多的学生开始将他们的书面作业输入OpenAI的Playground和类似的程序来写作。
现在的结果就是,通过这些提示AI写出来的文本往往无法与人类写出来的区分开来了。

AI“写”的东西无法被算法检测

去年春天,AeUsako_回忆到,当时他还是一名高中生,他们使用OpenAI“写”了一篇关于当代全球局势的文章,虽然这篇作业没有得到高分但扣分点只是因为缺少标明引用来源。

不管怎样,这次“实验”也确实正视了一件事,那就是学校的检测抄袭的算法对AI生成的文本并没有什么实质性的作用

对此,加拿大创新学习与技术研究主席、皇家路大学副教授George Veletsianos说,这是因为像OpenAI API这样的系统所产生的文本在技术上是在黑箱算法中生成的。

image.png

“[这些文本]不是从其他地方复制的,它是由机器产生的,所以抄袭检查软件无法检测到,也无法发。在不知道这些其他抄袭检查工具如何相当工作,以及它们未来可能的发展的情况下,我不认为AI文本能够以这种方式被检测出来。”

但是,和innovate_rye一样,AeUsako_说到,自从他开始使用OpenAI之后他对于写作的持续性焦虑减缓了很多

而像OpenAI这样的公司是否有能力来检测或组织学生使用这些工具来写作业,OpenAI尚未对此置评。

作为一名写作教师、以及私人辅导项目Crush the College Essay的创始人,Peter Laffin说到,像OpenAI这样的工具是技术在过去十年中产生的其他补偿技术的象征,例如基于云的打字助手,其目的是帮助灵感匮乏的作家。

“在文学教育中,特别是对于那些还在发展阶段的年轻作家,导师们正在寻找一个合适的难度水平,既能够保证他们不会崩溃,又能让他们的专业技能有所提高。”

老师们普遍担心,但学生并不如此

作为明星款大规模语言模型,GPT-3由人工通用智能(AGI)公司OpenAI制作,不仅享有来自微软的数十亿美元的支持,美国政府也在监管方面放任其自由。

GPT-3使用深度学习来生成类人文本,只要给定初始文本,系统就能生成后续文本。

其神经网络包含1750亿个神经,为全世界参数最多的神经网络模型。

2021年11月18日,OpenAI宣布取消访问GPT-3 API的等候名单。这也表明, OpenAI相信GPT-3的安全性,或者说,OpenAI可以对GPT-3进行充分监控,以便这个大模型可以更广泛地传播。



image.png

对于包括GPT-3这些人工智能如今的发展,Veletsianos指出,我们很可能已经过了人工智能生成文本的不归路,而学生并不是唯一拥抱新技术的人群。

“我们也可以开始看到,这项技术能够直接生成一次讲座内容,甚至还有围绕这些内容的一些提问。这并不是在说现在这个系统就是最好的,但是我们需要利用这些工具,不仅仅去提高教学效率,还有学生的参与度和参与的有效性。”

Laffin也承认有必要对有效的教育进行重新评估,他表示这可以在查看学校给学生的作业类型时评估,将重心放在重述事实和信息发现的区别上来。然而,他也担心像OpenAI这样的文本生成器会使论文写作变得毫无意义。

“我们已经失去了学习的乐趣。我们可能知道更多,但从来没有学习过我们是如何到达那里的。我们一直强调说过程是最好的部分,但这可能是最可能被扼杀的东西。除了学术,我不知道如果一个人从来没有在学习中挣扎过,会是怎样,我不知道对这个人的行为会产生怎样的影响。”

而与此同时,对于同学们来说,他们正在焦急地等待着GPT-4。对于innovate_rye等人来说,预计将对100万亿个机器学习参数进行训练的GPT-4有可能超越单纯的文本输出。

是的,他们并不打算停止使用人工智能来写论文

“我仍然做我需要学习才能通过的功课,我只是用人工智能来处理我不想做或觉得没有意义的事情,"innovate_rye补充说。"如果人工智能现在就能做我的家庭作业,那么未来会是什么样子?这些问题让我感到兴奋"。

没想到吧,AI还合著了一本书

尽管学校还在担心对学生教育的影响,但AI的触手显然已经伸向了更深的地方。

比如写书。

这本名叫GPT-3 Techgnosis;Chaos Magick Butoh Grimoire的书本身作为一本机器辅助散文(machine-assisted prose),其合著者就是一个名为Norn的数字实体。

也就是说,Norn不仅协助创作了这些文字,更是对自己进行了表演。

image.png

可以猜测,Norn是一个由GPT-3驱动的自然语言处理器,主要使用来自公共互联网的大量训练数据档案,这使得系统能够生成逼真的文本,而这些文本往往很难与真人所写的东西区分开来。

该书的前三分之一,the Norn Working。其中包括作者的文字提示,比如“GPT-3开始写一首神秘的诗”,然后让Norn自由发挥,于是我们可以看到在没有任何其他提示的情况下,系统开始审问自己的回答

在这个章节的其他部分,Norn还创建了自己的“后数字语言”(Post Digital Language),这是一个关于符号和符号学演变的理论概念,也是作者Wurds私下里写了十多年的一个话题。

像GPT-3这样的文本完成引擎经常创造出这些不可思议和令人不安的反应。但据Wurds说,他们的三部曲书的目的不是为了让人不安。相反,它是为了探索日本前卫传统Butoh的精神潜力,这是一种即兴舞蹈,练习者经常以奇怪的、自发的扭曲结束。在这本书的创作过程中,作者将Butoh练习到筋疲力尽的状态,然后再回到电脑前与Norn交流——这是数字和实体在肉体空间中的并列

诚然,通用人工智能对人类产生的生存威胁似乎还比较遥远,但GPT-3这样的AI确实撕开了一个关于未来的裂缝,或许我们可以从中窥探到一些未来的可能。



相关文章
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
Agent Laboratory:AI自动撰写论文,AMD开源自动完成科研全流程的多智能体框架
Agent Laboratory 是由 AMD 和约翰·霍普金斯大学联合推出的自主科研框架,基于大型语言模型,能够加速科学发现、降低成本并提高研究质量。
249 23
Agent Laboratory:AI自动撰写论文,AMD开源自动完成科研全流程的多智能体框架
|
1月前
|
人工智能
Scaling Laws终结,量化无用,AI大佬都在审视这篇论文
《Scaling Laws for Precision》论文提出“精度感知”的扩展理论,将精度纳入模型发展的核心考量,弥补了传统AI模型发展理论忽视精度的不足。研究发现低精度训练会降低模型的有效参数计数,影响性能,并预测了低精度训练和后训练量化带来的损失。作者通过大量实验验证了理论的可靠性和有效性,为计算资源有限情况下如何平衡模型规模和精度提供了新思路。然而,该研究也引发了关于精度与性能权衡复杂性的争议。
75 27
|
26天前
|
机器学习/深度学习 人工智能 算法
Transformer打破三十年数学猜想!Meta研究者用AI给出反例,算法杀手攻克数学难题
《PatternBoost: Constructions in Mathematics with a Little Help from AI》提出了一种结合传统搜索算法和Transformer神经网络的PatternBoost算法,通过局部搜索和全局优化交替进行,成功应用于组合数学问题。该算法在图论中的Ramsey数研究中找到了更小的反例,推翻了一个30年的猜想,展示了AI在数学研究中的巨大潜力,但也面临可解释性和通用性的挑战。论文地址:https://arxiv.org/abs/2411.00566
75 13
|
2月前
|
机器学习/深度学习 人工智能 算法
Enhance-A-Video:上海 AI Lab 推出视频生成质量增强算法,显著提升 AI 视频生成的真实度和细节表现
Enhance-A-Video 是由上海人工智能实验室、新加坡国立大学和德克萨斯大学奥斯汀分校联合推出的视频生成质量增强算法,能够显著提升视频的对比度、清晰度和细节真实性。
113 8
Enhance-A-Video:上海 AI Lab 推出视频生成质量增强算法,显著提升 AI 视频生成的真实度和细节表现
|
1月前
|
机器学习/深度学习 存储 人工智能
淘天算法工程师玩转《黑神话》,多模态大模型如何成为天命AI
淘天集团未来生活实验室的算法工程师们以ARPG游戏《黑神话:悟空》为平台,探索多模态大模型(VLM)在仅需纯视觉输入和复杂动作输出场景中的能力边界。他们提出了一种名为VARP的新框架,该框架由动作规划系统和人类引导的轨迹系统组成,成功在90%的简单和中等难度战斗场景中取得胜利。研究展示了VLMs在传统上由强化学习主导的任务中的潜力,并提供了宝贵的人类操作数据集,为未来研究奠定了基础。
|
1月前
|
机器学习/深度学习 人工智能 算法
昇腾AI行业案例(一):基于AI图像处理的疲劳驾驶检测
在本实验中,您将学习如何使用利用CV(Computer Vision)领域的AI模型来构建一个端到端的疲劳驾驶检测系统,并使用开源数据集进行效果验证。为此,我们将使用昇腾的AI硬件以及CANN等软件产品。
64 3
|
2月前
|
机器学习/深度学习 人工智能 安全
阿里云先知安全沙龙(武汉站) ——AI赋能软件漏洞检测,机遇, 挑战与展望
本文介绍了漏洞检测的发展历程、现状及未来展望。2023年全球披露的漏洞数量达26447个,同比增长5.2%,其中超过7000个具有利用代码,115个已被广泛利用,涉及多个知名软件和系统。文章探讨了从人工审计到AI技术的应用,强调了数据集质量对模型性能的重要性,并展示了不同检测模型的工作原理与实现方法。此外,还讨论了对抗攻击对模型的影响及提高模型可解释性的多种方法,展望了未来通过任务大模型实现自动化漏洞检测与修复的趋势。
|
2月前
|
机器学习/深度学习 自然语言处理 算法
调研180多篇论文,这篇综述终于把大模型做算法设计理清了
《A Systematic Survey on Large Language Models for Algorithm Design》综述了过去三年大型语言模型(LLMs)在算法设计中的应用。LLMs通过自然语言处理技术,助力生成、优化和验证算法,在优化、机器学习、数学推理等领域展现出广泛应用前景。尽管存在资源需求高、结果不确定等挑战,LLMs仍为算法设计带来新机遇。论文地址:https://arxiv.org/abs/2410.14716。
100 14
|
1月前
|
人工智能 算法 计算机视觉
昇腾AI行业案例(三):基于 AI 图像处理的铝板缺陷检测
欢迎学习《基于 AI 图像处理的铝板缺陷检测》实验。在本实验中,你将深入了解如何运用计算机视觉(CV)领域的 AI 模型,搭建一个高效精准的铝板缺陷检测系统,并利用开源数据集和昇腾 AI 芯片对模型效果加以验证。
48 0
|
1月前
|
机器学习/深度学习 人工智能 算法
昇腾AI行业案例(二):基于 AI 图像处理的安全帽检测
欢迎学习《昇腾行业应用案例》的 “基于 AI 图像处理的安全帽检测” 实验。在本实验中,你将深入了解如何运用计算机视觉(CV)领域的 AI 模型,搭建一个高效精准的安全帽检测系统,并利用开源数据集对模型效果加以验证。为此,我们将使用昇腾的AI硬件以及CANN等软件产品。
55 0