托福被取消?这个英语测试AI出题,2天出分,全球900+大学承认

简介: 托福被取消?这个英语测试AI出题,2天出分,全球900+大学承认

尽管国内的疫情已经逐渐放缓,但是全球感染情况却逐渐严峻起来。
始终未见“拐点”的疫情给准备申请出国的学生带来了极大的困扰,其中之一就是语言考试的取消。以托福为例,1月27日,托福宣布2月考试取消;一个月后,3月份的考试也宣布取消,同时官方强调在线模拟考试(TPO)服务不会受到影响,并将免费提供给考生。
现在正是申请季高峰,失去了两个月的考试时间对考生的申请无疑带来了巨大的难度,也给考生带来了不小的心理压力。
随着无人接触、线上平台借着疫情的逐渐发展,那么线上考试能否成为考生的救命稻草?
多邻国英语测试就是这么一个线上备考系统,这是多邻国旗下的英语能力测试系统,也是目前市场上唯一结合了AI技术的英语考试
多邻国英语测试的产品负责人Rogelio表示,传统英语考试的难度是递增的,这种模式耗时时间很长,考生必须从最低难度做起,经历完整的难度循环。但是,多邻国运用了人工智能和机器学习的最新技术,自适应适配考生的英语水平,直接将考试时间缩减了4倍,考生的考试时间也直接缩短到了45分钟内而且,多邻国的英语成绩也逐渐得到全球范围内众多高校的认可,世界范围内900余所大学的招生体系都表示承认多邻国的英语成绩,其中80%为美国院校,包括耶鲁大学,哥伦比亚大学,纽约大学,南加州大学,杜克大学等顶级名校等顶级名校。

和托福雅思一样,考生只需使用电脑就能完成测试,但是,在考试结束后48小时之内就可以收到考试结果,这和托福雅思相比,效率不是一般的快。考生也无需提前几个月预约考位,只要对摄像头出示相关身份进行自证后,在自己状态好的任意时间段内进行测试。
考试费仅需49美元,和托福雅思相比也太过便宜。在正式考试之前,多邻国还支持无限次的体验测试,以联系和适应多邻国的考试形式。
网站链接:http://englishtest.duolingo.cn/

结合AI,线上考试成色几何?
我们都知道,语言考试目的是明确在整个难度阶梯上,考生具体处在哪个位置,基于这样的评价标准,假如考生在低难度的题目表现很好,系统就会将难度提升,准确率下降就减少难度。通过AI调整试题目难度,直到考生准确率保持稳定,而此时的难度对应的就是考生的语言熟练度。
可以用大家都有所了解的CEFR(Common European Framework of Reference,欧洲共同参考框架)来说明,CEFR是对英语类语言的语言能力评价标准,按照所学语言分为初级、中级和高级三个等级,通常被标记为A1、A2、B1、B2、C1和C2。在这个评价体系中,考生的语言水平根据听、读、写、说四个方面进行评估,测试范围从“能够理解和产生基本的问候语”(初级水平)到“能够产生关于复杂主题的结构良好的详细文本”(高级水平)。

从CEFR的框架和标准出发,多邻国对一些文本做了相应的调整,比如将对中级学习者级别的文本,修改成为内容相同但是初学者级别的文本,有时也需要将A2的内容调整到A1。这就需要将语言的词汇、语法或习惯用语以及与文化相关的方面,调整或简化为不同层次的学习者更容易理解的形式。而要完成CEFR中多种语言、数十万单词的标记,对于课程专家来说,手工标记不仅昂贵而且令人抓狂。

于是,他们训练了一个机器学习系统,用几千个手写的CEFR标签来标记英语、西班牙语和法语单词,同时允许该模型被推广到其他语言中。这个有序回归学习模型采用一个单词及其源语言,预测目标学习者的CEFR水平。
该项技术是通过使用转移学习(transfer learning)和领域适应技术(domain adaptation techniques)完成的,依靠一些与语言无关的特性,就足以将模型推广到新的语言中。这也意味着,模型的特征包括了多语言词嵌入(multi-lingual word embeddings, MWEs)和语料库频率(corpus frequencies)。多语言词嵌入将单词映射到一个300维的空间(300-dimensional space),在这个空间中,出现在多个语言语料库中的类似功能和语义上下文中的单词将趋向于彼此靠近,提供了一个单词“意义”的语言不可知表示,如下面描述的简化的三维空间所示:

CEFR对考生的交流能力是,能够要求根据主题语义信息进行灵活变化,例如,能否可以在涉及问候、个人生活、食物、家庭的日常环境中进行交互。因此MWEs和语料库频率需要在直观上具有良好的动机。
研究者希望对这些能力进行合理安排,使学习者在学习稀有语言之前先熟悉频繁出现的语言。但是AI的意义体现在哪?为什么不简单地将英语中的CEFR单词表翻译成其他语言?
比如,我们用英语说“I am hungry”,西班牙语说“tengo hambre”,两个表达式都在A1级别。然而,如果只是逐字逐句地翻译,那么最终会得到西班牙语形容词hambriento或英语名词hurgen,这些单词实际上是B1。
除此之外,语言之间习语表达的不匹配也使得很难直接翻译单词表,而建模频率和语义的方法表现更好
image.gif

多邻国测试如何准备?
多邻国英语测试在2016年正式上线后,同年随即打入中国市场。
根据官方介绍,在多邻国上进行英语测试步骤也十分简单,登陆页面后后,选择“购买测试”。
购买测试后,可以选择任何合适的时间进行考试,考试时间是35-45分钟。系统会测试电脑的设备运行情况,会告诉你哪些是设备是不允许使用的,譬如耳机。考试开始前系统还会强调哪些事情是可以做,哪些不可以做,譬如房间里不能有其他人等。
Rogelio指出,多邻国的安全系统可以有效防范无人监考时的作弊问题。考试过程中会确认考生的身份,摄像头和麦克风全程开启,监测学生的动作以及环境的声音,同时还将电脑浏览器锁定,假如违规情况出现就会取消考试成绩。
考试分为两部分,第一部分包含补充单词、听音判词、单词分辨、朗读句子、听写句子、按图说话、小作文、看问题演讲、听问题演讲。第二部分考试包括采访录像和写作样本。第二部分不会算在总分里,但会连同最后的成绩一起发送给相应的学术机构


多邻国英语测试在知乎上也引起了众多受疫情影响的考生的讨论,他们在多邻国上进行了相关的考试,也很大方地分享了自己的考试经验比如网友@木易木子就分享到他的备考经验,“做好难的心理准备”、“考试的时间比模拟的长、内容会多”、“不能随便退出”等。

网友@我是Elliot也总结道自己首次考试失利的原因,“题量很多”、“难度大”等。

对于想要留学,但面对苦于雅思托福被迫取消的窘境,你会选择多邻国英语测试吗?如果你已经进行了多邻国的测试,也欢迎你在评论区留下你的心得和经验。


相关文章
|
24天前
|
机器学习/深度学习 人工智能 自然语言处理
探索AI在软件测试中的转型力量###
本文深入探讨了人工智能(AI)技术在软件测试领域的应用现状与未来趋势,通过分析AI如何优化测试流程、提高测试效率与质量,揭示了AI赋能下软件测试行业的转型路径。传统测试方法面临效率低、成本高、覆盖率有限等挑战,而AI技术的引入正逐步改变这一格局,为软件测试带来革命性的变化。 ###
|
5天前
|
机器学习/深度学习 人工智能 自然语言处理
自动化测试的新篇章:利用AI提升软件质量
【10月更文挑战第35天】在软件开发的海洋中,自动化测试犹如一艘救生艇,它帮助团队确保产品质量,同时减少人为错误。本文将探索如何通过集成人工智能(AI)技术,使自动化测试更加智能化,从而提升软件测试的效率和准确性。我们将从AI在测试用例生成、测试执行和结果分析中的应用出发,深入讨论AI如何重塑软件测试领域,并配以实际代码示例来说明这些概念。
31 3
|
14天前
|
人工智能 测试技术 Windows
Windows 竞技场:面向下一代AI Agent的测试集
【10月更文挑战第25天】随着人工智能的发展,大型语言模型(LLMs)在多模态任务中展现出巨大潜力。为解决传统基准测试的局限性,研究人员提出了Windows Agent Arena,一个在真实Windows操作系统中评估AI代理性能的通用环境。该环境包含150多个多样化任务,支持快速并行化评估。研究团队还推出了多模态代理Navi,在Windows领域测试中成功率达到19.5%。尽管存在局限性,Windows Agent Arena仍为AI代理的评估和研究提供了新机遇。
33 3
|
18天前
|
机器学习/深度学习 数据采集 人工智能
探索AI驱动的自动化测试新纪元###
本文旨在探讨人工智能如何革新软件测试领域,通过AI技术提升测试效率、精准度和覆盖范围。在智能算法的支持下,自动化测试不再局限于简单的脚本回放,而是能够模拟复杂场景、预测潜在缺陷,并实现自我学习与优化。我们正步入一个测试更加主动、灵活且高效的新时代,本文将深入剖析这一变革的核心驱动力及其对未来软件开发的影响。 ###
|
25天前
|
机器学习/深度学习 人工智能 安全
AI真的能与人类数据科学家竞争吗?OpenAI的新基准对其进行了测试
AI真的能与人类数据科学家竞争吗?OpenAI的新基准对其进行了测试
|
2天前
|
机器学习/深度学习 人工智能 自然语言处理
自动化测试的未来:AI与持续集成的完美结合
【10月更文挑战第39天】本文将探索自动化测试领域的最新趋势,特别是人工智能(AI)如何与持续集成(CI)流程相结合,以实现更快、更智能的测试实践。我们将通过实际代码示例和案例分析,展示这种结合如何提高软件质量和开发效率,同时减少人为错误。
10 0
|
25天前
|
存储 人工智能 Java
将 Spring AI 与 LLM 结合使用以生成 Java 测试
AIDocumentLibraryChat 项目通过 GitHub URL 为指定的 Java 类生成测试代码,支持 granite-code 和 deepseek-coder-v2 模型。项目包括控制器、服务和配置,能处理源代码解析、依赖加载及测试代码生成,旨在评估 LLM 对开发测试的支持能力。
32 1
|
26天前
|
机器学习/深度学习 人工智能 自然语言处理
探索AI在软件测试中的创新应用与实践###
本文旨在探讨人工智能(AI)技术如何革新软件测试领域,提升测试效率、质量与覆盖范围。通过深入分析AI驱动的自动化测试工具、智能化缺陷预测模型及持续集成/持续部署(CI/CD)流程优化等关键方面,本研究揭示了AI技术在解决传统软件测试痛点中的潜力与价值。文章首先概述了软件测试的重要性和当前面临的挑战,随后详细介绍了AI技术在测试用例生成、执行、结果分析及维护中的应用实例,并展望了未来AI与软件测试深度融合的趋势,强调了技术伦理与质量控制的重要性。本文为软件开发与测试团队提供了关于如何有效利用AI技术提升测试效能的实践指南。 ###
|
16天前
|
机器学习/深度学习 人工智能 自然语言处理
探索软件测试的未来:AI与自动化的融合
【10月更文挑战第25天】在本文中,我们将深入探讨软件测试领域正在经历的革命性变化。随着人工智能(AI)和自动化技术的不断进步,传统的测试方法正逐步被更高效、更智能的解决方案所取代。文章将展示如何通过AI增强自动化测试框架,实现更高效的缺陷检测和问题解决。我们将从基础出发,逐步揭示AI在测试用例生成、测试执行和结果分析中的应用,以及这些技术如何帮助团队提高生产力并缩短产品上市时间。
|
1月前
|
人工智能 监控 JavaScript
模拟依赖关系和 AI 是Vue.js测试的下一个前沿领域
模拟依赖关系和 AI 是Vue.js测试的下一个前沿领域
27 1