谷歌发布万亿参数语言模型,语言模型何时超越人类语言能力?

简介: 处理过程更加复杂的人类语言模型在近几年得到了迅速发展,近日Google提出万亿参数语言模型Switch Transformer,进一步提高了语言模型可以达到的顶峰。这一切都表明,语言模型领域正处于「快速升温」的阶段,未来如何,我们拭目以待。

微信图片_20220112112327.jpg


在短短几年时间里,深度学习算法经过了飞速的进化,已经具有了可以打败世界最顶尖棋手的水平,并能以不低于人类识别的准确度来精确地识别人脸。

 

但事实证明,掌握独特而复杂的人类语言,是人工智能面临的最艰巨挑战之一。

 

这种现状会被改变吗?

 

如果计算机可以具有有效理解所有人类语言的能力,那么这将会彻底改变世界各地的品牌、企业和组织之间打交道的方式。


可媲美人类的视觉识别模型「率先登场」

 

直到2015年,能够以与人类相当的准确率识别人脸的算法才出现:脸书DeepFace的准确率为97.4%,略低于人类的97.5%。

 

而作为参考,FBI的面部识别算法仅达到85%的准确率,这意味着仍然有超过七分之一的情况是错误的。

 

FBI的算法是由一组工程师手工设计的:每个功能,比如鼻子的大小和眼睛的相对位置,都是手动编程的。

 

而Facebook的算法则主要处理学习到的特征,它使用了一种特殊的深度学习架构,称为卷积神经网络,这个网络模仿了我们视觉皮层不同层次处理图像的方式。


微信图片_20220112112332.png


Facebook之所以能够做到如此高的准确率,是因为它恰当的利用了可以实现学习功能的架构和数百万用户在分享的照片中标记好友的高质量数据,这两个元素成为了训练好的视觉模型可以达到人类识别水平的关键。


多语种高精度语言模型「姗姗来迟」


相比起视觉问题,语言似乎要复杂得多——据我们所知,人类是目前唯一使用复杂语言交流的物种。

 

不到十年前,如果要理解文本是什么,人工智能算法只会计算特定单词出现的频率。但这种方法显然忽略了一个事实 : 单词有同义词,而且只有在特定的上下文中才有意义。

 

2013年,Tomas Mikolov和他在谷歌的团队发现了如何创建一个能够学习单词含义的结构:

 

他们的word2vec算法可以将同义词之间彼此映射,并且能够对同义词的大小、性别、速度进行建模,甚至还可以学习到诸如国家和首都等函数的关系。


微信图片_20220112112334.png


然而,仍有很重要的一部分没有得到处理——语境(上下文关系)。

 

这一领域的真正突破出现在2018年,当时,谷歌重磅引入了BERT模型:

 

Jacob Devlin和他的团队利用了一种典型的用于机器翻译的架构,并使其学习与句子上下文相关的单词的含义。通过教会这个模型去填补维基百科文章中缺失的单词,这个团队能够将语言结构嵌入到BERT模型中。


微信图片_20220112112336.png


仅用有限数量的高质量标记数据,他们就能让BERT适应多种任务,包括找到问题的正确答案以及真正理解一个句子是关于什么的。


微信图片_20220112112338.png


因此,他们成为了第一个真正把握语言理解的两要素的人:正确的架构和大量高质量的数据。

 

2019年,脸书的研究人员将这一研究进行了进一步的推进:

 

他们训练了一个从BERT衍生出的模型,令其同时学习100多种语言。训练的结果是,该模型能够学习一种语言的任务,例如英语,并使用它来完成其他任何语言的相同任务,如阿拉伯语、汉语和印地语。


微信图片_20220112112340.png


这个语言无关模型在语言上可以与BERT有相同的表现,此外,在该模型中,语言转换过程中的一些干扰的影响是非常有限的。

 

在2020年初,Google的研究人员终于能够在广泛的语言理解任务中击败人类:

 

谷歌通过在更多数据上训练更大的网络,将BERT架构推向了极限——现在,这种T5模型在标注句子和找到问题的正确答案方面可以比人类表现得更好

 

而10月份发布的语言无关的mT5模型,在从一种语言切换到另一种语言的能力方面,几乎可以与双语者一样出色。同时,它在处理语言种类方面有着不可思议的效果——它可以同时处理100多种语言。


微信图片_20220112112342.png


本周公布的万亿参数模型Switch Transformer使语言模型变得更庞大,效果也变得更强大。


微信图片_20220112112344.png


图:Switch Transformer编码块


畅想未来,语言模型潜力巨大


想象一下,聊天机器人可以理解你的任何想法:

 

他们会真正理解语境并记住过去的对话。而你会得到的答案不再是泛泛的回答,而是正切主题的。

 

搜索引擎将能够理解你的任何问题:

 

你甚至不需要使用正确的关键字,他们也会给出正确的答案。

 

你将得到一个了解你公司所有程序的「AI同事」:

 

如果你知道正确的「行话」,就不用再问其他同事问题了。当然,也不再会有同事和你说:「为什么不把公司所有文件都看一遍再问我?」。

 

数据库的新时代即将到来:

 

跟结构化数据的繁琐工作说再见吧。任何备忘录,电子邮件,报告等,将得到自动解释,存储和索引。你将不再需要IT部门运行查询来创建报告,只需要和数据库说一下就行了。

 

而这,还只是冰山一角——

 

任何目前仍需要人类去理解语言的过程,都正处于被破坏或被自动化的边缘。


Talk isn’t cheap:庞大语言模型耗费巨大


在构建宏伟蓝图的同时,别忘了,还有个「陷阱」在这里:

 

为什么这些算法不是随处可见?

 

一般情况下,训练这些模型大概率要花费极其昂贵的价格。举个例子,训练T5算法的云计算成本约为130万美元。


微信图片_20220112112346.png


虽然谷歌的研究人员非常友好地分享了这些模型,但是,针对当前的特定任务,如果不对它们进行微调,那么这些模型在具体任务中很可能就无法使用。

 

因此,即使大公司开源了这些模型,对于其他人来说,直接拿来使用也是一件代价高昂的事情。

 

而且,一旦使用者针对特定的问题优化了这些模型,执行的过程中仍然需要大量的计算能力和超长的时间消耗

 

随着时间的推移,随着各大公司在微调上的投入,我们将看到新的的应用出现。

 

而且,如果大家相信摩尔定律,我们可以在大约五年内看到更复杂的应用。此外,可以超越T5算法的新的模型也将会出现。

 

2021年初,我们距离人工智能最重大的突破以及由此带来的无限可能,仅仅只有一步之遥。

 

参考链接:

https://venturebeat.com/2021/01/17/language-ai-is-really-heating-up/


相关文章
|
16天前
|
人工智能 自然语言处理 Shell
🦞 如何在 OpenClaw (Clawdbot/Moltbot) 配置阿里云百炼 API
本教程指导用户在开源AI助手Clawdbot中集成阿里云百炼API,涵盖安装Clawdbot、获取百炼API Key、配置环境变量与模型参数、验证调用等完整流程,支持Qwen3-max thinking (Qwen3-Max-2026-01-23)/Qwen - Plus等主流模型,助力本地化智能自动化。
29999 102
🦞 如何在 OpenClaw (Clawdbot/Moltbot) 配置阿里云百炼 API
|
5天前
|
应用服务中间件 API 网络安全
3分钟汉化OpenClaw,使用Docker快速部署启动OpenClaw(Clawdbot)教程
2026年全新推出的OpenClaw汉化版,是基于Claude API开发的智能对话系统本土化优化版本,解决了原版英文界面的使用壁垒,实现了界面、文档、指令的全中文适配。该版本采用Docker容器化部署方案,开箱即用,支持Linux、macOS、Windows全平台运行,适配个人、企业、生产等多种使用场景,同时具备灵活的配置选项和强大的扩展能力。本文将从项目简介、部署前准备、快速部署、详细配置、问题排查、监控维护等方面,提供完整的部署与使用指南,文中包含实操代码命令,确保不同技术水平的用户都能快速落地使用。
4277 0
|
11天前
|
人工智能 安全 机器人
OpenClaw(原 Clawdbot)钉钉对接保姆级教程 手把手教你打造自己的 AI 助手
OpenClaw(原Clawdbot)是一款开源本地AI助手,支持钉钉、飞书等多平台接入。本教程手把手指导Linux下部署与钉钉机器人对接,涵盖环境配置、模型选择(如Qwen)、权限设置及调试,助你快速打造私有、安全、高权限的专属AI助理。(239字)
6060 16
OpenClaw(原 Clawdbot)钉钉对接保姆级教程 手把手教你打造自己的 AI 助手
|
10天前
|
人工智能 机器人 Linux
OpenClaw(Clawdbot、Moltbot)汉化版部署教程指南(零门槛)
OpenClaw作为2026年GitHub上增长最快的开源项目之一,一周内Stars从7800飙升至12万+,其核心优势在于打破传统聊天机器人的局限,能真正执行读写文件、运行脚本、浏览器自动化等实操任务。但原版全英文界面对中文用户存在上手门槛,汉化版通过覆盖命令行(CLI)与网页控制台(Dashboard)核心模块,解决了语言障碍,同时保持与官方版本的实时同步,确保新功能最快1小时内可用。本文将详细拆解汉化版OpenClaw的搭建流程,涵盖本地安装、Docker部署、服务器远程访问等场景,同时提供环境适配、问题排查与国内应用集成方案,助力中文用户高效搭建专属AI助手。
4293 9
|
12天前
|
人工智能 机器人 Linux
保姆级 OpenClaw (原 Clawdbot)飞书对接教程 手把手教你搭建 AI 助手
OpenClaw(原Clawdbot)是一款开源本地AI智能体,支持飞书等多平台对接。本教程手把手教你Linux下部署,实现数据私有、系统控制、网页浏览与代码编写,全程保姆级操作,240字内搞定专属AI助手搭建!
5358 17
保姆级 OpenClaw (原 Clawdbot)飞书对接教程 手把手教你搭建 AI 助手
|
12天前
|
存储 人工智能 机器人
OpenClaw是什么?阿里云OpenClaw(原Clawdbot/Moltbot)一键部署官方教程参考
OpenClaw是什么?OpenClaw(原Clawdbot/Moltbot)是一款实用的个人AI助理,能够24小时响应指令并执行任务,如处理文件、查询信息、自动化协同等。阿里云推出的OpenClaw一键部署方案,简化了复杂配置流程,用户无需专业技术储备,即可快速在轻量应用服务器上启用该服务,打造专属AI助理。本文将详细拆解部署全流程、进阶功能配置及常见问题解决方案,确保不改变原意且无营销表述。
5837 5
|
14天前
|
人工智能 JavaScript 应用服务中间件
零门槛部署本地AI助手:Windows系统Moltbot(Clawdbot)保姆级教程
Moltbot(原Clawdbot)是一款功能全面的智能体AI助手,不仅能通过聊天互动响应需求,还具备“动手”和“跑腿”能力——“手”可读写本地文件、执行代码、操控命令行,“脚”能联网搜索、访问网页并分析内容,“大脑”则可接入Qwen、OpenAI等云端API,或利用本地GPU运行模型。本教程专为Windows系统用户打造,从环境搭建到问题排查,详细拆解全流程,即使无技术基础也能顺利部署本地AI助理。
7586 17
|
7天前
|
存储 人工智能 API
OpenClaw(Clawdbot)本地部署详细步骤与2026年OpenClaw一键部署官方教程参考
在AI办公自动化与智能代理工具日益普及的当下,OpenClaw作为原Clawdbot(曾用名Moltbot)迭代升级后的开源AI代理平台,凭借多渠道通信集成、大模型灵活调用及自动化任务执行等核心能力,成为个人处理日常事务与小型团队推进协作的得力助手。无论是追求数据自主可控的本地部署,还是倾向于7×24小时稳定运行的云端部署,用户都能找到适配的实现路径。2026年阿里云针对OpenClaw推出的预置镜像一键部署方案,更是大幅降低了云端使用门槛。本文将详细拆解OpenClaw的本地安装流程与阿里云快速部署步骤,同时补充注意事项与问题排查方法,助力不同需求的用户顺利搭建专属AI助手。
2447 1