量化分析机器与人类智慧

简介:
未来的智慧世界应该是机器与人类的分工,低端重复性的智能由机器承担,高端的创造性的智能由人类来承担。过分的宣扬机器智慧超越人类智慧,都会带来盲目乐观到不理智甚至沮丧的结果。


1.关于机器与人类智慧未来的分歧

2011年2月18日,超级电脑“沃森”打败了人类,站在了与人类智力竞赛的最高领奖台上。著名的未来学家库兹韦尔相信,由于信息技术正朝着“超人类智能”的奇点迈进。当这个信息奇点在2045年到来的时候,人工智能将超越人类智慧。


但也有不少科学家认为机器智慧超越人类智慧还只是一个科学幻想,包括麻省理工的计算机学教授罗勃•米勒(Rob Miller),Facebook人工智能实验室主任、深度学习专家Yann LeCun,都认为机器算法在一些领域的确超越了人类的能力范围。 但在一些领域,例如对社会和文化的认知领域,包括不断发明各种新词汇、传播小猫的视频并点赞,或一起参与构的其他文化现象。这些是机器算法很难企及的领域。


1950年,图灵发表题为《机器能思考吗?》的论文,第一次提出“机器思维”的概念。提出假想:一个人在不接触对方的情况下,通过一种特殊的方式,和对方进行一系列的问答,如果在相当长时间内,他无法根据这些问题判断对方是人还是计算机,那么,就可以认为这个计算机具有同人相当的智力,即这台计算机是能思维的。这就是著名的“图灵测试”(Turing Testing)。


图灵测试经常用来检验机器是否具备人的智能,但图灵测试受人为因素干扰太多,严重依赖裁判者和被测试者的主观判断,而且只判断机器是否具备了人的智能,但机器与人类智慧的差距和变化速度并不能得到定量的分析。因此往往有人宣称其程序通过图灵测试,例如2014年6月英国雷丁大学客座教授凯文•沃维克宣称一款名为“尤金•古特曼(Eugene Goostman)”的计算机软件通过了测试,但很快就被人揭发他们的测试有很大漏洞并由欺诈嫌疑。


那么有没有一种方法,能够定量检测机器智力的发展水平和速度,并与人类智力进行对比,观察可能潜在的风险并进行防范。2013年以来我们在机器与互联智商方向进行了探索,初步成果已经发表在2014年6月6日举办的ITQM会议上,下面我们将简要介绍如何定量分析机器与人类智慧的未来之争。


2.机器与人类智商通用测试方法(M&H; IQ)

在心理科学中,智力(intelligence)是最难理解的概念之一。 目前有关智力的定义累积起来不下百种, 但一个基本共识是,智力是人们认识客观事物并运用知识解决实际问题的能力。


对人类智力的测量即智商测试由比奈西蒙最早提出,1905年比奈西蒙发表了《诊断异常儿童智力的新方法》, 即比纳西蒙智力量表 ,标志着智力测验的正式出现。 1916年,美国斯坦福大学教授推孟(L.M. Ter man)将比纳西蒙量表介绍到美国并予以修订,修订之后的量表称为斯坦福比纳量表,它成为目前世界上广泛流传的标准测验之一。


因为目前机器智力发展还很不完善,不能完全套用对人的智商测试。几乎没有任何机器系统能够完成人类智商测量的操作能力测试,因此我们需要吸收以上智商测试量表的优点,设计新的智力评价体系和建立测试题库。使之能同时对机器系统和不同年龄阶段的人类进行测试。这样得出的结果将可以定量的看出机器智慧与人类智慧的差距,通过定时测试,也可以发现机器智慧与人类智慧差距的变化情况。


基于“智力是人们认识客观事物并运用知识解决实际问题的能力”这一基本认知,可以从知识的获取能力(观察能力),知识掌握能力,知识创新能力,知识的反馈能力(表达能力)等四大方面建立新的机器与人类通用智商评价体系,从这四个方面建立15个分测试,并采用德尔菲法对其赋予权重。


机器与人类通用智力量表(M&H; IQ)

1 知识获取能力 识别文字的能力,识别声音的能力,识别图片的能力

2 知识掌握能力 常识(天文,地理,历史,物理,,,,),翻译,计算,

3 知识创新能力 排列,联想,创作,猜测,挑选,发现(规律)

4 知识的反馈能力 用文字表达的能力,用声音表达的能力,用图片表达的能力

具有机器智慧的程序有很多种类,其中搜索引擎具有很强的代表性,作为目前互联网最重要的应用之一,搜索引擎代表有Google,Baidu,Bing等,这些搜索引擎目前在通过各种方式不断提高搜索引擎的智能水平。

例如 1.从只能识别文字增加到能够识别声音和图片;2引入“语义理解”技术,试图理解用户的搜索意图;3,通过深度学习,让搜索引擎可以自动识别图像中是什么物体。因此选择对搜素引擎进行智商测试并与人类进行对比将具有典型的意义。


3.世界搜索引擎排名与机器智慧的弱点

根据机器与人类通用智力量表,可以建立机器与人类通用智商测试题库(因为篇幅问题,本文不进行详细介绍),2014年5月我们利用这个测试题库对全世界50个搜索引擎和3个不同年龄阶段的人类群体进行测试得到结果如下:

排名 属地 名称 通用智商

1 人类 18岁 97

2 人类 12岁 84.5

3 人类 6岁 55.5

4 美国 google 26.5

5 中国 Baidu 23.5

6 中国 so 23.5

7 中国 Sogou 22

8 埃及 yell 20.5

9 俄罗斯 Yandex 19

10 俄罗斯 ramber 18

11 西班牙 His 18

12 捷克 seznam 18

13 葡萄牙 clix 16.5

14 韩国 nate 15.75

15 阿联酋 Arabo 15.75

16 中国 panguso 15

17 韩国 naver 15

18 俄罗斯 webalta 13.5

19 美国 yahoo 13.5

20 美国 bing 13.5

21 香港 timway 12.75

22 日本 goo 12.75

23 日本 excite 12.75

24 中国 Zhongsou 12

25 英国 ask 12

26 法国 voila 12

27 法国 ycos 12

28 葡萄牙 sapo 12

29 德国 lycos 12

30 印度 khoj 10.5

31 俄罗斯 Km 10.5

32 德国 suche 10.5

33 美国 Dogpile 9

34 德国 Acoon 7.5

35 马来西亚 Sajasearch 6

36 印度 indiabook 6

37 塞浦路斯 1stcyprus 6

38 希腊 Gogreece 6

39 荷兰 slider 6

40 挪威 Sunsteam 6

41 英国 Excite UK 6

42 英国 splut 6

43 俄罗斯 Rol 6

44 西班牙 ciao 6

45 德国 fireball 6

46 德国 bellnet 6

47 德国 slider 6

48 德国 wlw 6

49 埃及 netegypt 6

50 所罗门群岛 eMaxia 6

51 澳大利亚 Anzswers 6

52 澳大利亚 Pictu 6

53 新西兰 SerachNZ 6

通过测试我们发现搜索引擎在知识的掌握能力上远远超过人类,但在知识的创新能力上全部得分为0. 由于知识创新能力在通用智商测试(M&H; IQ)的权重更高,因此世界范围的搜索引擎的总体智商大大低于人类智慧,最高的Google的智商值也不到人类6岁儿童的一半。


从上述研究还可以看出智能或智力是由不同的因素组成,例如天文,地理,历史等常识,数学计算,语言翻译。这些方面机器或互联网已经远远超过普通人类的能力,甚至强大到令人恐怖的地步,这也是库兹韦尔的观点能够震慑住很多人的主要原因。


但我们往往忽略,除此之外,智力还包括猜测预测,排列组合,规律发现,创新创造,伪装欺骗等更高等级的智慧因素,而在这些方面,机器和互联网表现的基本为0,更不用说与婴儿比较。


从科技的发展看,低端的智能,机器的能力突飞猛进,高端的智能,机器的能力举步维艰,数十年来毫无进展,未来的智慧世界应该是机器与人类的分工,低端重复性的智能由机器承担,高端的创造性的智能由人类来承担。过分的宣扬机器智慧超越人类智慧,正如Facebook人工智能实验室主任Yann LeCun所说“人工智能的每一个新浪潮,都会带来这么一段从盲目乐观到不理智最后到沮丧的阶段。未来学家生来就愿意做出盲目的预测,尤其是他们特别渴望这个预测成真的时候,可能是为了实现个人抱负。”


最后需要指出,目前建立的机器与人类通用智商测试量表(M&H;)还有很大的改进空间,但希望这是一个起点,能够解决图灵测试的不足和缺陷,为定量分析机器智慧能否超越人类智慧打下初步的基础。


原文发布时间为:2014-06-17

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关文章
|
C++ Windows
FFmpeg入门及编译 3
FFmpeg入门及编译
246 0
|
6月前
|
Linux 编译器 Android开发
鸿蒙系统被抹黑的深层解析:技术、商业与地缘政治的复杂博弈-优雅草卓伊凡
鸿蒙系统被抹黑的深层解析:技术、商业与地缘政治的复杂博弈-优雅草卓伊凡
320 1
鸿蒙系统被抹黑的深层解析:技术、商业与地缘政治的复杂博弈-优雅草卓伊凡
|
10月前
|
供应链 搜索推荐 API
1688商品类目API接口的开发应用与收益
1688平台作为全球领先的B2B在线交易市场,提供了丰富的API接口,助力企业高效获取商品信息、优化供应链管理。本文聚焦1688商品类目API接口的开发应用,涵盖接口概述、环境配置、Python代码示例及实际案例,展示其为企业带来的显著收益,如提升运营效率、优化市场策略、降低成本和增强用户体验。通过合理调用API,企业可大幅提升竞争力。
308 7
|
11月前
|
开发框架 Android开发 iOS开发
安卓与iOS开发中的跨平台策略:一次编码,多平台部署
在移动应用开发的广阔天地中,安卓和iOS两大阵营各占一方。随着技术的发展,跨平台开发框架应运而生,它们承诺着“一次编码,到处运行”的便捷。本文将深入探讨跨平台开发的现状、挑战以及未来趋势,同时通过代码示例揭示跨平台工具的实际运用。
341 3
|
10月前
|
人工智能
精度与通用性不可兼得,北大华为理论证明低精度下scaling law难以实现
北京大学和华为的研究团队在论文《数值精度如何影响大型语言模型的数学推理能力》中指出,数值精度是影响Transformer模型在数学任务中表现的关键因素。研究发现,低数值精度下,模型难以处理算术任务,如迭代加法和整数乘法;而在标准数值精度下,模型表现更佳且所需规模较小。实验结果表明,提高数值精度可显著提升LLM的数学推理能力,为优化模型性能提供了新思路。
242 88
|
安全 Java API
🌟探索Java宇宙:深入理解Java技术体系与JVM的奥秘
本文深入探讨了Java技术体系的全貌,从Java语言的概述到其优点,再到Java技术体系的构成,以及JVM的角色。旨在帮助Java开发者全面了解Java生态,提升对Java技术的认知,从而在编程实践中更好地发挥Java的优势。关键词:Java, JVM, 技术体系, 编程语言, 跨平台, 内存管理。
166 2
|
Java Linux Docker
倚天使用|YODA倚天应用迁移神器,让跨架构应用迁移变得简单高效
YODA(Yitian Optimal Development Assistant,倚天应用迁移工具)旨在帮助用户更加高效、便捷地实现跨平台、跨结构下的应用迁移,大幅度缩短客户在新平台上端到端性能验证所需的人力和时间,使得客户更加专注于应用本身算法的优化,协同客户实现降本增效。
125167 92
|
JavaScript 前端开发
js数组排序的方法
js数组排序的方法
203 1
|
前端开发 JavaScript
【Web 前端】display: none 和 visibily: hidden 区别?
【4月更文挑战第22天】【Web 前端】display: none 和 visibily: hidden 区别?
|
存储 NoSQL Redis
【Redis】四大特殊的数据类型之 BitMap
我们都知道 Redis 提供了丰富的数据类型,特殊的有四种:BitMap,HLL,GEO,Stream。今天我们就来详细的聊聊 Redis 这四大特殊的数据类型之一 BitMap;
1569 0