尽管大多数人都认为Google已经设定了Web 搜索的标准,但一些技术专家认为,由于人工智能技术取得的进展,很快会出现更好的搜索工具。
目前,搜索已经成为许多人不可或缺的工具,考虑到Google在Web 文档分析、超级计算、互联网广告方面取得的突破,我们会认为Google做的已经相当好了。
但人工智能领域的一些人士称,Google还没有做到尽善尽美,它的技术只是未来技术的起点。
人工智能技术的支持者表示,终有一天,人们将能够搜索小说中的情节,或者列出过去5 年中说过不利于环境保护的话的所有政治家名单,或在街上找到卖雨伞的地方。
自然语言处理、对象识别、机器学习等人工智能领域的技术将再次开始“提高”Web 搜索的智能。
Medstory的创始人、首席执行官阿莱因说,这是Web 将以一种智能的方式为我们服务、为我们完成乏味任务的时代的开始。Web 和信息量的增长速度非常快,开发智能化的搜索系统是势在必行的。
Medstory并不“孤独”。Powerset、Riya等新兴公司也在考虑将神秘的计算技术转换为商业上的成功。
对于搜索引擎而言,Web 就是数以十亿计网页上大量的单词和连接单词的超级链接。Google获得的一大突破是有效地连接这些单词,根据单词在网页上出现的频率、指向一个网页的超级链接数量确定相关度。
但是,搜索引擎并不“理解”这些单词,它们仅仅是对在网页上更重要或被其它更多的网页链接的关键字进行匹配。
搜索引擎还无法理解人类语言的细微差别。例如,如果用户输入“books by children ”,Google会搜索包括“books ”和“children”在内的网页,但不会考虑“by”,因为象“by”这样的词汇几乎出现在所有网页上。
这类词汇频繁出现的原因在于它们对于一个短语的意义是非常重要的。“Books by children ”与“books about children”和“children's books”都不相同。
一个尚未推出的人工智能搜索引擎的创始人巴尼将搜索引擎的这种限制称作“keywordese”。搜索引擎试图将我们训练成为一名好的关键字搜索者,使我们放弃了自己的智能。
他说,即将发生的一个变化是,不再把人类的表达和交互转化为计算机容易理解的方式,我们将使计算机的处理能力用于处理人类容易理解的表达。
Powerset正在利用人工智能训练计算机,不仅仅读取网页上的词汇,而是使这些词汇发生联系、理解语言的意义。
为什么说现在对人工智能和搜索引擎进行试验是正当其时?在搜索引擎中集成人工智能最大的障碍是,大规模这样做是不可行的。批评人士称,有效地产生这样的结果所需要的计算能力是极其昂贵的。
但摩尔定律正在使计算机、处理器、带宽的价格不断下滑,因此试验的机会正在成熟。搜索还是一种利润丰厚的业务,Google的年收入就达到了60亿美元。
搜索领域的大多数人士都认为,Google等公司的Web 搜索技术正在“渐进地”发展,但要有新的突破性进展,必须要有新的架构出现。