《谷歌语义搜索》一2.3 建立联系

简介:

本节书摘来自异步社区《谷歌语义搜索》一书中的第2章,第2.3节,作者【英】David Amerland,更多章节内容可以访问云栖社区“异步社区”公众号查看

2.3 建立联系

谷歌语义搜索
我从不粉饰我在例子中所使用的“乡村般”的过去所呈现出的严重问题—例如不平等性、不透明性、不负责性以及腐败。在这个过去中,联系并非总是由精英建立起来的,因而当然地,购买选择经常演变为两害相权取其轻,因为竞争和选择并不是备受尊重的概念。

关键点在于在这之后是什么,只要竞争和选择受到了关注,那就是一个进步,但这也造成了一种匿名性(facelessness),这也产生了一些问题—一些现在才去解决的问题。

为了理解在一个全新的语义世界中如何建立这些联系,让我们再看一次搜索框背后的机制。

在第1章中我们发现,为了能为我们的查询给出有意义的答案,基于知识图谱的语义搜索需要三项基本成分:

  • 一个统一资源标识符(Uniform Resource Identifier1,URI);
  • 一个资源描述框架(Resource Description Framework,RDF);
  • 一个本体(ontology)。
    这里,我们需要透过数学和术语来了解知识图谱实际上是如何运转来收集构建其列表所需要的全部信息的。

在Web上,信息来源于:

  • 网站;
  • 社交网络;
  • 专业网络;
  • 档案;
  • 数据库;
  • 谷歌搜索自身。
    但是,拥有所有这些信息是不够的。谷歌使用推理规则来理解实际上信息是如何聚集的及其含义是什么。这些规则被一些事物所激活,包括我们在以下环境中使用数据的方式:
  • 社交网络;
  • Web平台(例如论坛);
  • 谷歌搜索(包括我们的搜索查询)。
  • 以及我们在以下环境中生成的数据:
  • 可以分享内容的社交网络;
  • 可以评论和互动的社交网络;
  • 可以创建评论和观点的商业网站;
  • 可以创建内容的网站平台。

再加上我们使用Web的方式:

  • 我们允许显露的个人数据;
  • 被跟踪的行为,即我们访问的那些网站以及我们在那儿做了什么;
  • 个人搜索的模式。

甚至还包括我们的线下行为:

= 基于我们移动设备GPS信号的可感知位置的服务;
= 基于IP地址的地理定位;
= 机器采集的数据(当设备与设备连接和对话时)。
因此,语义搜索这一尚处在襁褓中的《星际迷航》计算机就不仅仅是更加聪明了。在它之前只能呈现给我们基于列表和近似的信息。这一全新的搜索也能够从我们自己的行为中学习,进而更好地理解我们做什么、我们为什么做、我们的意图是什么,以及它甚至能以我们的方式来理解词语。只要它学到一些东西,它就能将其运用在各处。例如,如果结合被索引的和获取到的数据教会了知识图谱“红色代码”这一词语是与一种高度戒备的状态相关联的,这就成为它能处处运用的知识,而并非局限于它学到这一点的那一语境。

在第1章的1.5节中,我请你去观察你的业务中的基本元素,例如它的独特卖点。我已经忘了有多少次了,我曾听闻经理们将他们公司的广告线或者使命宣言作为独特卖点,他们认为这就是公司所做的事情,但这从来都不是。

谷歌可能将“索引世界的信息”作为其使命宣言,但这并不是它的独特卖点,类似的还有认为可口可乐公司卖的是可乐或者拜尔公司(Bayer)卖的是阿司匹林。谷歌的真正独特卖点是它会给出答案,可口可乐兜售的是幸福,而拜尔兜售的是痛苦的减轻。深入了解一家公司究竟是做什么的,这一点之所以重要是因为其当前的表现模式是受技术约束的结果。谷歌可以有一个桌面搜索框,可口可乐可以有一种标志生活方式的饮料,而拜尔有的是一颗白色小药片,但这仅仅是由于这就是我们的技术目前所能带给我们的。

未来的一千年里,谷歌可能直接将答案输送到我们大脑皮层的神经突触中,可口可乐可能会彻底变成某种其他的东西,而拜尔可能在制造合成的神经传递素以助于阻挡疼痛信号进入我们的大脑。在这一美妙的未来情景中,不会改变的是每家公司及其顾客背后的意图。

谷歌仍将会向渴望获得信息并不断问问题的人们提供答案;可口可乐仍将是一种生活方式附属品式的饮料,属于那些觉得这就是他们所需要的来填满他们生活方式内在景像的人们;而拜尔仍将帮助那些受痛苦折磨的人们减轻痛苦。

那些没法顺利回答他们是做什么的公司便无法知晓他们怎样才能在一个不断变化的世界中继续做下去。语义搜索关心的就是在一个A点和B点互相积极寻找的世界中建立联系。这里的条件是对于所涉及的情形有一个清晰的理解—即正被一个产品或服务响应的那个需求或者愿望。

真正的挑战存在于A点能够联系上B点的区域之中。一个公司可以发现其客户的机会和一个客户可以找到一个产品的方式是多样的、破碎的,并演变为一系列五花八门的区位(niches),频繁地困扰着那些太过于专注其中的人们,正好印证了那句流行语“只见树木,不见森林”。

有趣的是,对于一个认真利用语义搜索和谷歌知识图谱的力量的业务而言,至少在表面上可以做的事情很简单:

找到方式来通过一种数字性的存在去证明你的权威性;
通过内容和在线交流来建立一个清晰的身份;
理解你的声誉是怎样被在线建立的以及你将如何维护它;
互联你所有的在线行为并确保它们是透明的。
1原文误写为了Indicator。——译者注

相关文章
|
Java Android开发
|
缓存 运维 监控
运维之道:从故障响应到系统优化的实战之旅
在信息技术飞速发展的今天,高效、可靠的系统运维已成为企业IT部门的核心任务。本文将通过一系列真实案例分析,深入探讨运维团队如何从日常的故障响应出发,逐步过渡到系统性能的深度优化。我们将一起探索运维的最佳实践,包括自动化工具的应用、性能监控的重要性以及如何构建一个弹性和高可用性的系统架构。文章旨在为读者提供一套完整的运维解决方案,帮助他们在面对复杂多变的技术环境时,能够迅速定位问题并实施有效的解决策略。
518 0
|
人工智能 自然语言处理 程序员
1024程序员节,你都参与了什么?
1024程序员节,阿里云推出多场景开发者活动,涵盖AI助手、云上实操挑战等,提供丰富的上手操作机会及小礼品,助你体验最新技术,提升技能。活动链接:[点击进入](https://developer.aliyun.com/topic/2024/1024cloudup?spm=a2c6h.13066369.question.3.7a606f95NIpx0S)
|
前端开发 JavaScript 开发工具
独家揭秘:前端大牛们都在用的高效开发工具,你get了吗?
前端开发领域日新月异,Visual Studio Code、Webpack、React/Vue和Git等工具凭借高效、便捷的特点,深受前端大牛们青睐。本文将揭秘这些工具的使用技巧,帮助你提升开发效率,轻松应对各种前端挑战。
167 3
|
安全 网络协议 网络安全
Windows Server 2003 Web服务器搭建
Windows Server 2003 Web服务器搭建
197 1
|
机器学习/深度学习 算法 搜索推荐
利用深度学习实现图像风格迁移
【9月更文挑战第21天】本文将介绍一种使用深度学习技术,特别是卷积神经网络(CNN)和生成对抗网络(GAN)来实现图像风格迁移的方法。我们将探索如何将这些技术应用于艺术创作,以及它们如何影响现代视觉艺术的发展。
|
Python
Python 项目及依赖管理工具技术选型
【8月更文挑战第30天】在进行Python项目及依赖管理时,有多种工具可供选择。虚拟环境工具有`virtualenv`和内置的`venv`,可为项目创建独立环境,避免依赖冲突。依赖管理工具有`pip`、`pipenv`和`poetry`,分别用于安装包、管理依赖并确保版本一致性。选型时需考虑项目需求、团队协作、易用性和社区支持等因素。
406 10
|
存储 Kubernetes Linux
Kubernetes 的配置资源 ConfigMap(01部分)
Kubernetes 的配置资源 ConfigMap(01部分)