语义搜索及框计算:从百度查生僻字谈起

简介: <p style="margin:0px auto; padding-top:15px; padding-bottom:0px; border:0px; width:620px; line-height:25px; color:rgb(102,102,102); font-family:宋体; font-size:14px"> 三个雷怎么读?男女男念什么?开火是什么字?……相信有不少人都

三个雷怎么读?男女男念什么?开火是什么字?……相信有不少人都曾经被这样的问题所困惑过。要知道,中国的汉字常用的有4千左右,总数却超过8万,生僻字远远超过常用字,遇到一些不会读、不会输入的生僻字不足为奇。

  最近,百度新上线了一项查生僻字的框计算应用,面对不认识的生僻字,网民不用输入这个字本身,而是只需要向搜索框提交对字形和结构的描述,例如上文中的“三个雷”、“ 男女男”,就可以直接检索到这个字的准确读音及注释。

  这项应用看似简单,实际上,却标志着百度的框计算已经突破了针对完整文字进行匹配的传统检索时期,进入了更加精准、智能和人性化的语义搜索时代。

  什么是语义搜索?

  顾名思义,所谓语义搜索,是指搜索引擎的工作不再拘泥于用户所输入请求语句的字面本身,而是透过现象看本质,准确地捕捉到用户所输入语句后面的真正意图,并以此来进行搜索,从而更准确地向用户返回最符合其需求的搜索结果。

  举例来说吧,当一个用户在搜索框中输入“孟字去掉子”时,深谙语义搜索的搜索引擎就能够判断出,用户想要找的并不是含有“孟”、“去掉子”等字眼的内容,而是想要查找与“皿”这个字相关的内容;同样,当用户搜索“表现春天的图片”时,搜索引擎会向其呈现出各种与春天相关的图片,而不仅仅局限于该图片的标题是否包含“春天”字样。

  语义搜索的实质是自然语言处理技术,这正是百度自推出框计算概念以来一直重点投入的研发领域——早在去年,百度就曾与在该领域非常权威的哈尔滨大学建立联合实验室,着手自然语言相关技术的研发。

  我们有理由相信,对于百度和框计算来说,此次的生僻字查询功能,只是其语义搜索相关研发进程的一个小小成果。或许用不了多久,网民们所提出的诸如“听起来很温暖的歌”、“带有海豚音的音乐”、“家乡的新闻”、“适合我的女朋友”等形形色色、千奇百怪的问题和请求,都将能从百度的框计算服务中获得最好的解答

目录
相关文章
|
8月前
|
关系型数据库 MySQL
Mysql基础第二十一天,全文本搜索
Mysql基础第二十一天,全文本搜索
57 0
|
人工智能 自然语言处理 算法
Similarities:精准相似度计算与语义匹配搜索工具包,多维度实现多种算法,覆盖文本、图像等领域,支持文搜、图搜文、图搜图匹配搜索
Similarities:精准相似度计算与语义匹配搜索工具包,多维度实现多种算法,覆盖文本、图像等领域,支持文搜、图搜文、图搜图匹配搜索
Similarities:精准相似度计算与语义匹配搜索工具包,多维度实现多种算法,覆盖文本、图像等领域,支持文搜、图搜文、图搜图匹配搜索
|
数据采集 搜索推荐 安全
谷歌搜索留痕快速收录怎么实现?
答案是:通过GPC爬虫池技术实现的。 在搜索引擎优化(SEO)领域,快速收录是许多网站主人追求的目标。 而在谷歌搜索引擎中,搜索留痕快速收录成为了一种重要的实现途径。 以下内容详细介绍了如何实现谷歌搜索留痕快速收录。
170 0
谷歌搜索留痕快速收录怎么实现?
谷歌搜索留痕怎么做?有没内容限制?
因为量很大,比如我生成100万个页面,总会有几千甚至几万收录的,当然有一个前提是,你必须有自己的蜘蛛池。
518 0
谷歌搜索留痕怎么做?有没内容限制?
怎样才能让百度搜索到自己的csdn博客?
怎样才能让百度搜索到自己的csdn博客?
155 0
怎样才能让百度搜索到自己的csdn博客?
|
算法
重温算法之单词搜索
对于回溯算法大家都不陌生,为此还有题友写成了回溯算法的模板,只要按模板套题都能灵活解题,算是开辟了一种做题的方式吧,有的算法题还是很磨人的。
144 0
重温算法之单词搜索
小技巧 - 一键屏蔽百度搜索出现百家号信息的方法
小技巧 - 一键屏蔽百度搜索出现百家号信息的方法
633 0
小技巧 - 一键屏蔽百度搜索出现百家号信息的方法
|
机器学习/深度学习 搜索推荐 数据处理
这就是搜索引擎读书笔记-day3-5.检索模型与搜索排序
搜索结果排序融合了上百种排序因子,而重要两因素是:用户查询和网页内容相关性 及 网页链接情况。本节介绍内容相关性介绍网页排序
这就是搜索引擎读书笔记-day3-5.检索模型与搜索排序
|
数据采集 机器学习/深度学习 编解码
神马搜索如何提升搜索的时效性?
什么是搜索的时效性?有哪些特征?如何优化?本文分享神马搜索在搜索排序时效性问题上的实践和探索,从基础特征优化开始,通过标注数据进行排序和召回模型优化,以及时效性排序的召回体系和收录体系。较长,同学们可收藏后再看。
3083 0
神马搜索如何提升搜索的时效性?
Google展示“配方搜索”概念 利用语义搜索学做菜
谷歌上周四公布了一项新的概念性服务,它可以根据语义让用户自行过滤其结果,所实现的第一个应用就是食谱配方,这种新功能以丰富的片段标记语言数据为基础,可以提供菜色制作流程、难度评级、卡路里计算和用户评价等多种功能,用户只要在导航栏点选配方即可,该功能目前仅在美国和日本上市,不久后将在更多国家推出。
796 0

热门文章

最新文章