语义搜索及框计算:从百度查生僻字谈起

简介: <p style="margin:0px auto; padding-top:15px; padding-bottom:0px; border:0px; width:620px; line-height:25px; color:rgb(102,102,102); font-family:宋体; font-size:14px"> 三个雷怎么读?男女男念什么?开火是什么字?……相信有不少人都

三个雷怎么读?男女男念什么?开火是什么字?……相信有不少人都曾经被这样的问题所困惑过。要知道,中国的汉字常用的有4千左右,总数却超过8万,生僻字远远超过常用字,遇到一些不会读、不会输入的生僻字不足为奇。

  最近,百度新上线了一项查生僻字的框计算应用,面对不认识的生僻字,网民不用输入这个字本身,而是只需要向搜索框提交对字形和结构的描述,例如上文中的“三个雷”、“ 男女男”,就可以直接检索到这个字的准确读音及注释。

  这项应用看似简单,实际上,却标志着百度的框计算已经突破了针对完整文字进行匹配的传统检索时期,进入了更加精准、智能和人性化的语义搜索时代。

  什么是语义搜索?

  顾名思义,所谓语义搜索,是指搜索引擎的工作不再拘泥于用户所输入请求语句的字面本身,而是透过现象看本质,准确地捕捉到用户所输入语句后面的真正意图,并以此来进行搜索,从而更准确地向用户返回最符合其需求的搜索结果。

  举例来说吧,当一个用户在搜索框中输入“孟字去掉子”时,深谙语义搜索的搜索引擎就能够判断出,用户想要找的并不是含有“孟”、“去掉子”等字眼的内容,而是想要查找与“皿”这个字相关的内容;同样,当用户搜索“表现春天的图片”时,搜索引擎会向其呈现出各种与春天相关的图片,而不仅仅局限于该图片的标题是否包含“春天”字样。

  语义搜索的实质是自然语言处理技术,这正是百度自推出框计算概念以来一直重点投入的研发领域——早在去年,百度就曾与在该领域非常权威的哈尔滨大学建立联合实验室,着手自然语言相关技术的研发。

  我们有理由相信,对于百度和框计算来说,此次的生僻字查询功能,只是其语义搜索相关研发进程的一个小小成果。或许用不了多久,网民们所提出的诸如“听起来很温暖的歌”、“带有海豚音的音乐”、“家乡的新闻”、“适合我的女朋友”等形形色色、千奇百怪的问题和请求,都将能从百度的框计算服务中获得最好的解答

目录
相关文章
|
5天前
|
云安全 人工智能 安全
AI被攻击怎么办?
阿里云提供 AI 全栈安全能力,其中对网络攻击的主动识别、智能阻断与快速响应构成其核心防线,依托原生安全防护为客户筑牢免疫屏障。
|
14天前
|
域名解析 人工智能
【实操攻略】手把手教学,免费领取.CN域名
即日起至2025年12月31日,购买万小智AI建站或云·企业官网,每单可免费领1个.CN域名首年!跟我了解领取攻略吧~
|
9天前
|
安全 Java Android开发
深度解析 Android 崩溃捕获原理及从崩溃到归因的闭环实践
崩溃堆栈全是 a.b.c?Native 错误查不到行号?本文详解 Android 崩溃采集全链路原理,教你如何把“天书”变“说明书”。RUM SDK 已支持一键接入。
580 212
|
4天前
|
编解码 Linux 数据安全/隐私保护
教程分享免费视频压缩软件,免费视频压缩,视频压缩免费,附压缩方法及学习教程
教程分享免费视频压缩软件,免费视频压缩,视频压缩免费,附压缩方法及学习教程
233 138
|
存储 人工智能 监控
从代码生成到自主决策:打造一个Coding驱动的“自我编程”Agent
本文介绍了一种基于LLM的“自我编程”Agent系统,通过代码驱动实现复杂逻辑。该Agent以Python为执行引擎,结合Py4j实现Java与Python交互,支持多工具调用、记忆分层与上下文工程,具备感知、认知、表达、自我评估等能力模块,目标是打造可进化的“1.5线”智能助手。
814 59
|
7天前
|
人工智能 移动开发 自然语言处理
2025最新HTML静态网页制作工具推荐:10款免费在线生成器小白也能5分钟上手
晓猛团队精选2025年10款真正免费、无需编程的在线HTML建站工具,涵盖AI生成、拖拽编辑、设计稿转代码等多种类型,均支持浏览器直接使用、快速出图与文件导出,特别适合零基础用户快速搭建个人网站、落地页或企业官网。
1149 157
|
6天前
|
存储 安全 固态存储
四款WIN PE工具,都可以实现U盘安装教程
Windows PE是基于NT内核的轻量系统,用于系统安装、分区管理及故障修复。本文推荐多款PE制作工具,支持U盘启动,兼容UEFI/Legacy模式,具备备份还原、驱动识别等功能,操作简便,适合新旧电脑维护使用。
487 109