搜索的B面:新连接

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介: 搜索的B面:新连接


搜索引擎连接的方式和连接的内容都在发生巨大改变。



在一些悲观者认为“我用搜索越来越少”时,8月,百度App宣布日活突破2亿,成为为数不多的进入日活2亿俱乐部的成员,用数据回应了“搜索是否有人用”的问题,百度App做对了什么?


在第十届长江青投论坛的演讲中,百度App总经理平晓黎对百度搜索走过的路进行了复盘,她认为从2000年百度做搜索开始,使命是让人们平等、便捷的获取信息,找到所求,到2008年推出移动搜索用户可以在手机上随时随地的发起搜索,再到2016年将信息服务的边界从人找信息扩展到信息找人,推出信息流和百家号,以及2018年推出智能小程序更好地满足用户的搜索需求,连接是百度一直在做的事,但百度的连接方式却不是一成不变的。


市场的变化不容忽视,平晓黎认为:

“互联网发展格局是超级APP+号和小程序生态,几乎所有超级APP都在向号和小程序形态迈进,今天这种形态已经成为移动时代代表连接的新范式。”


image.png


从移动转型到主动推荐再到智能小程序的服务闭环,百度搜索的进化体现出搜索引擎形态的进化,其帮助用户找到内容和服务的核心价值没变,但连接人与信息和服务的方式一直在变化。未来的搜索,是否依然会是信息与服务的入口?未来的搜索,会是怎样的?



 01 


搜索依然是主流信息获取方式



国外内两大搜索巨头都活得非常滋润。二季度,谷歌网站所产生的营收为273.35亿美元,高于去年同期的232.62亿美元,这一收入基本体现出谷歌搜索营收能力。百度则实现营收263亿元人民币,净利润24亿元人民币,超出华尔街预期,财报发布后的三个交易日股价已上涨12.4%。


是不是“瘦死的骆驼比马大”?答案不是。搜索引擎市场的用户大盘在增加。日前,中国互联网络信息中心(CNNIC)完成第44次《中国互联网络发展状况统计报告》,报告显示,截至2019年6月,中国网民规模达8.54亿,上半年共计新增网民2598万人,其中搜索引擎用户规模达6.95亿,较2018年底增长1338万,占网民整体的81.3%,2019年上半年,搜索引擎广告业务收入保持增长。


image.png


搜索引擎市场在增长,搜索引擎用户在增长,超过八成的网民都是搜索用户,用“我不用搜索”“我身边的人不用搜索”来支撑“没人用搜索”的结论,显然是站不住脚的。


百度贴吧之父俞军说,“搜索引擎是改变人类知识获取能力的一场革命”,这样的革命仍在继续,搜索引擎已经是人们最主要的主动信息获取方式,不论是老一代网民还是Z次元年轻人,谁都会用搜索引擎来寻找答案和获取信息。


image.png


信息流的出现,让“被动推荐”成为一种日益主流的信息获取方式,人们不用输入任何关键词,仅仅是通过“刷”手机就可以不断被推荐个性化的内容,但理论上来说,“被动推荐”与“主动搜索”不是非此即彼的关系,两者的场景截然不同。


自媒体写文章查资料是怎么也离不开搜索的,推荐引擎再怎么精准也不能给你准确地推荐素材;

越来越多的小学生在学习时习惯到百度找答案,这样的场景推荐引擎同样无法满足;

地图也是搜索的一种,导航你能用推荐引擎吗?答案当然是不能

……


搜索引擎出现前,人们就已习惯于通过“查询”去主动获取信息,只不过效率低下,搜索引擎的出现,指数级提高了人们主动获取信息的能力,正是因此搜索引擎才会被视作是认知获取能力革命。信息流是一种新的信息获取场景,并没有信息获取效率的提升,基于此,信息流也不会取代搜索引擎,在相当漫长的时间里,搜索都会是最核心的信息获取方式。


信息流不会取代搜索,就跟短视频不会取代长视频、手游不会取代端游一样,场景不同,价值不同。正是因为搜索引擎市场依然在增长,依然有利可图,微信、字节跳动、微博等平台才不约而同在强化搜索业务。


8月,百度宣布百度App日活突破2亿,成为屈指可数的进入日活2亿俱乐部的App成员,这足以说明搜索不只是不可替代,反而在增长。这与百度的与时俱进有直接关系。从移动转型到主动推荐再到智能小程序的服务闭环,百度搜索的进化,实际上也是搜索引擎形态的进化,从线性成长到生态扩张,搜索引擎帮助用户找到内容和服务的价值一直都没变,未来也会一直存在。



 02 


重新定义搜索引擎



搜索引擎不只是不会衰退,反而会随着AI技术的爆发和用户需求的变迁而被重新定义。百度强调搜索进化的关键之一是建立新连接,而这个连接背后首先是搜索本质随着时代发生的改变我认为,在AI技术驱动下,搜索引擎将升级为“认知引擎”,进而焕发出新的活力。


正如前面所说,过去二十年,搜索引擎之所以蓬勃发展,正是因为它让人们的信息获取效率得到指数级提高,本质上是一场认知能力革命。过去二十年,搜索引擎有一些变化,比如搜索结果结构化,比如搜索引擎垂直化,再比如搜索引擎移动化,均是基于经典搜索引擎的框架,即在“爬虫+索引”的基础上,输入方式、输出形式在不断变化。


现在人工智能技术成熟,搜索引擎将被重新定义。百度提出了AI工业化的说法;马化腾在世界人工智能大会上说,人工智能在未来10年会进入高速增长期。AI技术正在加速落地到各行各业的趋势。


搜索引擎是人工智能技术的发祥地。其运作模式是不断汇集数据、对数据进行处理,对用户问题进行理解,最终给出答案,本质是让机器具备认知能力,就像李彦宏说的:“因为搜索引擎的进化史,就是人工智能技术的进化史。”搜索引擎是最先应用AI的行业,正在被人工智能深刻改变。


首先人工智能改变了搜索引擎的底层框架。


“爬虫+索引”不再是搜索引擎的基石,移动时代信息孤岛问题也让这一模式捉襟见肘,搜索引擎不再是从海量现成信息中找到相关的链接,而是用AI技术去海量数据中挖掘,直接给出精准甚至是唯一的答案。曾经搜索引擎有成千上万的爬虫服务器日日夜夜地爬取全网数据,未来搜索引擎会有大量的机器学习服务器,日日夜夜不停歇地学习海量数据。数据来源于哪里,反而不再是最重要的。“AI+答案”成为搜索引擎新的底层框架。


其次人工智能改变了搜索引擎的产品形态。搜索引擎连接的方式和连接的内容都在发生巨大改变。


最直接的改变就是交互,或者说输入/输出。曾经搜索引擎基于搜索框,用户输入问题,点击回车键得到答案。今天,搜索引擎的输入变得十分多样,语音、图像、位置都是输入;输出超链接会越来越少,搜索引擎会根据结果的不同而进行不同的呈现,搜索引擎不再只是简单地给用户信息,而是要一站式满足用户。


基于此,百度成为率先发布智能小程序的搜索引擎,基于智能小程序,百度可以直接在搜索结果中让用户购物、预订、消费内容,获得更加完整的内容和服务体验。百度智能小程序基于AI和搜索引擎的协同优势,成为增速最快的小程序平台,在最近的演讲中,百度App总经理平晓黎透露,百度智能小程序数量突破15万,覆盖行业行业达到271个,第三方服务商达到200多个,月度活跃数已突破2.7亿,前段时间百度战略投资头部小程序服务商有赞,加速小程序生态布局。


百度信息流的出现是百度强化连接能力的另一个重点。推荐引擎本质是搜索交互的改变,但它依然是搜索引擎的一种,只不过输入成了用户行为、用户画像、兴趣图谱等等,在用户不知不觉中被输入了,而输出则变成了信息流,正是因为此,推荐引擎被称作“被动搜索”,百度率先拥抱信息流,推出“搜索+信息流”双引擎的做法,信息流的内容平台百家号创作者数量已突破200万,这一模式已逐步被谷歌等行业玩家采纳。


双引擎对于百度来说是一次重要的转型,用百度App总经理平晓黎的话说,这是百度“将信息服务的边界从人找信息扩展到信息找人”,百度信息流平台的基础依然是AI,因为AI百度主动发现用户的需求,再用个性化推荐算法去满足。


image.png


不论是智能小程序的推出,还是基于百家号的信息流与搜索引擎的融合,都体现出搜索引擎连接能力的升级:从加速信息流通的通道,到整合内容与服务的超级平台,平晓黎说:“我们现在要往前多做一步,无论是通过用户的主动搜索行为,还是百度主动的发现,我们要给用户提供最好的服务和内容,让用户可以完成一站式的体验,不仅要满足用户需求的起点,更要满足用户需求的终点,这也是今天我们在连接用户与信息世界过程中要往前迈进的一步。”



 03 


搜索引擎大变局,百度位置在哪里?



某种程度而言,超级App的本质都是建立连接,只是不同的入口,连接的能力和本质会有所区别。搜索的优势在哪?


我在2013年2月27日发表了《搜索引擎的大数据时代》一文,对搜索引擎的未来进行了展望:


1、数据远离搜索引擎,有价值的结构化数据正在慢慢远离搜索引擎,流向一个私有的领地。

2、网页搜索引擎将退化为“垂直网页搜索引擎”,网页数据只是网络数据的一部分,一小部分。

3、搜索引擎需要解决的问题,不再是帮助人们从海量信息里面找到结果,而是,在海量结果里面找到唯一。快速找到准确的答案比找到更多的答案更重要。

4、搜索引擎接下来要解决的不是“加速信息流动”,因为很多信息都够不着。搜索引擎要帮助人类做人脑不能做的事情:数据挖掘,即从海量数据中挖掘价值。

5、通过数据挖掘响应用户主动的或者被动的搜索需求,或许咱们可以叫其“推荐引擎”。


非常庆幸的是,我在6年多前的预测,在今天全部得到验证。搜索引擎的核心价值不再是加速信息流通做管道,而是汇聚数据再对数据进行挖掘给用户精准甚至唯一的答案。


百度近年来的种种战略都是在为今天做准备,归纳起来,有两条主线:


一条主线是数据。


在很多人都不能理解时,百度就在大力做百家号,做搜索+信息流双引擎,本质都是在汇集数据。到了今年,百度频繁出手投资果壳、知乎等平台,核心同样是数据。在WEB数据外,百度通过百度大脑、百度飞桨、百度智能云、百度度秘、百度Apollo等AI开放平台汇集更多数据。一切动作都表明,百度对数据十分饥渴,且十分舍得为数据花钱。


另一条主线是AI。


在《搜索引擎的大数据时代》一文下,有一条评论是:“搜索巨头都忙着做深度学习和知识体系。不知楼主对深度学习的多层模型和动态模型怎么看?”当时,百度就已经开始布局深度学习和知识图谱,正是这一重要的动作,让百度在搜索引擎进化到今天时,占据了搜索引擎的制高点。


百度率先布局AI以及掌握AI优势,与搜索引擎是AI技术的发祥地有直接关系。国外AI技术最强的是谷歌,国内AI技术最强的是百度,这绝不是偶然。云计算最强的分别是亚马逊和阿里,因为电商巨头的业务属性决定了云计算的先天优势。搜索巨头AI技术最强,同样是因为搜索引擎本身就是AI强相关,搜索引擎的基础技术如自然语言处理、知识图谱、大数据技术,均是AI强相关技术。


有先天优势,率先布局,6年的稳扎稳打,百度已形成AI技术长板,在深度学习技术、深度学习框架PaddlePaddle(飞桨)、AI芯片等底层AI技术,语音、机器视觉、自然语言处理、知识图谱、云计算、IoT、大数据等应用AI技术,自动驾驶、智能家居、智能音箱等行业AI技术上均有储备,形成全栈AI技术优势,这一点,应该很少有人否认。


新时代的搜索引擎作为连接口的本质是“AI+答案”,基于AI对数据进行挖掘再给出精准的答案,百度拥有了非常好的卡位,平晓黎认为:“搜索代表的是用户明确表达的需求,用户的输入就是他的需求。在这里我们需要给用户的是高效、便捷的满足和一站式的体验。”百度搜索引擎每天响应的几十亿次搜索请求里,有10%是用户只搜索了一次的信息,“这些能不能满足得好,其实才是真的搜索引擎难的地方,这是这么多年来百度长期积累的结果。”


image.png


百度追求的是让用户在一次搜索中,给其最精准的答案,“一搜即中”,不只是需要足够强的AI技术去理解用户和内容,同时也要对内容和服务进行高度整合,这需要下很多功夫,在发布二季度财报后,李彦宏发了一封内部信,展示出满满的信心:


“搜索是百度的根基,是百度的核心价值。在过去的将近20年,百度搜索一直专注于满足用户平等便捷地获取信息的需求。是对用户的关注和对核心技术的持续投入,构筑起我们的竞争壁垒,保持着百度搜索的领先地位。


今天,我们在用AI重新定义搜索。智能搜索正在演进的方向是更加精准的答案,甚至是唯一的答案。目前百度的搜索结果首条满足率已经达到51%。智能搜索已经突破“框”的限制,从手机向智能音箱、智能汽车等场景延伸,并将成为一个无处不在的超级智能交互入口。我们要始终坚定地投入,做最好的搜索。”


一定要重视李彦宏这一段话,这将决定百度能走多远,能否重返BAT阵营,这也是搜索引擎从二十年的经典搜索时代,向AI搜索时代转变的一个重要标志。


相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
小程序 JavaScript
小程序搜索弹出搜索内容功能(模糊查询)
小程序搜索弹出搜索内容功能(模糊查询)
74 0
|
前端开发
构建一个跳转到百度的搜索页面
构建一个跳转到百度的搜索页面
1200 0
|
小程序 数据库
小程序搜索功能,云开发搜索,小程序云开发模糊搜索,同时搜索多个字段
小程序搜索功能,云开发搜索,小程序云开发模糊搜索,同时搜索多个字段
276 0
|
JavaScript
selenium之百度搜索,结果列表翻页查询
selenium之百度搜索,结果列表翻页查询
163 0
|
搜索推荐 UED 索引
下拉SEO:有搜索的地方就有下拉框,有搜索就可以优化下拉
下拉SEO:有搜索的地方就有下拉框,有搜索就可以优化下拉
204 0
|
前端开发 程序员 开发者
搜索区域 | 学习笔记
快速学习搜索区域
搜索区域 | 学习笔记
|
前端开发 开发者
首页-头部搜索 |学习笔记
快速学习 首页-头部搜索
218 0
首页-头部搜索  |学习笔记
|
人工智能 安全 关系型数据库
【技巧】我是如何 "搜索" 到想要的信息的
关于“搜索”资源的一些见解
814 0
EPZS搜索过程
EPZS(Enhance Predictive Zonal Search) 增强预测区域搜索,是一种整像素运动估计的搜索算法。 EPZS采用的是相关性较高的预测方法。这里的相关性较高是指,更多地根据已有的条件,来进行运动向量的预测(如采用相邻块的mv作为当前搜索块的mv进行预测)。
957 0