来说说近期很火的小众好搜引擎背后的技术

简介: 这个文章也是告诉做一个全网搜索需要用到的技术含量

这个文章也是告诉做一个全网搜索需要用到的技术含量,他们的广告:无痕、绿色、不追踪搜索。顾名思义:就是一款良心搜索,没有广告,也不推荐广告。围绕的依旧是【没有广告】并且替代F搜索的为目标。F搜很多人不知,简单说下F搜吧:

360截图20230719232147036.jpg

巧合的是好搜也是摘取了:谷歌、必应、雅虎的结果页,持续提供内容给用户,那么身为一个元搜索还有什么技术可言呢?

这个就是好搜和F搜的差异,好搜自带【数据库】所以有部分结果是来自它自己的PY爬虫,在索引,在分词,在排序,这些技术还是可以一一分析下的,现在做一款全网搜索没有以前那么难了,毕竟云厂商提供了很多模块可以付费使用的。

360截图20230719232613724.jpg

下面我就用我认知内知识普及下,大佬别嘲笑我就行。

他们的数据库使用的是阿里云或者腾讯云【MYSQL版、SQL Server 版、Redis 版】可能是定制版有可能是普通版,为啥我知道呢,第一看他们纯PHP页面和结果页面对比出来的数据,应为自有数据库存储做全网需要无限存储或者块存储,所以这3个数据库可能都会用到,爬虫应该是PY写的广深优先这个在我自己网站日志里捕获到了,蜘蛛服务器应该是是小厂的拨号(可能避免反爬吧)。

索引可能用的是百度云的搜索框去掉了框,只拿索引机制,应为我查了资料,目前就是阿里云和百度云这2家是比较接近。

分词这块用的是阿里云的【智能开放搜索 OpenSearch】排序也是这个机制套用的,加上主页的那个搜索框都是这个一气呵成的,这个模块我们公司自己也有所以对他很熟悉了。

底部关键词推荐用的也是阿里云【智能推荐 AIRec】可能是定制版。

至于自然语言这块猜想了【阿里云】【腾讯云】这2家公司产品。

下面是好搜代码,大佬可以拿去自己试试就知道个八九不离十了:

<form action="http://sl.z88888888.cn/s/" target="_blank">
<table bgcolor="#FFFFFF"><tr><td>
<a href="http://sl.z88888888.cn/"><img src="http://sl.z88888888.cn/search/images/hao.gif" alt="ZeiGou" align="bottom" border="0"></a>
<input type=text name=wd size=30>
<input type="submit" value="好搜搜索">
</td></tr></table>
</form>
相关文章
|
4月前
|
数据采集 人工智能 数据可视化
“会数据同学”首站走进雅戈尔,看老牌男装品牌如何用“数据+AI”华丽转身
“会数据同学”首站走进雅戈尔,看老牌男装品牌如何用“数据+AI”华丽转身
121 0
|
数据采集 搜索推荐 安全
如何实现谷歌霸屏?
答案是:可以使用GLB外推技术实现谷歌霸屏。 理解谷歌霸屏 谷歌霸屏的含义 谷歌霸屏,即在搜索引擎结果页(SERP)上,通过各种优化手段,使得自己或自己公司的信息占据大量位置。 这种做法旨在优化网站在搜索结果中的排名,提高品牌曝光度,并从而增加网站流量和销售收入。
184 0
如何实现谷歌霸屏?
|
人工智能 自然语言处理 算法
电商行业智能搜索技术原理全解析
对于电商平台来说,智能搜索功能是至关重要的。本文剖析电商行业的搜索专属特点和业务需求,并介绍开放搜索提供的【电商行业模板】智能搜索能力,希望带给企业更多提升业务转化的思路和解决方案~
2826 1
电商行业智能搜索技术原理全解析
|
Web App开发 人工智能 文字识别
一文带你了解阿里云RPA4.0背后的黑科技
今年5月,Gartner发布了RPA全球竞争格局的调研报告,阿里云RPA名列其中。随着阿里云RPA产品和生态的不断发展、客户的认可与伙伴的倾情投入,阿里云RPA有了很大的突破,并围绕“更专业、更智能、深化集成”方向,全新升级到了4.0版本,除了品牌整体调整外,阿里云RPA还对可视化开发、录制和AI等多个方面进行了重大升级,进一步满足客户业务需求,为企业数字化转型提供高效、安全、智能的服务。
一文带你了解阿里云RPA4.0背后的黑科技
|
域名解析 存储 安全
让理想中的企业级站点开发走进大众 - ServerlessDevs 1024特别奉献
本篇文章像大家介绍一下,如何使用serverless devs 结合云产品实现一个具备 高安全,高性能,高体验,高容灾,低成本的web站点
204 0
让理想中的企业级站点开发走进大众 - ServerlessDevs 1024特别奉献
专访开源之道主创 · 适兕:真实的开源世界依旧冷清
专访开源之道主创 · 适兕:真实的开源世界依旧冷清
|
机器学习/深度学习 数据采集 自然语言处理
硬核测评,谷歌翻译被碾压!全球首个翻译引擎进化归来,“细节狂魔”搞定方言文言文
硬核测评,谷歌翻译被碾压!全球首个翻译引擎进化归来,“细节狂魔”搞定方言文言文
446 0
|
机器学习/深度学习 人工智能 自动驾驶
公开下载 | 让刷剧更带感!“划时代”文娱体验背后有何技术较量?
AI弹幕、VR技术、5G超清......这在十年前可能都只是停留在人们想象中的文娱新体验,如今已经普及开来。如何让刷剧更“带感”?阿里巴巴文娱有答案!刷剧前下载,刷剧后阅读,8位阿里技术专家为你详解那些你不知道的智慧文娱关键技术!
18134 0
公开下载 | 让刷剧更带感!“划时代”文娱体验背后有何技术较量?
|
人工智能
一些业内有名的网站收集
丹麦Icon设计师的主页http://jonas.seph.ws/生活在澳洲的19岁中国UI设计师http://www.istartedsomething.com/韩国icon工作室http://www.
1028 0