来说说近期很火的小众好搜引擎背后的技术

简介: 这个文章也是告诉做一个全网搜索需要用到的技术含量

这个文章也是告诉做一个全网搜索需要用到的技术含量,他们的广告:无痕、绿色、不追踪搜索。顾名思义:就是一款良心搜索,没有广告,也不推荐广告。围绕的依旧是【没有广告】并且替代F搜索的为目标。F搜很多人不知,简单说下F搜吧:

360截图20230719232147036.jpg

巧合的是好搜也是摘取了:谷歌、必应、雅虎的结果页,持续提供内容给用户,那么身为一个元搜索还有什么技术可言呢?

这个就是好搜和F搜的差异,好搜自带【数据库】所以有部分结果是来自它自己的PY爬虫,在索引,在分词,在排序,这些技术还是可以一一分析下的,现在做一款全网搜索没有以前那么难了,毕竟云厂商提供了很多模块可以付费使用的。

360截图20230719232613724.jpg

下面我就用我认知内知识普及下,大佬别嘲笑我就行。

他们的数据库使用的是阿里云或者腾讯云【MYSQL版、SQL Server 版、Redis 版】可能是定制版有可能是普通版,为啥我知道呢,第一看他们纯PHP页面和结果页面对比出来的数据,应为自有数据库存储做全网需要无限存储或者块存储,所以这3个数据库可能都会用到,爬虫应该是PY写的广深优先这个在我自己网站日志里捕获到了,蜘蛛服务器应该是是小厂的拨号(可能避免反爬吧)。

索引可能用的是百度云的搜索框去掉了框,只拿索引机制,应为我查了资料,目前就是阿里云和百度云这2家是比较接近。

分词这块用的是阿里云的【智能开放搜索 OpenSearch】排序也是这个机制套用的,加上主页的那个搜索框都是这个一气呵成的,这个模块我们公司自己也有所以对他很熟悉了。

底部关键词推荐用的也是阿里云【智能推荐 AIRec】可能是定制版。

至于自然语言这块猜想了【阿里云】【腾讯云】这2家公司产品。

下面是好搜代码,大佬可以拿去自己试试就知道个八九不离十了:

<form action="http://sl.z88888888.cn/s/" target="_blank">
<table bgcolor="#FFFFFF"><tr><td>
<a href="http://sl.z88888888.cn/"><img src="http://sl.z88888888.cn/search/images/hao.gif" alt="ZeiGou" align="bottom" border="0"></a>
<input type=text name=wd size=30>
<input type="submit" value="好搜搜索">
</td></tr></table>
</form>
相关文章
|
12月前
|
机器学习/深度学习 编解码 人工智能
淘宝再夺顶级技术比赛CVPRNTIRE冠军,背后是这些提升用户体验的内容技术
不知不觉间,内容电商似乎已经成为人们生活中不可或缺的存在:在闲暇时间,我们已经习惯于拿出手机,从电商平台的直播间随手下单自己心仪的商品。优质的货品、实惠的价格、精致的场景布置、有趣的内容输出都是非常关键的影响因素,这些也必须基于两个前提:画质要高清、播放要流畅。曾经,有不少商家和主播因为直播间画质较差的问题而苦恼,不了解如何实现高画质开播。
125 0
淘宝再夺顶级技术比赛CVPRNTIRE冠军,背后是这些提升用户体验的内容技术
|
Web App开发 人工智能 文字识别
一文带你了解阿里云RPA4.0背后的黑科技
今年5月,Gartner发布了RPA全球竞争格局的调研报告,阿里云RPA名列其中。随着阿里云RPA产品和生态的不断发展、客户的认可与伙伴的倾情投入,阿里云RPA有了很大的突破,并围绕“更专业、更智能、深化集成”方向,全新升级到了4.0版本,除了品牌整体调整外,阿里云RPA还对可视化开发、录制和AI等多个方面进行了重大升级,进一步满足客户业务需求,为企业数字化转型提供高效、安全、智能的服务。
一文带你了解阿里云RPA4.0背后的黑科技
专访开源之道主创 · 适兕:真实的开源世界依旧冷清
专访开源之道主创 · 适兕:真实的开源世界依旧冷清
|
机器学习/深度学习 数据采集 自然语言处理
硬核测评,谷歌翻译被碾压!全球首个翻译引擎进化归来,“细节狂魔”搞定方言文言文
硬核测评,谷歌翻译被碾压!全球首个翻译引擎进化归来,“细节狂魔”搞定方言文言文
372 0
|
机器学习/深度学习 人工智能 自动驾驶
公开下载 | 让刷剧更带感!“划时代”文娱体验背后有何技术较量?
AI弹幕、VR技术、5G超清......这在十年前可能都只是停留在人们想象中的文娱新体验,如今已经普及开来。如何让刷剧更“带感”?阿里巴巴文娱有答案!刷剧前下载,刷剧后阅读,8位阿里技术专家为你详解那些你不知道的智慧文娱关键技术!
18099 0
公开下载 | 让刷剧更带感!“划时代”文娱体验背后有何技术较量?
|
机器学习/深度学习 缓存 算法
清华本科生开发强化学习平台「天授」:千行代码实现,性能吊打国外成熟平台,刚刚开源
云栖号资讯:【点击查看更多行业资讯】在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来! 江山代有才人出,开源一波更比一波强。 就在最近,一个简洁、轻巧、快速的深度强化学习平台,完全基于Pytorch,在Github上开源。
清华本科生开发强化学习平台「天授」:千行代码实现,性能吊打国外成熟平台,刚刚开源
|
搜索推荐 自然语言处理 开发者
云栖硬核回顾|企查查搜索引擎演进之路
企查查作为企业征信行业的搜索引擎,一直以来都与阿里云开放搜索团队有深度合作。本次朱总独家揭秘,开放搜索陪伴企查查从创业初期到成为企业征信行业的独角兽的过程中,是如何满足企查查产品海量数据的精准搜索需求的。
8472 0