sphinx全文检索引擎

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,高可用系列 2核4GB
简介: sphinx全文检索引擎

sphinx站内搜索

基于SQL的全文检索引擎


mysql 索引

# 加索引
mysql> alter table <table_name> add index <index_name>(<field_name>);
# 加主关键字的索引
mysql> alter table <table_name> add primary key (<field_name>);

应用场景

1、站内搜索

2、后台搜索


PHP -> MySQL

PHP -> Sphinx <-> MySQL


优势

mysql直接查询较慢

中文分词

速度快

-高速建立索引 10M/s

-高性能搜索 2-4G 0.1s

-海量数据


安装

http://sphinxsearch.com/


$ whereis sphinxsearsh


两个重要的工具

indexer:用于创建索引

searched:用于后台


配置

/etc/sphinxsearch/sphinx.conf


工作原理

indexer —> index data <— searched <— service/web


生成索引数据

/usr/bin/indexer --config /etc/sphinxsearch/sphinx.conf --all


索引文件存储的数据种类

.spa 存储文档属性

.spd 存储每个词ID可匹配的文档ID列表

.sph 存储索引头信息

.spi 存储词列表

.spm 存储MVA数据

.spp 存储每个词的命中列表


查看进程

ps -axu |grep searched


查看sphinx数据

mysql -h0 -p9306


select * from <index_name> limit 10;

相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助 &nbsp; &nbsp; 相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
6月前
|
搜索推荐 Java Shell
1.全文检索
1.全文检索
|
SQL 存储 自然语言处理
sphinx(一)全文检索引擎sphinx
Sphinx是一个基于SQL的全文检索引擎,可以结合MySQL,PostgreSQL做全文搜索,它可以提供比数据库本身更专业的搜索功能,使得应用 程序更容易实现专业化的全文检索。Sphinx特别为一些脚本语言设计搜索API接口,如PHP,Python,Perl,Ruby等,同时为MySQL 也设计了一个存储引擎插件。
661 0
sphinx(一)全文检索引擎sphinx
|
自然语言处理 算法 UED
全文搜索
全文搜索树设计思路
115 0
|
关系型数据库 测试技术 数据库
【全文搜索】全文搜索 PostgreSQL 或 ElasticSearch
【全文搜索】全文搜索 PostgreSQL 或 ElasticSearch
|
存储 自然语言处理 NoSQL
使用Redisearch实现的全文检索功能服务
“检索”是很多产品中无法绕开的一个功能模块,当数据量小的时候可以使用模糊查询等操作凑合一下,但是当面临海量数据和高并发的时候,业界常用 elasticsearch 和 lucene 等方案,但是elasticsearch对运行时内存有着最低限额,其运行时大小推荐 2G 以上的内存空间,并且需要额外的磁盘空间做持久化存储。
使用Redisearch实现的全文检索功能服务
|
SQL 存储 搜索推荐
什么是全文检索
全文检索技术被广泛的应用于搜索引擎,查询检索等领域。我们在网络上的大部分搜索服务都用到了全文检索技术。 对于数据量大、数据结构不固定的数据可采用全文检索方式搜索,比如百度、Google等搜索引擎、论坛站内搜索、电商网站站内搜索等。
625 0
什么是全文检索
|
存储 SQL 自然语言处理
sphinx全文检索引擎
sphinx全文检索引擎
133 0
|
XML 存储 自然语言处理
全文检索技术-solr
文字涉及Solr的安装及配置、使用Solr的后台管理索引库、使用SolrJ管理索引库、电商案例实现等
666 0
全文检索技术-solr
|
自然语言处理 Java 索引
全文检索Solr集成HanLP中文分词
以前发布过HanLP的Lucene插件,后来很多人跟我说其实Solr更流行(反正我是觉得既然Solr是Lucene的子项目,那么稍微改改配置就能支持Solr),于是就抽空做了个Solr插件出来,开源在Github上,欢迎改进。
3371 0
|
存储 自然语言处理 Java
分布式--Lucene 全文检索
1. Lucene 官网 1). 概述 Lucene是一款高性能的、可扩展的信息检索(IR)工具库。信息检索是指文档搜索、文档内信息搜索或者文档相关的元数据搜索等操作。
1166 0