sphinx全文检索引擎

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
云数据库 RDS PostgreSQL,集群系列 2核4GB
简介: sphinx全文检索引擎

sphinx站内搜索

基于SQL的全文检索引擎


mysql 索引

# 加索引
mysql> alter table <table_name> add index <index_name>(<field_name>);
# 加主关键字的索引
mysql> alter table <table_name> add primary key (<field_name>);

应用场景

1、站内搜索

2、后台搜索


PHP -> MySQL

PHP -> Sphinx <-> MySQL


优势

mysql直接查询较慢

中文分词

速度快

-高速建立索引 10M/s

-高性能搜索 2-4G 0.1s

-海量数据


安装

http://sphinxsearch.com/


$ whereis sphinxsearsh


两个重要的工具

indexer:用于创建索引

searched:用于后台


配置

/etc/sphinxsearch/sphinx.conf


工作原理

indexer —> index data <— searched <— service/web


生成索引数据

/usr/bin/indexer --config /etc/sphinxsearch/sphinx.conf --all


索引文件存储的数据种类

.spa 存储文档属性

.spd 存储每个词ID可匹配的文档ID列表

.sph 存储索引头信息

.spi 存储词列表

.spm 存储MVA数据

.spp 存储每个词的命中列表


查看进程

ps -axu |grep searched


查看sphinx数据

mysql -h0 -p9306


select * from <index_name> limit 10;

相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助 &nbsp; &nbsp; 相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
SQL 存储 自然语言处理
sphinx(一)全文检索引擎sphinx
Sphinx是一个基于SQL的全文检索引擎,可以结合MySQL,PostgreSQL做全文搜索,它可以提供比数据库本身更专业的搜索功能,使得应用 程序更容易实现专业化的全文检索。Sphinx特别为一些脚本语言设计搜索API接口,如PHP,Python,Perl,Ruby等,同时为MySQL 也设计了一个存储引擎插件。
676 0
sphinx(一)全文检索引擎sphinx
|
自然语言处理 算法 UED
全文搜索
全文搜索树设计思路
126 0
|
存储 自然语言处理 NoSQL
使用Redisearch实现的全文检索功能服务
“检索”是很多产品中无法绕开的一个功能模块,当数据量小的时候可以使用模糊查询等操作凑合一下,但是当面临海量数据和高并发的时候,业界常用 elasticsearch 和 lucene 等方案,但是elasticsearch对运行时内存有着最低限额,其运行时大小推荐 2G 以上的内存空间,并且需要额外的磁盘空间做持久化存储。
使用Redisearch实现的全文检索功能服务
|
自然语言处理 搜索推荐 关系型数据库
ElasticSerach学习(三)-全文检索
ElasticSerach学习(三)-全文检索
153 0
|
存储 SQL 自然语言处理
sphinx全文检索引擎
sphinx全文检索引擎
145 0
|
存储 Java 索引
分布式--Lucene 全文检索
1. Lucene 官网 1). 概述 Lucene是一款高性能的、可扩展的信息检索(IR)工具库。信息检索是指文档搜索、文档内信息搜索或者文档相关的元数据搜索等操作。
1175 0
分布式--Lucene 全文检索
|
Web App开发 SQL 关系型数据库
|
分布式计算 NoSQL Apache