垂直类的问答库搜索开发,用哪个引擎好-问答-阿里云开发者社区-阿里云

开发者社区> 问答> 正文
阿里云
为了无法计算的价值
打开APP
阿里云APP内打开

垂直类的问答库搜索开发,用哪个引擎好

2016-04-09 10:57:00 2231 1

想建立个垂直类的问答库
用php+mysql(后期可能会用上redis或者mogodb)
牵涉到一些专业的词库,并且后期希望能够根据用户的语义来调整搜索结果

目前看了下
主流的 迅搜,sphonix,elasticsearch,solr
时间有限,用哪个开发成本比较低?
用过的伙伴 给个建议 谢谢·~

取消 提交回答
全部回答(1)
  • idevcloud
    2019-07-17 18:40:06
    已采纳

    四个都用过,开发成本基本一致,因为这四个都有主流语言的sdk可以直接用,要说成本就是这四个软件的配置成本,但都比较简单。
    说下大致区别
    xunsearch自带中文分词使用的是scws,分词效率准确率都不错,而且带词性。索引建立速度还可以。查询效率高。但是由于它基于xapian,缺少一些语法糖。且我们在重建索引时出现过丢失索引的情况。当时的数据规模大概在千万级别,mysql 中数据大小为35G左右。不知道是不是因为是早期版本的原因。
    sphinx建立索引相对较慢,没有自带中文分词,但是可参考coreseek,也可自己配分词器。支持很多主流分词器。查询性能较弱,且分布式支持不太完美。功能有部分缺失,如xunsearch中的搜索折叠。但优点是容易上手,相对稳定。
    solr/es 这两个整体上差不多,但国内目前solr资料要比es多,中文分词支持的也好,常见的如ik,jieba等分词都有支持。效率这两者差不多,查询和建立都很快。都有很好的分布式方案。个人感觉es的分布式要好一点,至少配置上比solr简单。solr5之后架构也做了调整,但目前国内很多资料还是基于solr4的。
    其实索引更换和迁移的成本并不高,建议数据规模不大的时候可以先用sphinx,简单稳定。当出现性能瓶颈时,不建议折腾sphinx的分布式,而直接换用solr或es就行。xunsearch个人感觉还属于玩具级别,当然我这种结论是基于早期版本得出的,现在的情况不是很了解。

    0 0
相关问答

1

回答

客户直接输入域名无法访问,手动加上https就可以访问成功

2020-07-16 12:06:12 482浏览量 回答数 1

1

回答

【精品问答】微消息队列 MQTT 版

2020-04-08 12:20:13 1164浏览量 回答数 1

1

回答

【精品问答】微服务引擎 MSE你都知道?

2020-04-08 12:17:43 944浏览量 回答数 1

1

回答

主流搜索引擎有哪些?

2020-03-23 22:09:33 1696浏览量 回答数 1

0

回答

开放搜索 搜索条件拼接

2018-09-04 13:41:28 514浏览量 回答数 0

2

回答

相关win7下nginx代理tomcat集群使用memcached同步session问题

2016-05-30 17:26:51 2232浏览量 回答数 2

2

回答

关于用户购买两次某个品牌两次的输出问题!

2014-05-03 20:33:35 5552浏览量 回答数 2

7

回答

搜索引擎抓取错误

2014-01-09 11:53:15 7282浏览量 回答数 7

6

回答

备案速度好快0.0——185的手机号可以备案

2013-11-07 17:06:42 8729浏览量 回答数 6

1

回答

希望可以添加其他搜索引擎或直接可以选择!

2011-10-01 15:21:53 4225浏览量 回答数 1
+关注
0
文章
794
问答
问答排行榜
最热
最新
相关电子书
更多
低代码开发师(初级)实战教程
立即下载
阿里巴巴DevOps 最佳实践手册
立即下载
冬季实战营第三期:MySQL数据库进阶实战
立即下载