• 关于

    sphinx

    的搜索结果

回答

python 数据源 ,  主索引+增量索引 =你用在千万级数据上试过没。。, 而且搜索量非常大 是访问量的2-3倍 mongo做千万级应用准备最少上半个机柜大内存机吧 sphinx不能直接支持mongodb的。我们之前是用python来建立sphinx和mongodb之间的数据接口。sphinx索引完成之后,搜索动作时在sphinx自身的索引文件上完成的,不涉及的对数据库的搜索了。然后php再根据sphinx给出的id去读mongodb就可以了,怎么会出现断开什么的? 不过python去读mongodb的速度肯定要比sphinx自己直接读mysql要慢,有实力的话可以自己用c写个接口。 mongo做千万级应用准备最少上半个机柜大内存机吧 sphinx不能直接支持mongodb的。我们之前是用python来建立sphinx和mongodb之间的数据接口。sphinx索引完成之后,搜索动作时在sphinx自身的索引文件上完成的,不涉及的对数据库的搜索了。然后php再根据sphinx给出的id去读mongodb就可以了,怎么会出现断开什么的? 不过python去读mongodb的速度肯定要比sphinx自己直接读mysql要慢,有实力的话可以自己用c写个接口。 估计sphinx要分布式,mongodb性能影响应该会小一点。。。 sphinx做raid主要提升磁盘速度吧。 sphinx不能直接支持mongodb的。我们之前是用python来建立sphinx和mongodb之间的数据接口。sphinx索引完成之后,搜索动作时在sphinx自身的索引文件上完成的,不涉及的对数据库的搜索了。然后php再根据sphinx给出的id去读mongodb就可以了,怎么会出现断开什么的? 不过python去读mongodb的速度肯定要比sphinx自己直接读mysql要慢,有实力的话可以自己用c写个接口。 python+sphinx+mongodb以前也这样做过。。千万级!!没试过。 另外给sphinx做缓存。。还有有其它方法?? 把所有的查询结果放到memcache里面啊,如果不存在数据过期或者更新的话;还可以试试把sphinx的index文件放到/dev/shm里面,做好重启后重新索引的脚本就是了。 ######做二次缓存也可。。 应该大部分消耗在sphinx上吧。。 如果同时缓存mongodb中的文本数据的话,内存占用大了。所以只缓存sphinx的数据。######就是"你可以直接把所有的查询结果放到memcache里面" mongo做千万级应用准备最少上半个机柜大内存机吧
一枚小鲜肉帅哥 2020-06-20 19:33:10 0 浏览量 回答数 0

回答

首先sphinx独立于项目,你可以理解成一个数据库。所有需要搜索的数据都存储在sphinx中,比如文章、商品、用户等。使用时要先把数据存储到sphinx中。可以使用sphinx自己的indexer来生成索引,让sphinx把所有的数据从MySQL中获取到然后存储到自己的索引中。然后就可以调用sphinx的api从sphinx中检索数据。一般从sphinx检索出数据的ID然后根据ID再去数据库中获取最新的数据(以防数据不一致,比如商品的库存、最新价格等)类似的产品还有很多比如国外的Elasticsearch ( https://www.elastic.co/products/elasticsearch )国产的XunSearch ( http://www.xunsearch.com ) 据说Segmentfault使用的XunSearch与Sphinx不同的是,你需要自己写一个程序或脚本把数据同步到他们自己的索引数据库中。
杨冬芳 2019-12-02 02:25:25 0 浏览量 回答数 0

问题

sphinx 以mysql为数据源 建索引失败

这是sphinx.conf 的内容 source src1这是我建立索引的命令 /usr/local/sphinx/bin/indexer --config /usr/local/sphinx/etc/sphinx.conf --all执行...
蛮大人123 2019-12-01 19:53:13 1356 浏览量 回答数 1

回答

sphinx不能直接支持mongodb的。用python来建立sphinx和mongodb之间的数据接口。sphinx索引完成之后,搜索动作时在sphinx自身的索引文件上完成的,不涉及的对数据库的搜索了。然后php再根据sphinx给出的id去读mongodb就可以了。不过python去读mongodb的速度肯定要比sphinx自己直接读mysql要慢,有实力的话可以自己用c写个接口。
落地花开啦 2019-12-02 01:51:38 0 浏览量 回答数 0

回答

忘记这茬了,ldconfig,已经解决 ###### 哈, 自问自答.....    话说, friso并没有提供--help文档, 只有一个开发帮助的pdf文档... ###### 引用来自“狮子的魂”的答案 哈, 自问自答.....    话说, friso并没有提供--help文档, 只有一个开发帮助的pdf文档... 我用是会用了,我不知道这玩意具体的使用场景是啥?分词的话搜索引擎都会帮你做了呀。。 ###### 信息检索, 语音合成, 语音识别, 文本自动分类, 机器翻译, 关键字提取....... 其中在信息检索中用的最多, 一般的全文索引组建没有提供中文分词工具, 例如: xapian, zebra等.... 都没有..... 如果是用在php里面的话, 我提供了一个robbe扩展... ###### 另外搜索引擎和全文索引是不一样的: 搜索引擎包括: 网络爬虫, 文档处理(去重...), 全文索引(需要中文分词), 查询接口. 我们通常用的是"全文索引"类库, 只是搜索引擎的一部分, 而这些类库基本都是国外的, 加上中文分词的复杂, 里面一般都没有中文分词的类库, 就像lucene, 自带的不好用... ###### 引用来自“狮子的魂”的答案 信息检索, 语音合成, 语音识别, 文本自动分类, 机器翻译, 关键字提取....... 其中在信息检索中用的最多, 一般的全文索引组建没有提供中文分词工具, 例如: xapian, zebra等.... 都没有..... 如果是用在php里面的话, 我提供了一个robbe扩展... 嗯,受教了,我用的是coreseek,这个是基于俄罗人开发的sphinx的。 我测试了下如果用你开发的这套东西的话,我可以用原生的sphinx了。例如搜索“广州市人民医院”,直接通过robbe 分成“广州市” “人民“ “医院”,然后直接放到sphinx API里去搜,我用的对吗? ###### 分词重点用在索引的建立和查询过程. 1. 你可以修改sphinx, 将friso内嵌到sphinx当作默认的分词程序. 然后你的spinx的调用接口不变.... 2. 我先前是将利用robbe分词(因为是给php用), 然后在将切分结果base64编码, 再将编码后的词条使用空格串接起来.  在给sphinx用, sphinx会自动用自带的英文分词程序再切分.. http://my.oschina.net/jcseg/blog/111106 里面的示例代码兴许会有帮助. 最好的办法是第一种(但是, 需要对sphinx设计比较熟悉, 才能很好的将friso嵌入到sphinx作为默认的分词程序), 第二种最简单... ###### 引用来自“狮子的魂”的答案 分词重点用在索引的建立和查询过程. 1. 你可以修改sphinx, 将friso内嵌到sphinx当作默认的分词程序. 然后你的spinx的调用接口不变.... 2. 我先前是将利用robbe分词(因为是给php用), 然后在将切分结果base64编码, 再将编码后的词条使用空格串接起来.  在给sphinx用, sphinx会自动用自带的英文分词程序再切分.. http://my.oschina.net/jcseg/blog/111106 里面的示例代码兴许会有帮助. 最好的办法是第一种(但是, 需要对sphinx设计比较熟悉, 才能很好的将friso嵌入到sphinx作为默认的分词程序), 第二种最简单... 修改sphinx的话对于我来说现在难度太大了,之前是用shinx_for_chinese,但是这玩意在建立索引的时候就已经把词分好了, 所以才导致这种结果:例如搜“广州市物友电子科技有限公司”可以搜到,但是你搜“广州市物友电子科技有限”就搜不到“广州市物友电子科技有限公司”了。后来我就转coreseek了,这玩意的分词是libmmseg,和你的friso一样都是基于mmseg算法实现的,用的是最新测试版的,在线上运行的时候,--rotate建索引的时候出问题了,貌似是BUG,也查不到个所以然,再说这玩意有些年头没更新了,稳定版还是基于sphinx0.9.9的,回退到这个版本的话API里很多东西都不适用了。现在我看到你开发的这个东西,感觉应该适合我们,这样的话可以用原生的sphinx,我打算好好测试测试,但是你推荐第一种,我用第二种会有问题吗? ###### 引用来自“狮子的魂”的答案 分词重点用在索引的建立和查询过程. 1. 你可以修改sphinx, 将friso内嵌到sphinx当作默认的分词程序. 然后你的spinx的调用接口不变.... 2. 我先前是将利用robbe分词(因为是给php用), 然后在将切分结果base64编码, 再将编码后的词条使用空格串接起来.  在给sphinx用, sphinx会自动用自带的英文分词程序再切分.. http://my.oschina.net/jcseg/blog/111106 里面的示例代码兴许会有帮助. 最好的办法是第一种(但是, 需要对sphinx设计比较熟悉, 才能很好的将friso嵌入到sphinx作为默认的分词程序), 第二种最简单... 汗,我的数据量是30W的100倍啊,呵呵。如果mysql能解决的话,就好了。。。 ###### 引用来自“宝仔love”的答案 引用来自“狮子的魂”的答案 分词重点用在索引的建立和查询过程. 1. 你可以修改sphinx, 将friso内嵌到sphinx当作默认的分词程序. 然后你的spinx的调用接口不变.... 2. 我先前是将利用robbe分词(因为是给php用), 然后在将切分结果base64编码, 再将编码后的词条使用空格串接起来.  在给sphinx用, sphinx会自动用自带的英文分词程序再切分.. http://my.oschina.net/jcseg/blog/111106 里面的示例代码兴许会有帮助. 最好的办法是第一种(但是, 需要对sphinx设计比较熟悉, 才能很好的将friso嵌入到sphinx作为默认的分词程序), 第二种最简单... 修改sphinx的话对于我来说现在难度太大了,之前是用shinx_for_chinese,但是这玩意在建立索引的时候就已经把词分好了, 所以才导致这种结果:例如搜“广州市物友电子科技有限公司”可以搜到,但是你搜“广州市物友电子科技有限”就搜不到“广州市物友电子科技有限公司”了。后来我就转coreseek了,这玩意的分词是libmmseg,和你的friso一样都是基于mmseg算法实现的,用的是最新测试版的,在线上运行的时候,--rotate建索引的时候出问题了,貌似是BUG,也查不到个所以然,再说这玩意有些年头没更新了,稳定版还是基于sphinx0.9.9的,回退到这个版本的话API里很多东西都不适用了。现在我看到你开发的这个东西,感觉应该适合我们,这样的话可以用原生的sphinx,我打算好好测试测试,但是你推荐第一种,我用第二种会有问题吗? 呵呵……这个当初在robbe-1.0发布的时候我就取用它测试了sphinx0.9.9。效果很好,就是用base64转吗也很高效,但是那时候friso1.0的分词效果还不是很好。现在分词好了搜索的精准度高些了。就是那个相关度排序的问题,不知道转换了base64编码后跟中文的相关度是否与误差!
爱吃鱼的程序员 2020-05-30 14:01:40 0 浏览量 回答数 0

回答

忘记这茬了,ldconfig,已经解决 ###### 哈, 自问自答.....    话说, friso并没有提供--help文档, 只有一个开发帮助的pdf文档... ###### 引用来自“狮子的魂”的答案 哈, 自问自答.....    话说, friso并没有提供--help文档, 只有一个开发帮助的pdf文档... 我用是会用了,我不知道这玩意具体的使用场景是啥?分词的话搜索引擎都会帮你做了呀。。 ###### 信息检索, 语音合成, 语音识别, 文本自动分类, 机器翻译, 关键字提取....... 其中在信息检索中用的最多, 一般的全文索引组建没有提供中文分词工具, 例如: xapian, zebra等.... 都没有..... 如果是用在php里面的话, 我提供了一个robbe扩展... ###### 另外搜索引擎和全文索引是不一样的: 搜索引擎包括: 网络爬虫, 文档处理(去重...), 全文索引(需要中文分词), 查询接口. 我们通常用的是"全文索引"类库, 只是搜索引擎的一部分, 而这些类库基本都是国外的, 加上中文分词的复杂, 里面一般都没有中文分词的类库, 就像lucene, 自带的不好用... ###### 引用来自“狮子的魂”的答案 信息检索, 语音合成, 语音识别, 文本自动分类, 机器翻译, 关键字提取....... 其中在信息检索中用的最多, 一般的全文索引组建没有提供中文分词工具, 例如: xapian, zebra等.... 都没有..... 如果是用在php里面的话, 我提供了一个robbe扩展... 嗯,受教了,我用的是coreseek,这个是基于俄罗人开发的sphinx的。 我测试了下如果用你开发的这套东西的话,我可以用原生的sphinx了。例如搜索“广州市人民医院”,直接通过robbe 分成“广州市” “人民“ “医院”,然后直接放到sphinx API里去搜,我用的对吗? ###### 分词重点用在索引的建立和查询过程. 1. 你可以修改sphinx, 将friso内嵌到sphinx当作默认的分词程序. 然后你的spinx的调用接口不变.... 2. 我先前是将利用robbe分词(因为是给php用), 然后在将切分结果base64编码, 再将编码后的词条使用空格串接起来.  在给sphinx用, sphinx会自动用自带的英文分词程序再切分.. http://my.oschina.net/jcseg/blog/111106 里面的示例代码兴许会有帮助. 最好的办法是第一种(但是, 需要对sphinx设计比较熟悉, 才能很好的将friso嵌入到sphinx作为默认的分词程序), 第二种最简单... ###### 引用来自“狮子的魂”的答案 分词重点用在索引的建立和查询过程. 1. 你可以修改sphinx, 将friso内嵌到sphinx当作默认的分词程序. 然后你的spinx的调用接口不变.... 2. 我先前是将利用robbe分词(因为是给php用), 然后在将切分结果base64编码, 再将编码后的词条使用空格串接起来.  在给sphinx用, sphinx会自动用自带的英文分词程序再切分.. http://my.oschina.net/jcseg/blog/111106 里面的示例代码兴许会有帮助. 最好的办法是第一种(但是, 需要对sphinx设计比较熟悉, 才能很好的将friso嵌入到sphinx作为默认的分词程序), 第二种最简单... 修改sphinx的话对于我来说现在难度太大了,之前是用shinx_for_chinese,但是这玩意在建立索引的时候就已经把词分好了, 所以才导致这种结果:例如搜“广州市物友电子科技有限公司”可以搜到,但是你搜“广州市物友电子科技有限”就搜不到“广州市物友电子科技有限公司”了。后来我就转coreseek了,这玩意的分词是libmmseg,和你的friso一样都是基于mmseg算法实现的,用的是最新测试版的,在线上运行的时候,--rotate建索引的时候出问题了,貌似是BUG,也查不到个所以然,再说这玩意有些年头没更新了,稳定版还是基于sphinx0.9.9的,回退到这个版本的话API里很多东西都不适用了。现在我看到你开发的这个东西,感觉应该适合我们,这样的话可以用原生的sphinx,我打算好好测试测试,但是你推荐第一种,我用第二种会有问题吗? ###### 引用来自“狮子的魂”的答案 分词重点用在索引的建立和查询过程. 1. 你可以修改sphinx, 将friso内嵌到sphinx当作默认的分词程序. 然后你的spinx的调用接口不变.... 2. 我先前是将利用robbe分词(因为是给php用), 然后在将切分结果base64编码, 再将编码后的词条使用空格串接起来.  在给sphinx用, sphinx会自动用自带的英文分词程序再切分.. http://my.oschina.net/jcseg/blog/111106 里面的示例代码兴许会有帮助. 最好的办法是第一种(但是, 需要对sphinx设计比较熟悉, 才能很好的将friso嵌入到sphinx作为默认的分词程序), 第二种最简单... 汗,我的数据量是30W的100倍啊,呵呵。如果mysql能解决的话,就好了。。。 ###### 引用来自“宝仔love”的答案 引用来自“狮子的魂”的答案 分词重点用在索引的建立和查询过程. 1. 你可以修改sphinx, 将friso内嵌到sphinx当作默认的分词程序. 然后你的spinx的调用接口不变.... 2. 我先前是将利用robbe分词(因为是给php用), 然后在将切分结果base64编码, 再将编码后的词条使用空格串接起来.  在给sphinx用, sphinx会自动用自带的英文分词程序再切分.. http://my.oschina.net/jcseg/blog/111106 里面的示例代码兴许会有帮助. 最好的办法是第一种(但是, 需要对sphinx设计比较熟悉, 才能很好的将friso嵌入到sphinx作为默认的分词程序), 第二种最简单... 修改sphinx的话对于我来说现在难度太大了,之前是用shinx_for_chinese,但是这玩意在建立索引的时候就已经把词分好了, 所以才导致这种结果:例如搜“广州市物友电子科技有限公司”可以搜到,但是你搜“广州市物友电子科技有限”就搜不到“广州市物友电子科技有限公司”了。后来我就转coreseek了,这玩意的分词是libmmseg,和你的friso一样都是基于mmseg算法实现的,用的是最新测试版的,在线上运行的时候,--rotate建索引的时候出问题了,貌似是BUG,也查不到个所以然,再说这玩意有些年头没更新了,稳定版还是基于sphinx0.9.9的,回退到这个版本的话API里很多东西都不适用了。现在我看到你开发的这个东西,感觉应该适合我们,这样的话可以用原生的sphinx,我打算好好测试测试,但是你推荐第一种,我用第二种会有问题吗? 呵呵……这个当初在robbe-1.0发布的时候我就取用它测试了sphinx0.9.9。效果很好,就是用base64转吗也很高效,但是那时候friso1.0的分词效果还不是很好。现在分词好了搜索的精准度高些了。就是那个相关度排序的问题,不知道转换了base64编码后跟中文的相关度是否与误差!
优选2 2020-06-05 11:37:47 0 浏览量 回答数 0

回答

忘记这茬了,ldconfig,已经解决 ###### 哈, 自问自答.....    话说, friso并没有提供--help文档, 只有一个开发帮助的pdf文档... ###### 引用来自“狮子的魂”的答案 哈, 自问自答.....    话说, friso并没有提供--help文档, 只有一个开发帮助的pdf文档... 我用是会用了,我不知道这玩意具体的使用场景是啥?分词的话搜索引擎都会帮你做了呀。。 ###### 信息检索, 语音合成, 语音识别, 文本自动分类, 机器翻译, 关键字提取....... 其中在信息检索中用的最多, 一般的全文索引组建没有提供中文分词工具, 例如: xapian, zebra等.... 都没有..... 如果是用在php里面的话, 我提供了一个robbe扩展... ###### 另外搜索引擎和全文索引是不一样的: 搜索引擎包括: 网络爬虫, 文档处理(去重...), 全文索引(需要中文分词), 查询接口. 我们通常用的是"全文索引"类库, 只是搜索引擎的一部分, 而这些类库基本都是国外的, 加上中文分词的复杂, 里面一般都没有中文分词的类库, 就像lucene, 自带的不好用... ###### 引用来自“狮子的魂”的答案 信息检索, 语音合成, 语音识别, 文本自动分类, 机器翻译, 关键字提取....... 其中在信息检索中用的最多, 一般的全文索引组建没有提供中文分词工具, 例如: xapian, zebra等.... 都没有..... 如果是用在php里面的话, 我提供了一个robbe扩展... 嗯,受教了,我用的是coreseek,这个是基于俄罗人开发的sphinx的。 我测试了下如果用你开发的这套东西的话,我可以用原生的sphinx了。例如搜索“广州市人民医院”,直接通过robbe 分成“广州市” “人民“ “医院”,然后直接放到sphinx API里去搜,我用的对吗? ###### 分词重点用在索引的建立和查询过程. 1. 你可以修改sphinx, 将friso内嵌到sphinx当作默认的分词程序. 然后你的spinx的调用接口不变.... 2. 我先前是将利用robbe分词(因为是给php用), 然后在将切分结果base64编码, 再将编码后的词条使用空格串接起来.  在给sphinx用, sphinx会自动用自带的英文分词程序再切分.. http://my.oschina.net/jcseg/blog/111106 里面的示例代码兴许会有帮助. 最好的办法是第一种(但是, 需要对sphinx设计比较熟悉, 才能很好的将friso嵌入到sphinx作为默认的分词程序), 第二种最简单... ###### 引用来自“狮子的魂”的答案 分词重点用在索引的建立和查询过程. 1. 你可以修改sphinx, 将friso内嵌到sphinx当作默认的分词程序. 然后你的spinx的调用接口不变.... 2. 我先前是将利用robbe分词(因为是给php用), 然后在将切分结果base64编码, 再将编码后的词条使用空格串接起来.  在给sphinx用, sphinx会自动用自带的英文分词程序再切分.. http://my.oschina.net/jcseg/blog/111106 里面的示例代码兴许会有帮助. 最好的办法是第一种(但是, 需要对sphinx设计比较熟悉, 才能很好的将friso嵌入到sphinx作为默认的分词程序), 第二种最简单... 修改sphinx的话对于我来说现在难度太大了,之前是用shinx_for_chinese,但是这玩意在建立索引的时候就已经把词分好了, 所以才导致这种结果:例如搜“广州市物友电子科技有限公司”可以搜到,但是你搜“广州市物友电子科技有限”就搜不到“广州市物友电子科技有限公司”了。后来我就转coreseek了,这玩意的分词是libmmseg,和你的friso一样都是基于mmseg算法实现的,用的是最新测试版的,在线上运行的时候,--rotate建索引的时候出问题了,貌似是BUG,也查不到个所以然,再说这玩意有些年头没更新了,稳定版还是基于sphinx0.9.9的,回退到这个版本的话API里很多东西都不适用了。现在我看到你开发的这个东西,感觉应该适合我们,这样的话可以用原生的sphinx,我打算好好测试测试,但是你推荐第一种,我用第二种会有问题吗? ###### 引用来自“狮子的魂”的答案 分词重点用在索引的建立和查询过程. 1. 你可以修改sphinx, 将friso内嵌到sphinx当作默认的分词程序. 然后你的spinx的调用接口不变.... 2. 我先前是将利用robbe分词(因为是给php用), 然后在将切分结果base64编码, 再将编码后的词条使用空格串接起来.  在给sphinx用, sphinx会自动用自带的英文分词程序再切分.. http://my.oschina.net/jcseg/blog/111106 里面的示例代码兴许会有帮助. 最好的办法是第一种(但是, 需要对sphinx设计比较熟悉, 才能很好的将friso嵌入到sphinx作为默认的分词程序), 第二种最简单... 汗,我的数据量是30W的100倍啊,呵呵。如果mysql能解决的话,就好了。。。 ###### 引用来自“宝仔love”的答案 引用来自“狮子的魂”的答案 分词重点用在索引的建立和查询过程. 1. 你可以修改sphinx, 将friso内嵌到sphinx当作默认的分词程序. 然后你的spinx的调用接口不变.... 2. 我先前是将利用robbe分词(因为是给php用), 然后在将切分结果base64编码, 再将编码后的词条使用空格串接起来.  在给sphinx用, sphinx会自动用自带的英文分词程序再切分.. http://my.oschina.net/jcseg/blog/111106 里面的示例代码兴许会有帮助. 最好的办法是第一种(但是, 需要对sphinx设计比较熟悉, 才能很好的将friso嵌入到sphinx作为默认的分词程序), 第二种最简单... 修改sphinx的话对于我来说现在难度太大了,之前是用shinx_for_chinese,但是这玩意在建立索引的时候就已经把词分好了, 所以才导致这种结果:例如搜“广州市物友电子科技有限公司”可以搜到,但是你搜“广州市物友电子科技有限”就搜不到“广州市物友电子科技有限公司”了。后来我就转coreseek了,这玩意的分词是libmmseg,和你的friso一样都是基于mmseg算法实现的,用的是最新测试版的,在线上运行的时候,--rotate建索引的时候出问题了,貌似是BUG,也查不到个所以然,再说这玩意有些年头没更新了,稳定版还是基于sphinx0.9.9的,回退到这个版本的话API里很多东西都不适用了。现在我看到你开发的这个东西,感觉应该适合我们,这样的话可以用原生的sphinx,我打算好好测试测试,但是你推荐第一种,我用第二种会有问题吗? 呵呵……这个当初在robbe-1.0发布的时候我就取用它测试了sphinx0.9.9。效果很好,就是用base64转吗也很高效,但是那时候friso1.0的分词效果还不是很好。现在分词好了搜索的精准度高些了。就是那个相关度排序的问题,不知道转换了base64编码后跟中文的相关度是否与误差!
爱吃鱼的程序员 2020-06-02 15:03:04 0 浏览量 回答数 0

问题

阿里云主机上安装sphinx

我想在阿里云主机上安装sphinx!不过一键安装包安装的apache目录与sphinx配置里面的不同,导致没法安装正确。麻烦请出一个阿里云主机apache一键安装适用版的sphinx包.....
lihaigang 2019-12-01 21:21:41 7388 浏览量 回答数 0

问题

请教有关Linux下PHP Sphinx配置问题

创建索引 bin/indexer -c etc/sphinx.conf --all ,运行之后,出现如下异常错误:这是sphinx建立索引时出现读问题,我搜索内容也会出现问题,但是内容可以搜索出来~搜索命令:bin/search -c et...
落地花开啦 2019-12-01 19:58:08 1075 浏览量 回答数 1

问题

用php+sphinx+mongodb来打造千万级搜索的问题

怎么用php+sphinx+mongodb来打造千万级搜索??求助?有人说用xmlpipe2 ,用PHP读取mongodb输出,然后sphinx来搜索有一个疑问就是mongodb千万级数据 用这种方法会不会很慢。之前有做给一个测试,感觉有点...
落地花开啦 2019-12-01 19:59:46 1503 浏览量 回答数 1

问题

使用sphinx索引本地文件

我看sphinx的文档中提到当前的数据源主要是mysql,还支持xmlpipe2,如果我的目的是索引爬虫抓取过来的网页数据,或者本地文件,该用什么方式来处理,当前有比较好的基于sphinx的方案么?因为文档中sphinx的作者就说当时开发的...
落地花开啦 2019-12-01 19:52:07 1240 浏览量 回答数 1

问题

sphinx功能和应用场景

我想知道你们的 sphinx 服务具体可以应用已那些场景 我有一个需求需要 根据文章搜索相似的文章  sphinx...
1607898431968748 2019-12-01 19:03:30 111 浏览量 回答数 1

问题

怎么用php+sphinx+mongodb来打造千万级搜索??,报错

怎么用php+sphinx+mongodb来打造千万级搜索??求助? 有人说用用PHP读取mongodb输出,然后sphinx来搜索, 有一个疑问就是mongodb千万级数据 用这种方法会不会很慢...
一枚小鲜肉帅哥 2020-06-20 19:24:24 2 浏览量 回答数 1

问题

项目搜索功能,要用到sphinx,请教几个基础问题

按照网上的教程安装好也启动了sphinx,但是完全不知道它是怎么个运作模式啊,我应该怎么使用它呢?求有经验的朋友告知。以下是我的猜测:spginx安装启动后,在项目中(以PHP为例)可以引入相关的spginx API,这些API中有查询相关...
杨冬芳 2019-12-01 19:32:05 999 浏览量 回答数 1

问题

IOError: [Errno 32] Broken pipe

# -*- coding: utf-8 -*- #!/usr/bin/python26 from SimpleHTTPServer import SimpleHTTPRequestHandler from BaseHTTPServer...
a123456678 2019-12-01 20:05:06 2228 浏览量 回答数 1

问题

阿里云RDS 的sphinx引擎是否能支持使用?sphinxSE 的使用

我在自己的ECS上启动了一个sphinx的服务,在独立的RDS上创建了一张特殊的ENGINE=SPHINX 的“搜索表”,但是在使用sql查询的时候总是提示 [SQL]SELECT * FROM...
2019-12-01 19:08:37 379 浏览量 回答数 1

问题

请教各位sphinx如何及时清理违禁信息

由于我的sphinx索引比较大,每次创建都需要一两个小时,现在网站有人发垃圾信息和违禁信息。我已经在mysql中将其删除了,但是要清理sphinx索引中的违禁信息,必须重建索引,这样处理起来很花费时间,而且会造成线上数据不可用的情况,有没有...
落地花开啦 2019-12-01 19:55:43 1473 浏览量 回答数 1

问题

php sphinx搜索中文无结果,什么原因?

php sphinx搜索中文无结果 , mysql的表是gbk的sphinx.conf 设置的都是utf-8`ql_query_pre = SET NAMES utf8charset_type = utf-8`利用sphinxclicent...
落地花开啦 2019-12-01 19:58:40 1527 浏览量 回答数 1

问题

Debian安装 Sphinx 支持中文检索 : 配置报错 

原文转自:http://hi.baidu.com/chancey/blog/item/2184746432926dfbf6365436.html 一、编译先前条件 确认是否已经安装以下软件, 有些也许不是必须的, 但建议还是都...
kun坤 2020-06-03 14:41:14 3 浏览量 回答数 1

回答

ReRDS是不是不支持sphinx的引擎 sphinx应该是支持的
施工中 2019-12-02 01:14:56 0 浏览量 回答数 0

问题

如何在调试Python脚本的异常中以交互模式中断?

我想调试一个Python包,比方说它是Sphinx。 当我做sphinx-build一切工作时,我有一个例外。而不是Traceback我想从那里开始一个交互式会话,我可以调试我的代码。 那可能吗...
游客6qcs5bpxssri2 2019-12-01 19:54:17 10 浏览量 回答数 1

问题

sphinx全文搜索报错?报错

根据教程安装了一个sphinx  建立了索引 但是搜索的时候报错 这是我的配置文件 source srcDB {     type            = mysql       sql_host        &...
爱吃鱼的程序员 2020-06-08 13:07:43 0 浏览量 回答数 1

问题

sphinx问题【已解决】

好吧,我错了   可以使用sphinx... RDS的安全限制内网的ip了.. 怎么删帖啊?。。...
7天幸福 2019-12-01 21:47:46 7620 浏览量 回答数 3

回答

利用搜索引擎,sphinx很好用sphinx最大的优点在于有单独的索引文件,搜索的时候完全不占用mysql的资源。不过关键还是看你们的业务类型,需求决定架构 。
落地花开啦 2019-12-02 01:45:48 0 浏览量 回答数 0

问题

如何设计一个基于用户昵称的搜索联想功能

类似新浪微博的 @ 联想功能。目前采用的sphinx(coreseek)的一元切分搜索,但是搜索结果不是很满意。基于一元切分,会把用户输入的关键词全部打散,这样输入 "he" 可能会出现 hebi,him(命中h), home(命中e) 之...
a123456678 2019-12-01 20:13:36 1026 浏览量 回答数 1

回答

ReRDS不能用sphinx,那么大数据量搜索靠什么做? 好吧,我错了   可以使用sphinx... RDS的安全限制内网的ip了..
7天幸福 2019-12-02 02:03:48 0 浏览量 回答数 0

问题

有关搜索引擎sphinx的问题? 400 报错

有关搜索引擎sphinx的问题? 400 报错 mysql表中400万数据,建索引是成功的,但是在启动守护进程时却报错out of memory,请问这是什么原因呢...
爱吃鱼的程序员 2020-06-04 13:22:08 0 浏览量 回答数 1

问题

sphinx的phpAPI无法查出数据,但是在命令行(cli)却可以,为何?

环境:ubuntu14.04 php5.5,mysql5.6搜索词:国产不知道为什么sphinx的phpAPI无法查出数据,但却也有hits属性和对应的字段出现,应该是代表数据匹配到了,但是数据却没有,为什么?...
a123456678 2019-12-01 20:12:39 1298 浏览量 回答数 1

问题

Sphinx 在win下面安装的一些问题? 报错

Sphinx 在win下面安装的一些问题? 400 报错 我在WIN下面安装了Sphinx,然后建立索引成功了。 但是查询的时候却查询不了,出现这样的问题:FATAL: malfo...
优选2 2020-06-04 18:05:45 2 浏览量 回答数 1

问题

Sphinx 在win下面安装的一些问题? 400 报错

Sphinx 在win下面安装的一些问题? 400 报错 我在WIN下面安装了Sphinx,然后建立索引成功了。 但是查询的时候却查询不了,出现这样的问题:FATAL: malfo...
爱吃鱼的程序员 2020-05-29 17:48:38 0 浏览量 回答数 1

云产品推荐

上海奇点人才服务相关的云产品 小程序定制 上海微企信息技术相关的云产品 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 自然场景识别相关的云产品 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT