我看sphinx的文档中提到当前的数据源主要是mysql,还支持xmlpipe2,如果我的目的是索引爬虫抓取过来的网页数据,或者本地文件,该用什么方式来处理,当前有比较好的基于sphinx的方案么?
因为文档中sphinx的作者就说当时开发的动机就是要检索数据库中的文本。
多谢了。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
python数据源方法可以实现.
你的python可以按照你的规则读取本地文件,要有唯一标识,且时一个整数,指向某个文件,然后把数据交给sphinx作索引.