Liuli历史文章介绍:
- 起因: 打造一个干净且个性化的公众号阅读环境
- v0.1 可用版本发布 🥳
- 公众号应用场景:基于 Liuli 构建纯净的 RSS 公众号信息流
这次Liuli
给大家带来了小说书籍阅读场景的订阅解决方案,搭建方式和之前基于 Liuli 构建纯净的 RSS 公众号信息流[1]没什么区别。
最终效果如下图:
使用
Liuli
的部署使用还是很方便的,推荐大家使用Docker
进行部署,所以开始前大家手头的设备需要安装好Docker
,如果没安装,点击这里进行安装[2]即可。
当前Liuli
的配置主要分两大块:
- 全局配置:就是全局环境变量,相关说明见Liuli 环境变量[3]
- 任务配置:此配置针对用户需要解决的问题而形成,比如本文就会生成一个将书籍类网页统一采集、处理、输出成 RSS 的配置(诸位使用时候将我的配置复制过去即可使用)
这里就不再一步一步写怎么安装配置Liuli
,因为基于 Liuli 构建纯净的 RSS 公众号信息流这篇文章已经讲得很详细了,所以使用前请大家一定要把这篇文章通读一遍。切记!切记!切记!
......
好了,读完了,现在你Liuli
目录下应该有这几个目录文件:
(base) [liuli] tree -L 1 ├── docker-compose.yaml ├── liuli_config ├────default.json ├── mongodb_data └── pro.env
然后对其中的docker-compose.yaml
和default.json
文件做一些修改:
docker-compose.yaml
请在 github 下载最新[4]的,如果嫌麻烦直接将liuliio/schedule:v0.1.5
换成liuliio/schedule:v0.1.6
即可default.json
文件内容换成官方提供的book.json[5]即可,防止大家网络打不开,下面贴一下配置。
default.json
文件内容如下:
{ "name": "book", "author": "liuli_team", "doc_source": "liuli_book", "collector": { "book_common": { "book_dict": { "诡秘之主": "https://www.yruan.com/article/38563.html" }, "delta_time": 5 } }, "processor": { "before_collect": [], "after_collect": [{ "func": "to_rss", "link_source": "github" }] }, "sender": { "sender_list": ["wecom", "ding"], "query_days": 7, "delta_time": 3, "link_source": "github" }, "backup": { "backup_list": ["github", "mongodb"], "query_days": 7, "delta_time": 3, "doc_html_dict": { "liuli_book": "book" }, "init_config": {}, "after_get_content": [{ "func": "str_replace", "before_str": "本书首发", "after_str": "" }] }, "schedule": { "period_list": [ "00:10", "12:10", "21:10" ] } }
确认没问题后,执行:
docker-compose up -d
不出意外,会看到Docker
启动了这三个容器:
稍等片刻,你可以尝试访问一下采集器配置小说的RSS
订阅地址http://ip:8765/rss/liuli_book/小说名
,以我的为例,效果如下:
注意红框部分,因为我使用的是GitHub
备份器,所以地址显示的是GitHub
地址,所有人都是可以直接访问的,比如点这里[6](RSS 订阅展示的内容就来自这个链接):
大家如果也想用这个,可以参考教程备份器配置[7],我使用GitHub
备份器效果如下如:
注意看,多了个liuli_book
的目录出来了。
问答
问:我怎么添加书源?
由于Liuli
没有做任何小说数据采集,也没有对任何小说网站做适配(仅仅是做了个章节提取和核心内容识别这两个模块),所以是需要用户自己填写如下这种配置在xxx.json
文件:
"book_dict": { "诡秘之主": "https://www.yruan.com/article/38563.html" }
比如我在追这本没钱上大学的我只能去屠龙了
,直接搜一下(这里用百度可能效果更好):
随便选一个链接填到配置里面去,比如我选第二个,那么配置如下:
"book_dict": { "诡秘之主": "https://www.yruan.com/article/38563.html", "没钱上大学的我只能去屠龙了": "https://www.xbiquwx.la/90_90983/" }
添加好书源后,直接重启调度器容器即可:
docker restart liuli_schedule
问:现在是演示小说订阅,我想和上次的微信订阅一起用怎么弄?
很简单,两个配置(官方配置[8])都放到文件夹下面即可,Liuli
会自动识别的,如下:
(base) [liuli] tree -L 1 ├── docker-compose.yaml ├── liuli_config ├────wechat.json ├────book.json ├── mongodb_data └── pro.env
!!!注意:如果之前用过公众号的配置,请加上"doc_source": "liuli_wechat"
配置才能兼容。
说明
目前Liuli
还处在早期开发阶段,最终我个人希望构建一个多源、干净、个性化的阅读环境,所以现在初期主要做的是做不同阅读方向源的兼容,比如公众号类、博客类、小说类甚至漫画类,基于这些基础源,后续会重点给用户打造更精细的阅读环境,如现有的去广告、后续规划的智能标签、分类以及一套知识管理体系。