基于Liuli追更&阅读小说

简介: 基于Liuli追更&阅读小说

Liuli历史文章介绍:


这次Liuli给大家带来了小说书籍阅读场景的订阅解决方案,搭建方式和之前基于 Liuli 构建纯净的 RSS 公众号信息流[1]没什么区别。


最终效果如下图:

1.png2.png

使用


Liuli的部署使用还是很方便的,推荐大家使用Docker进行部署,所以开始前大家手头的设备需要安装好Docker,如果没安装,点击这里进行安装[2]即可。


当前Liuli的配置主要分两大块:


  • 全局配置:就是全局环境变量,相关说明见Liuli 环境变量[3]

  • 任务配置:此配置针对用户需要解决的问题而形成,比如本文就会生成一个将书籍类网页统一采集、处理、输出成 RSS 的配置(诸位使用时候将我的配置复制过去即可使用)

这里就不再一步一步写怎么安装配置Liuli,因为基于 Liuli 构建纯净的 RSS 公众号信息流这篇文章已经讲得很详细了,所以使用前请大家一定要把这篇文章通读一遍。切记!切记!切记!


......


好了,读完了,现在你Liuli目录下应该有这几个目录文件:

(base) [liuli] tree -L 1
├── docker-compose.yaml
├── liuli_config
├────default.json
├── mongodb_data
└── pro.env

然后对其中的docker-compose.yamldefault.json文件做一些修改:


  • docker-compose.yaml请在 github 下载最新[4]的,如果嫌麻烦直接将liuliio/schedule:v0.1.5换成liuliio/schedule:v0.1.6即可

  • default.json文件内容换成官方提供的book.json[5]即可,防止大家网络打不开,下面贴一下配置。

default.json文件内容如下:

{
    "name": "book",
    "author": "liuli_team",
    "doc_source": "liuli_book",
    "collector": {
        "book_common": {
            "book_dict": {
                "诡秘之主": "https://www.yruan.com/article/38563.html"
            },
            "delta_time": 5
        }
    },
    "processor": {
        "before_collect": [],
        "after_collect": [{
            "func": "to_rss",
            "link_source": "github"
        }]
    },
    "sender": {
        "sender_list": ["wecom", "ding"],
        "query_days": 7,
        "delta_time": 3,
        "link_source": "github"
    },
    "backup": {
        "backup_list": ["github", "mongodb"],
        "query_days": 7,
        "delta_time": 3,
        "doc_html_dict": {
            "liuli_book": "book"
        },
        "init_config": {},
        "after_get_content": [{
            "func": "str_replace",
            "before_str": "本书首发",
            "after_str": ""
        }]
    },
    "schedule": {
        "period_list": [
            "00:10",
            "12:10",
            "21:10"
        ]
    }
}

确认没问题后,执行:

docker-compose up -d

不出意外,会看到Docker启动了这三个容器:3.png

稍等片刻,你可以尝试访问一下采集器配置小说的RSS订阅地址http://ip:8765/rss/liuli_book/小说名,以我的为例,效果如下:

4.png

注意红框部分,因为我使用的是GitHub备份器,所以地址显示的是GitHub地址,所有人都是可以直接访问的,比如点这里[6](RSS 订阅展示的内容就来自这个链接):

5.jpg大家如果也想用这个,可以参考教程备份器配置[7],我使用GitHub备份器效果如下如:

6.png

注意看,多了个liuli_book的目录出来了。


问答


问:我怎么添加书源?


由于Liuli没有做任何小说数据采集,也没有对任何小说网站做适配(仅仅是做了个章节提取和核心内容识别这两个模块),所以是需要用户自己填写如下这种配置在xxx.json文件:

"book_dict": {
 "诡秘之主": "https://www.yruan.com/article/38563.html"
}

比如我在追这本没钱上大学的我只能去屠龙了,直接搜一下(这里用百度可能效果更好):

7.png

随便选一个链接填到配置里面去,比如我选第二个,那么配置如下:

"book_dict": {
 "诡秘之主": "https://www.yruan.com/article/38563.html",
 "没钱上大学的我只能去屠龙了": "https://www.xbiquwx.la/90_90983/"
}

添加好书源后,直接重启调度器容器即可:

docker restart liuli_schedule

问:现在是演示小说订阅,我想和上次的微信订阅一起用怎么弄?


很简单,两个配置(官方配置[8])都放到文件夹下面即可,Liuli会自动识别的,如下:

(base) [liuli] tree -L 1
├── docker-compose.yaml
├── liuli_config
├────wechat.json
├────book.json
├── mongodb_data
└── pro.env

!!!注意:如果之前用过公众号的配置,请加上"doc_source": "liuli_wechat"配置才能兼容。


说明


目前Liuli还处在早期开发阶段,最终我个人希望构建一个多源、干净、个性化的阅读环境,所以现在初期主要做的是做不同阅读方向源的兼容,比如公众号类、博客类、小说类甚至漫画类,基于这些基础源,后续会重点给用户打造更精细的阅读环境,如现有的去广告、后续规划的智能标签、分类以及一套知识管理体系。

相关文章
|
网络协议 数据安全/隐私保护 网络架构
软路由R4S+iStoreOS实现公网远程桌面局域网内电脑
软路由R4S+iStoreOS实现公网远程桌面局域网内电脑
825 0
|
机器学习/深度学习 存储 数据采集
数据分析案例-基于多元线性回归算法预测学生期末成绩
数据分析案例-基于多元线性回归算法预测学生期末成绩
1957 0
数据分析案例-基于多元线性回归算法预测学生期末成绩
|
存储 JSON JavaScript
震撼!Cookie、Session、Token、JWT 终极对决:揭开 Web 认证的神秘面纱!
【8月更文挑战第13天】Web 开发中,Cookie、Session、Token 和 JWT 常混淆。Cookie 是服务器给客户端的小信息片,如登录状态,每次请求都会返回。Session 则是服务器存储的用户数据,通过 Session ID 追踪。Token 类似通行证,证明客户端身份且可加密。JWT 是结构化的 Token,含头部、载荷及签名,确保数据完整性和安全性。
205 4
|
人工智能 自然语言处理 搜索推荐
通义千问首次落地天玑9300移动平台
联发科天玑9300芯片携手阿里云通义千问大模型,实现移动端AI重大突破。通义千问在天玑9300上的高效运行,标志手机AI技术新高度,提供即时多轮对话体验。双方深度合作优化模型,通义千问18亿参数版在推理时内存占用低,速度高,为行业设定标准。双方启动AI智能体解决方案计划,推动下一代智能终端应用生态发展。高通等竞争对手也在加速大模型移动端部署,端侧AI市场竞争加剧。
550 1
通义千问首次落地天玑9300移动平台
|
存储 缓存 安全
Qt QLinkedList 详解:从底层原理到高级用法
Qt QLinkedList 详解:从底层原理到高级用法
467 0
|
存储 数据采集 人工智能
如何利用人工智能技术提升电商平台的用户体验?
随着人工智能技术的高速发展,AIGC(Artificial Intelligence, Graphics and Computing)应用的场景越来越丰富。在这些场景下,需要高效的存储技术来支持人工智能算法的实现和大数据的处理。众所周知,阿里云是国内领先的云计算服务提供商之一,其在存储技术方面拥有丰富的经验和技术,为AIGC场景下的存储需求提供了全面的解决方案,那么本文就来聊一下电商平台借助人工智能提高用户体验的展望。
640 1
如何利用人工智能技术提升电商平台的用户体验?
|
存储 Ubuntu Shell
Ubuntu 使用deepin-wine源移植
1、详细看 https://github.com/zq1997/deepin-wine 2、添加仓库 首次使用时,你需要运行如下一条命令将移植仓库添加到系统中。 wget -O- https://deepin-wine.i-m.dev/setup.sh | sh 3、应用安装 自此以后,你可以像对待普通的软件包一样,使用apt-get系列命令进行各种应用安装、更新和卸载清理了。 比如安装微信只需要运行下面的命令。 sudo apt-get install com.qq.weixin.deepin 将com.qq.weixin.deepin替换为下列包名,可以继续安装其他应用:
532 1
|
弹性计算 人工智能 测试技术
阿里云服务器价格,2023最新收费标准报价及活动价格表
阿里云轻量应用服务器2核2G3M带宽轻量服务器一年108元,2核4G4M带宽轻量服务器一年297.98元12个月;ECS云服务器e系列2核2G配置182元一年
229 0
|
小程序
阿里云商标注册查询小程序上线及使用方法
阿里云商标查询小程序上线(来看看支持哪些功能),商标查询可以使用阿里云商标查询微信小程序,可以查询到商标信息和商标注册风险,输入商标名称、注册号、申请人即可查询,输入商标名称可以一键查询注册风险,阿里云百科分阿里云商标查询小程序入口及使用方法教程:
1222 0
阿里云商标注册查询小程序上线及使用方法
|
SQL 存储 分布式计算
数据湖统一元数据与权限
本文整理自阿里云数据湖构建与分析研发熊佳树在7月17日阿里云数据湖技术专场交流会的分享。
2121 0
数据湖统一元数据与权限