资源 | 一网打尽成语歇后语,GitHub新华字典数据库

简介: 今天,文摘菌给大家推荐一个非常优秀的数据库——新华字典数据库。

今天,文摘菌给大家推荐一个非常优秀的数据库——新华字典数据库。

数据库收录了包括14032条歇后语,16142个汉字,31648个成语。下面文摘菌就简单的介绍一下这个数据库。

这个数据库放在GitHub中,所有的数据放在data/目录下,并且如果对性能没有要求的同学,可以使用作者的新华字典API访问数据库。

数据库地址:
https://github.com/pwxcoo/chinese-xinhua

项目结构

在GitHub中,整个新华字典数据库的项目结构为:


image

整个结构包括数据文件夹,配置文件以及脚本文件夹,在脚本文件夹下提供了成语脚本和汉字脚本以及歇后语脚本的下载。

数据库介绍及API的使用

前面提到,整个数据库包括14032条歇后语,16142个汉字,31648个成语。

在使用API查询每条成语的时候,分为两种情况:
如果直接请求成语,需要两个参数:
type=idiom 表示需要请求成语
word=兴高采烈 表示请求的成语
请求拼音首字母缩写,也需要两个参数:
type=idiom 表示需要请求成语
word=xgcl 表示请求的成语拼音首字母缩写

下面文摘菌用Python简单实现了一下:

image

返回结果为:

image

上图可知,当你请求的是成语时,返回的结果包括:成语的来源、成语的解释、成语的拼音、用成语造的句子以及成语的首字母缩写。

当访问歇后语的时候则也需要两个参数:
type=xiehouyu 表示需要请求歇后语
riddle=王婆 表示请求的歇后语的语面。可以模糊匹配

Python实现

image

由上图的Python实现可知,当你输入的关键词是模糊的时候,结果会返回带有关键词的所有歇后语。例如,你查询关键词为王婆的歇后语,返回了三条结果,每条结果包含歇后语的迷面以及歇后语的谜底。

当需要访问汉字的时候,当前接口只能直接请求汉字,不能请求拼音。如果请求了拼音,则返回的结果为空。

请求汉字需要两个参数:
type=word 表示需要请求汉字
word=“蒋” 表示请求的汉字

Python实现


如上图所示,当请求‘蒋’这个汉字的时候,返回的结果包括汉字的拼音、汉字的来源、以及汉字的繁体版等等。

注:GET、POST均可,返回数据格式为JSON。

数据库GitHub地址:
https://github.com/pwxcoo/chinese-xinhua

原文发布时间为:2018-07-30
本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“大数据文摘”。

相关文章
|
5月前
|
存储 监控 安全
阿里云数据库(ADB)的多租户秘籍:资源隔离的魔法如何施展?
【8月更文挑战第27天】多租户系统在云计算与大数据领域日益重要,它让不同用户或组织能在共享基础设施上独立运行应用和服务,同时确保资源隔离与安全。ADB(如阿里云数据库)通过资源组及标签实现高效多租户隔离。资源组作为一种软隔离策略,允许为不同租户分配独立的计算和存储资源,并设置资源上限;资源标签则支持更细粒度的硬隔离,可为每个数据库表或查询指定特定标签,确保资源有效分配。此外,ADB还提供了资源监控与告警功能,帮助管理员实时监控并调整资源分配,避免性能瓶颈。这种灵活且高效的资源隔离方案为多租户环境下的数据处理提供了强大支持。
250 0
|
5月前
|
数据库连接 数据库
实现加载驱动、得到数据库对象、关闭资源的代码复用,将代码提取到相应的工具包里边。优化程序
该博客文章展示了如何通过创建工具类`Connectiontools`实现数据库连接、语句执行以及资源关闭的代码复用,以优化程序并提高数据库操作的效率和安全性。
|
5月前
|
存储
【Azure Developer】Github Action部署资源(ARM模板)到Azure中国区时,遇见登录问题的解决办法
【Azure Developer】Github Action部署资源(ARM模板)到Azure中国区时,遇见登录问题的解决办法
|
6月前
|
负载均衡 Oracle 关系型数据库
关系型数据库Oracle 资源共享
【7月更文挑战第10天】
49 1
|
8月前
|
存储 监控 Apache
查询提速11倍、资源节省70%,阿里云数据库内核版 Apache Doris 在网易日志和时序场景的实践
网易的灵犀办公和云信利用 Apache Doris 改进了大规模日志和时序数据处理,取代了 Elasticsearch 和 InfluxDB。Doris 实现了更低的服务器资源消耗和更高的查询性能,相比 Elasticsearch,查询速度提升至少 11 倍,存储资源节省达 70%。Doris 的列式存储、高压缩比和倒排索引等功能,优化了日志和时序数据的存储与分析,降低了存储成本并提高了查询效率。在灵犀办公和云信的实际应用中,Doris 显示出显著的性能优势,成功应对了数据增长带来的挑战。
查询提速11倍、资源节省70%,阿里云数据库内核版 Apache Doris 在网易日志和时序场景的实践
|
6月前
|
存储 SQL 关系型数据库
MySQL数据库学习指南与学习资源推荐
MySQL数据库学习指南与学习资源推荐
|
7月前
|
SQL 分布式计算 MaxCompute
MaxCompute操作报错合集之通过UDF(用户定义函数)请求外部数据库资源并遇到报错,是什么原因
MaxCompute是阿里云提供的大规模离线数据处理服务,用于大数据分析、挖掘和报表生成等场景。在使用MaxCompute进行数据处理时,可能会遇到各种操作报错。以下是一些常见的MaxCompute操作报错及其可能的原因与解决措施的合集。
326 0
|
8月前
|
JavaScript 小程序 Java
校园闲置资源置换|基于SSM+vue的校园短期闲置资源置换平台的设计与实现(源码+数据库+文档)
校园闲置资源置换|基于SSM+vue的校园短期闲置资源置换平台的设计与实现(源码+数据库+文档)
104 0
|
8月前
|
JavaScript 小程序 Java
电子资源|基于SSM+vue的电子资源管理系统(源码+数据库+文档)​
电子资源|基于SSM+vue的电子资源管理系统(源码+数据库+文档)​
70 0
|
8月前
|
数据采集 JSON 小程序
GitHub 开源数据库 chinese-poetry,最全中文诗歌古典文集数据库
GitHub 开源数据库 chinese-poetry,最全中文诗歌古典文集数据库
470 0

热门文章

最新文章