资源 | 一网打尽成语歇后语,GitHub新华字典数据库

简介: 今天,文摘菌给大家推荐一个非常优秀的数据库——新华字典数据库。

今天,文摘菌给大家推荐一个非常优秀的数据库——新华字典数据库。

数据库收录了包括14032条歇后语,16142个汉字,31648个成语。下面文摘菌就简单的介绍一下这个数据库。

这个数据库放在GitHub中,所有的数据放在data/目录下,并且如果对性能没有要求的同学,可以使用作者的新华字典API访问数据库。

数据库地址:
https://github.com/pwxcoo/chinese-xinhua

项目结构

在GitHub中,整个新华字典数据库的项目结构为:


image

整个结构包括数据文件夹,配置文件以及脚本文件夹,在脚本文件夹下提供了成语脚本和汉字脚本以及歇后语脚本的下载。

数据库介绍及API的使用

前面提到,整个数据库包括14032条歇后语,16142个汉字,31648个成语。

在使用API查询每条成语的时候,分为两种情况:
如果直接请求成语,需要两个参数:
type=idiom 表示需要请求成语
word=兴高采烈 表示请求的成语
请求拼音首字母缩写,也需要两个参数:
type=idiom 表示需要请求成语
word=xgcl 表示请求的成语拼音首字母缩写

下面文摘菌用Python简单实现了一下:

image

返回结果为:

image

上图可知,当你请求的是成语时,返回的结果包括:成语的来源、成语的解释、成语的拼音、用成语造的句子以及成语的首字母缩写。

当访问歇后语的时候则也需要两个参数:
type=xiehouyu 表示需要请求歇后语
riddle=王婆 表示请求的歇后语的语面。可以模糊匹配

Python实现

image

由上图的Python实现可知,当你输入的关键词是模糊的时候,结果会返回带有关键词的所有歇后语。例如,你查询关键词为王婆的歇后语,返回了三条结果,每条结果包含歇后语的迷面以及歇后语的谜底。

当需要访问汉字的时候,当前接口只能直接请求汉字,不能请求拼音。如果请求了拼音,则返回的结果为空。

请求汉字需要两个参数:
type=word 表示需要请求汉字
word=“蒋” 表示请求的汉字

Python实现


如上图所示,当请求‘蒋’这个汉字的时候,返回的结果包括汉字的拼音、汉字的来源、以及汉字的繁体版等等。

注:GET、POST均可,返回数据格式为JSON。

数据库GitHub地址:
https://github.com/pwxcoo/chinese-xinhua

原文发布时间为:2018-07-30
本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“大数据文摘”。

相关文章
|
30天前
|
数据采集 JSON 小程序
GitHub 开源数据库 chinese-poetry,最全中文诗歌古典文集数据库
GitHub 开源数据库 chinese-poetry,最全中文诗歌古典文集数据库
|
3月前
|
数据库 OceanBase
OceanBase数据库是一个分布式集群产品,在部署时对硬件资源有特定的需求
OceanBase数据库是一个分布式集群产品,在部署时对硬件资源有特定的需求【1月更文挑战第12天】【1月更文挑战第56篇】
29 2
|
3月前
|
小程序 关系型数据库 MySQL
基于Python和mysql开发的看图猜成语微信小程序(源码+数据库+程序配置说明书+程序使用说明书)
基于Python和mysql开发的看图猜成语微信小程序(源码+数据库+程序配置说明书+程序使用说明书)
|
8月前
|
存储 分布式数据库 调度
GitHub典藏版!腾讯T14级牛人亲码的分布式数据库实践,再次爆火
数据库就是要做好五件事,存储、事务、查询、复制和其他。而对分布式数据库来说,不仅要继续做这五件事,还要多出一件事,分片。在这六件事中,存储和其他这两件事与单体数据库差不多,难点就在事务、查询、复制和分片这四件。
|
4月前
|
数据可视化 开发工具 git
Git【实践 01】使用Git工具托管本地代码到GitHub简单易懂的图文教程(含Git+第三方工具TortoiseGit+中文语言包百度云盘资源)
Git【实践 01】使用Git工具托管本地代码到GitHub简单易懂的图文教程(含Git+第三方工具TortoiseGit+中文语言包百度云盘资源)
48 0
|
5月前
|
存储 NoSQL 中间件
GitHub数据库榜单第一:Redis核心原理实践PDF,点赞已过百万+
Redis是互联网技术领域使用最为广泛的存储中间件,它是「Remote DictionaryService」的首字母缩写,也就是「远程字典服务」。Redis 以其超高的性能、完美的文档、简洁易懂的源码和丰富的客户端库支持在开源中间件领域广受好评。国内外很多大型互联网公司都在使用Redis, 比如Twitter、YouPom、暴雪娱乐、Github、StackOverflow、 腾讯、阿里、京东、华为、新浪微博等等,很多中小型公司也都有应用。也可以说,对Redis的了解和应用实践已成为当下中高级后端开发者绕不开的必备技能。
|
5月前
|
运维 关系型数据库 MySQL
GitHub无抗手!MySQL DBA攻坚指南一出,阿里数据库专家都解脱了
大家可能并不觉得,数据库其实非常重要,每个业内巨头,每个成熟的互联网产品都有多个数据库系统,能保证大量并发场景下不出错,并非易事。尤其是银行、电商、电信、电力、航空等实时交易重要的环境中,可靠的数据库是重中之重,稳定压倒一切。
|
8月前
|
缓存 数据库 OceanBase
OceanBase数据库资源规格规划
OceanBase数据库资源规格规划
91 1
|
8月前
|
设计模式 Cloud Native Java
GitHub爆出阿里内部突击路线+配套学习资源,直接霸榜
又到了一年一度的备战秋招的时间,虽然这两年因为经济环境不太好,年初互联网行业的各大厂都再裁员,前半年的行业发展趋于平稳,随着经济形势正在复苏,今年秋招各个公司hc也逐渐开放,很多小伙伴也反馈面试机会变多了,想查缺补漏冲刺大厂,我软磨硬泡终于从阿里p8手里弄来了突击秘籍,分享给大家。 涨薪秘籍从Java核心并发开始,到经典的框架源码设计模式、分布式微服务架构设计、微服务NetFilx体系和Alibaba体系、微服务架构性能调优、云原生以及虚拟化、Spring Cloud Alibaba项目实战。
114 2
GitHub爆出阿里内部突击路线+配套学习资源,直接霸榜
|
9月前
|
IDE 数据库 开发工具
VS2019连接数据库:未能找到任何适合于指定的区域性或非特定区域性的资源。
VS2019连接数据库:未能找到任何适合于指定的区域性或非特定区域性的资源。
75 0