开发者社区> 技术小能手> 正文

资源 | 一网打尽成语歇后语,GitHub新华字典数据库

简介: 今天,文摘菌给大家推荐一个非常优秀的数据库——新华字典数据库。
+关注继续查看

今天,文摘菌给大家推荐一个非常优秀的数据库——新华字典数据库。

数据库收录了包括14032条歇后语,16142个汉字,31648个成语。下面文摘菌就简单的介绍一下这个数据库。

这个数据库放在GitHub中,所有的数据放在data/目录下,并且如果对性能没有要求的同学,可以使用作者的新华字典API访问数据库。

数据库地址:
https://github.com/pwxcoo/chinese-xinhua

项目结构

在GitHub中,整个新华字典数据库的项目结构为:


image

整个结构包括数据文件夹,配置文件以及脚本文件夹,在脚本文件夹下提供了成语脚本和汉字脚本以及歇后语脚本的下载。

数据库介绍及API的使用

前面提到,整个数据库包括14032条歇后语,16142个汉字,31648个成语。

在使用API查询每条成语的时候,分为两种情况:
如果直接请求成语,需要两个参数:
type=idiom 表示需要请求成语
word=兴高采烈 表示请求的成语
请求拼音首字母缩写,也需要两个参数:
type=idiom 表示需要请求成语
word=xgcl 表示请求的成语拼音首字母缩写

下面文摘菌用Python简单实现了一下:

image

返回结果为:

image

上图可知,当你请求的是成语时,返回的结果包括:成语的来源、成语的解释、成语的拼音、用成语造的句子以及成语的首字母缩写。

当访问歇后语的时候则也需要两个参数:
type=xiehouyu 表示需要请求歇后语
riddle=王婆 表示请求的歇后语的语面。可以模糊匹配

Python实现

image

由上图的Python实现可知,当你输入的关键词是模糊的时候,结果会返回带有关键词的所有歇后语。例如,你查询关键词为王婆的歇后语,返回了三条结果,每条结果包含歇后语的迷面以及歇后语的谜底。

当需要访问汉字的时候,当前接口只能直接请求汉字,不能请求拼音。如果请求了拼音,则返回的结果为空。

请求汉字需要两个参数:
type=word 表示需要请求汉字
word=“蒋” 表示请求的汉字

Python实现


如上图所示,当请求‘蒋’这个汉字的时候,返回的结果包括汉字的拼音、汉字的来源、以及汉字的繁体版等等。

注:GET、POST均可,返回数据格式为JSON。

数据库GitHub地址:
https://github.com/pwxcoo/chinese-xinhua

原文发布时间为:2018-07-30
本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“大数据文摘”。

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
Github资源npm或clone的时候报XXX:github.com:443 解决方法
Github资源npm或clone的时候报XXX:github.com:443 解决方法
114 0
GitHub 高效查询Github资源
GitHub 高效查询Github资源
25 0
学习资源 | 推荐2份Github热门校招面试汇总资料
一年一度的秋季招聘马上就要开始了,秋季招聘是校园招聘中最为集中、岗位最多的一次集体招聘会,虽然也有春招,但是对于很多公司而言主要是“查漏补缺”,岗位数量相对于秋招有很大的差距。因此,很多即将毕业的学生会把秋季招聘看的非常重要,毕竟第一份工作对一个人来说是至关重要的,每个同学都希望找到称心如意的工作,我在这里推荐2份不错的Github学习资源,对近两年各大互联网、IT公司面试过程中遇到的问题进行了总结和汇总,希望对即将参加校招的同学有所帮助。
181 0
学习资源 | 推荐一份Github热门机器学习项目
在机器学习的过程中,我们会去不同的平台寻找一些学习资源,对于很多人来说,GitHub是一个非常好用的开源项目托管社区。GitHub上的确有很多热门受欢迎的开源项目,但是我个人认为大多数项目比较浅显,而且形式类似,且内容过于繁多,当学习时却无从下手,或者无法理解这些算法背后的原理。近期GitHub开源了一个热门开源项目,在一段时间学习之后发现的确非常不错,在这里推荐给大家。
314 0
厉害了!竟然有程序员在GitHub上建了一个新华词典数据库
今天,给大家推荐一个GitHub上的一个热门项目——chinese-xinhua ,一个新华字典数据库,截至今日,该项目已经获得了 927个「star」以及 230个「fork」。可能是知道的太少了
127 0
数千用户将包含敏感数据的 Firefox cookie 数据库提交至 GitHub
数千用户将包含敏感数据的 Firefox cookie 数据库提交至 GitHub
54 0
GitHub分享《深度学习500问》优质资源
GitHub分享《深度学习500问》优质资源
83 0
GitHub 3.6k Satr自监督学习(Self-Supervised Learning)资源你值得拥有!
GitHub 3.6k Satr自监督学习(Self-Supervised Learning)资源你值得拥有!
410 0
将github pages搭建的网页添加到百度搜索资源平台
将github pages搭建的网页添加到百度搜索资源平台
156 0
GitHub万星的中文机器学习资源:路线图、视频、电子书、学习建议全在这
本文为你推荐名叫AI Learning的GitHub资源,汇集了30多名贡献者的集体智慧。
5246 0
+关注
技术小能手
云栖运营小编~
文章
问答
视频
来源圈子
更多
+ 订阅
文章排行榜
最热
最新
相关电子书
更多
阿里云数据库产品手册
立即下载
低代码开发师(初级)实战教程
立即下载
阿里巴巴DevOps 最佳实践手册
立即下载