深蓝词库转换1.6发布

简介:

由于在技术上和功能上没有什么突破,一直心里的痛就是对QQ拼音分类词库(qpyd格式)的解析,一直无从下手,所以这半年来我一直都没有发布新版本的“深蓝词库转换”。期间也收到了很多朋友的来信,提出了修改意见和建议,我表示非常感谢。最近听闻搜狗细胞词库(scel格式)的内部格式有所改变,最新的词库文件1.5版无法进行解析了,所以我经过调试修改了解析的算法,发布1.6版。

这次发布我个人觉得没有什么大的改进,下面还是总结下与1.5版比有什么不同吧:

  1. 修改了搜狗细胞词库(scel格式)的解析算法,可以解析最新的搜狗细胞词库。
  2. 另外还有就是QQ手机输入法对导出的格式变了,修改了下解析函数,支持最新QQ手机输入法的文本词库格式。
  3. 增加了导出文件的默认文件名与原文件名相同的功能,不需要在导出保存时还要自己去想个名字了。
  4. 调整了下菜单项,去掉了“允许批量词库转换”选项,默认就允许,只有用户选择或拖拽多个文件即可。

总结下现在这个程序还有哪些我想实现却很有难度的功能点:

  • 解析QQ输入法的分类词库(qpyd格式)。
  • 生成触宝输入法的词库文件,供触宝输入法导入。
  • 生成百度词库(bcd格式)文件,供百度手机输入法用。

另外还有一点,不知道百度手机输入法在对词库导入时为什么会加入文件大小的限制,如果一个词库文件大于4M,那么就会导入失败,所以使用百度手机输入法的同学要注意了,如果你生成的词库文件大于4M,那么就需要拆分成多个文件,然后一个一个的导入。

下载地址:http://imewlconverter.googlecode.com/files/imewlconverter_1_6.zip

代码开源,托管在Google Code上,使用SVN可以下载。

目录
相关文章
|
运维 监控 Kubernetes
EDAS助力「人人视频」新业务快速稳健上云
随着疫情袭来,影院全部封闭,然而大家看电影的热情不减,但优质渠道比较少,人人视频敏锐的探察到这个市场需求,结合自身用户量和优质片源的优势,准备推出电影点播业务!
5950 80
EDAS助力「人人视频」新业务快速稳健上云
|
SQL 数据库
SQL中的DQL、DML、DDL和DCL是怎么区分和定义的
SQL中的DQL、DML、DDL和DCL是怎么区分和定义的
830 1
|
安全 物联网 云计算
阿里云发布全国首个《阿里公共云用户等保2.0合规能力白皮书》深度解读等云计算、物联网扩展要求
12月1日,信息系统等级保护条列 2.0(以下简称等保2.0)正式实施,相较等保1.0,本次等保2.0覆盖领域更广,从原有传统系统基础上延伸到了云计算、移动互联、物联网和大数据等新兴领域。为了应对这样的新变化,阿里云发布了全国首个《阿里公共云用户等保2.0合规能力白皮书》,针对等保通用安全要求、物联网扩展要求及云技术进行了一一解答。
2807 0
阿里云发布全国首个《阿里公共云用户等保2.0合规能力白皮书》深度解读等云计算、物联网扩展要求
|
机器学习/深度学习 人工智能 算法
什么是AI透明度,为什么我们需要它?
我们可能完全不知道到最终AI算法底会进化成什么样,是否会造成严重的后果,一切皆有可能……
2850 0
什么是AI透明度,为什么我们需要它?
|
人工智能 Cloud Native Oracle
阿里云助力印尼实现“数字化愿景”,开拓互联网掘金之路
印度尼西亚常被互联网创业群体称为是“继中国、印度之后的下一个互联网掘金的国家”,印尼不仅是东南亚人口最多的国家,并且也拥有增长最快的互联网用户。在这里,互联网用户的年增长速度已超过50%,正面临着巨大的科技需求。
2227 0
阿里云助力印尼实现“数字化愿景”,开拓互联网掘金之路
|
存储 人工智能 并行计算
超算简史与下一代超级计算机
为啥你叫超级计算机,别人只能叫普通计算机? 因为我兄弟多,个头大,能力强呀!
6471 0
超算简史与下一代超级计算机
|
存储 NoSQL Serverless
设备在线/离线状态的缓存方案
很多场景中,我们都需要查询设备是否在线,但POP API的访问频次受限,需要我们自己系统缓存设备状态
6759 0
|
NoSQL 测试技术 Docker
K8S从懵圈到熟练:读懂这一篇,集群节点不下线
排查完全陌生的问题,完全不熟悉的系统组件,是售后工程师的一大工作乐趣,当然也是挑战。今天借这篇文章,跟大家分析一例这样的问题。排查过程中,需要理解一些自己完全陌生的组件,比如systemd和dbus。
9209 0
阿里云牵手马来西亚多家知名企业
7月31日,阿里云马来西亚峰会在吉隆坡盛大召开。在峰会上,诸多当地知名企业展示了基于阿里云进行的成功数字商业实践。
2082 0