深蓝词库转换1.6发布

本文涉及的产品
全局流量管理 GTM,标准版 1个月
云解析 DNS,旗舰版 1个月
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
简介:

由于在技术上和功能上没有什么突破,一直心里的痛就是对QQ拼音分类词库(qpyd格式)的解析,一直无从下手,所以这半年来我一直都没有发布新版本的“深蓝词库转换”。期间也收到了很多朋友的来信,提出了修改意见和建议,我表示非常感谢。最近听闻搜狗细胞词库(scel格式)的内部格式有所改变,最新的词库文件1.5版无法进行解析了,所以我经过调试修改了解析的算法,发布1.6版。

这次发布我个人觉得没有什么大的改进,下面还是总结下与1.5版比有什么不同吧:

  1. 修改了搜狗细胞词库(scel格式)的解析算法,可以解析最新的搜狗细胞词库。
  2. 另外还有就是QQ手机输入法对导出的格式变了,修改了下解析函数,支持最新QQ手机输入法的文本词库格式。
  3. 增加了导出文件的默认文件名与原文件名相同的功能,不需要在导出保存时还要自己去想个名字了。
  4. 调整了下菜单项,去掉了“允许批量词库转换”选项,默认就允许,只有用户选择或拖拽多个文件即可。

总结下现在这个程序还有哪些我想实现却很有难度的功能点:

  • 解析QQ输入法的分类词库(qpyd格式)。
  • 生成触宝输入法的词库文件,供触宝输入法导入。
  • 生成百度词库(bcd格式)文件,供百度手机输入法用。

另外还有一点,不知道百度手机输入法在对词库导入时为什么会加入文件大小的限制,如果一个词库文件大于4M,那么就会导入失败,所以使用百度手机输入法的同学要注意了,如果你生成的词库文件大于4M,那么就需要拆分成多个文件,然后一个一个的导入。

下载地址:http://imewlconverter.googlecode.com/files/imewlconverter_1_6.zip

代码开源,托管在Google Code上,使用SVN可以下载。

目录
相关文章
|
4月前
【科研技巧】Mac系统如何给Endnote 20安装GB/T中文文献格式以及利用Endnote在Word中插入参考文献
在Mac系统下给Endnote 20安装GB/T中文文献格式的步骤以及如何利用Endnote在Word中插入符合GB/T格式的参考文献。
288 5
【科研技巧】Mac系统如何给Endnote 20安装GB/T中文文献格式以及利用Endnote在Word中插入参考文献
|
机器学习/深度学习 编解码 自然语言处理
错字修改 | 布署1个中文文文本拼蟹纠错模型
错字修改 | 布署1个中文文文本拼蟹纠错模型
311 0
CSDN 表情支持,最新emoji表情✨✨【收藏起来】
CSDN 表情支持,最新emoji表情✨✨【收藏起来】
200 1
|
自然语言处理 程序员 Go
深蓝词库转换2.2发布,支持手心输入法和Win10微软拼音
距离上一次大版本的发布已经很久很久了,中间是不是会收到一些用户的来信,提出新的需求,于是只是做小版本的更新,终于积累了一些更新后,打算做个大版本的发布了。 深蓝词库转换是一个输入法的词库互转和生成软件,支持市面上主流的各种输入法软件的词库(加密的除外)和各种输入法(拼音、五笔、二笔,甚至台湾的注音、仓颉等),除了汉语还支持英文词库的导入导出以及根据词典生成英文输入法词库。
1358 0
|
Android开发
Wps 2013 拼音标注两种方式分析
Wps 2013 拼音标注两种方式分析 太阳火神的美丽人生 (http://blog.csdn.net/opengl_es) 本文遵循“署名-非商业用途-保持一致”创作公用协议 转载请保留此句:太阳火神的美丽人生 -  本博客专注于 敏捷开发及移动和物联设备研究:iOS、Android、Html5、Arduino、pcDuino,否则,出自本博客的文章拒绝转载或再转载,谢谢合作。
1573 0