深蓝词库转换1.6发布

本文涉及的产品
全局流量管理 GTM,标准版 1个月
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
云解析 DNS,旗舰版 1个月
简介:

由于在技术上和功能上没有什么突破,一直心里的痛就是对QQ拼音分类词库(qpyd格式)的解析,一直无从下手,所以这半年来我一直都没有发布新版本的“深蓝词库转换”。期间也收到了很多朋友的来信,提出了修改意见和建议,我表示非常感谢。最近听闻搜狗细胞词库(scel格式)的内部格式有所改变,最新的词库文件1.5版无法进行解析了,所以我经过调试修改了解析的算法,发布1.6版。

这次发布我个人觉得没有什么大的改进,下面还是总结下与1.5版比有什么不同吧:

  1. 修改了搜狗细胞词库(scel格式)的解析算法,可以解析最新的搜狗细胞词库。
  2. 另外还有就是QQ手机输入法对导出的格式变了,修改了下解析函数,支持最新QQ手机输入法的文本词库格式。
  3. 增加了导出文件的默认文件名与原文件名相同的功能,不需要在导出保存时还要自己去想个名字了。
  4. 调整了下菜单项,去掉了“允许批量词库转换”选项,默认就允许,只有用户选择或拖拽多个文件即可。

总结下现在这个程序还有哪些我想实现却很有难度的功能点:

  • 解析QQ输入法的分类词库(qpyd格式)。
  • 生成触宝输入法的词库文件,供触宝输入法导入。
  • 生成百度词库(bcd格式)文件,供百度手机输入法用。

另外还有一点,不知道百度手机输入法在对词库导入时为什么会加入文件大小的限制,如果一个词库文件大于4M,那么就会导入失败,所以使用百度手机输入法的同学要注意了,如果你生成的词库文件大于4M,那么就需要拆分成多个文件,然后一个一个的导入。

下载地址:http://imewlconverter.googlecode.com/files/imewlconverter_1_6.zip

代码开源,托管在Google Code上,使用SVN可以下载。

本文转自深蓝居博客园博客,原文链接:http://www.cnblogs.com/studyzy/archive/2012/02/11/2347128.html,如需转载请自行联系原作者

相关文章
|
8月前
|
自然语言处理 算法 Java
基于Python实现四大名著章节标注汉语拼音
基于Python实现四大名著章节标注汉语拼音
60 0
|
资源调度
一天掌握latex论文编辑,从标题作者,段落,数学公式,图片,图表,到参考文献全流程
一天掌握latex论文编辑,从标题作者,段落,数学公式,图片,图表,到参考文献全流程
768 0
|
8月前
EndNote论文参考文献中文文章与英文文章前后顺序修改排列方法
EndNote论文参考文献中文文章与英文文章前后顺序修改排列方法
254 1
EndNote调整中文、英文参考文献的排列先后顺序
本文介绍在EndNote软件中,使得参考文献按照语种排列,中文在前、英文在后的方法~
1189 1
【Word】基于知网研学的文字等内容连同参考文献一同复制粘贴
【Word】基于知网研学的文字等内容连同参考文献一同复制粘贴
205 0
|
自然语言处理 程序员 Go
深蓝词库转换2.2发布,支持手心输入法和Win10微软拼音
距离上一次大版本的发布已经很久很久了,中间是不是会收到一些用户的来信,提出新的需求,于是只是做小版本的更新,终于积累了一些更新后,打算做个大版本的发布了。 深蓝词库转换是一个输入法的词库互转和生成软件,支持市面上主流的各种输入法软件的词库(加密的除外)和各种输入法(拼音、五笔、二笔,甚至台湾的注音、仓颉等),除了汉语还支持英文词库的导入导出以及根据词典生成英文输入法词库。
1367 0

热门文章

最新文章

下一篇
开通oss服务