OpenOffice格式转换中文乱码终极解决方案

简介: 1、环境CentOS release 6.7 (Final)已安装:openoffice4.1.3, jodconverter.2.2.2。

2、OpenOffice使用

Apache OpenOffice是一款先进的开源 办公软件套件,它包含文本文档、电子表格、演示文稿、绘图、数据库等,能够支持许多语言,可以在多种操作系统上运作,并能够读写其它常用办公软件包生成的文件。同时它也是一个平台,用户可以基于其提供的API接口来开发自己的应用程序。


Jodconverter是一个JAVA的OpenDocument**文件转换器,利用OpenOffice可以进行多种文档格式之间的转换,支持的格式包括OpenDocument,PDF,RTF,Word,Excel,PowerPoint,以及Flash。它可以被用做**JAVA库,命令行工具,或者一个WEB应用。


已验证过的格式转换支持如下:

【1】、ppt/pptx转为html,转成的html结果是:文字和图片分开存储,每页PPT对应一个html。

【2】、ppt/pptx转pdf;

【3】、doc/docx转html。


3、格式转换出现中文乱码

java -jar /opt/jodconverter-2.2.2/lib/jodconverter-cli-2.2.2.jar /opt/test.ppt /opt/test.pdf

乱码症状:所有中文字符都显示为???乱码。

我遇到的情况是:ppt转pdf出现乱码,随即花了半天的时间找到了解决方案。

其他类型转换出现乱码如:doc转pdf等的解决方案都类似。


4、乱码解决方案

步骤1:创建路径。

在centos的/usr/java/jdk1.8.0_91/jre/lib/fonts下新建路径:fallback。


[root@780ec6 fallback]# echo $JAVA_HOME

/usr/java/jdk1.8.0_91

1

2

步骤2:上传字体。

将字体:simhei.ttf 黑体、simsun.ttc 宋体(windows下通过everything找下)上传至/usr/java/jdk1.8.0_91/jre/lib/fonts/fallback路径下。


步骤3:查看系统字体文件路径。

查看方案:


[root@80ec6 fallback]# cat /etc/fonts/fonts.conf

<!-- Font directory list -->

 <dir>/usr/share/fonts</dir>

 <dir>/usr/share/X11/fonts/Type1</dir> <dir>/usr/share/X11/fonts/TTF</dir> <dir>/usr/local/share/fonts</dir>

 <dir>~/.fonts</dir>

1

2

3

4

5

步骤4:字体拷贝。

将 /usr/java/jdk1.8.0_91/jre/lib/fonts的全部内容,拷贝到步骤3查看的路径下, 我的字体路径为:/usr/share/fonts。


步骤5:更新缓存

执行命令:fc-cache


步骤6:kill掉openoffice进程。

[root@80ec6 fonts]# ps -ef | grep openoffice

root 3045 3031 0 06:19 pts/1 00:00:03 /opt/openoffice4/program/soffice.bin -headless -accept=socket,host=127.0.0.1,port=8100;urp; -nofirststartwizard

执行kill:kill -9 3045

1

2

3

步骤7:重启后台运行openoffice。

[root@a3cf78780ec6 openoffice4]# soffice -headless -accept="socket,host=127.0.0.1,port=8100;urp;" -nofirststartwizard &

1

步骤8:完成格式转换。

java -jar /opt/jodconverter-2.2.2/lib/jodconverter-cli-2.2.2.jar /opt/test.ppt /opt/test.pdf

1

至此,转换完毕,乱码不再存在。

相关文章
|
8月前
libreoffice转换文件乱码
libreoffice转换文件乱码
117 0
SAP 系统里的中文数据,用 ABAP 导出成 Excel 文件时遇到乱码的分析和解决办法试读版
SAP 系统里的中文数据,用 ABAP 导出成 Excel 文件时遇到乱码的分析和解决办法试读版
|
10月前
|
Java 关系型数据库 MySQL
JavaWeb 乱码问题终极解决方案!
JavaWeb 乱码问题终极解决方案!
|
Java 应用服务中间件 容器
Tomcat源码分析之中文乱码(一)
Tomcat源码分析之中文乱码(一)
147 0
|
JavaScript
如何解决 Camtasia9 导入 srt 字幕后出现乱码的问题
如何解决 Camtasia9 导入 srt 字幕后出现乱码的问题
如何解决 Camtasia9 导入 srt 字幕后出现乱码的问题
|
JavaScript
ie8 ie浏览器下载excel文件乱码,变成压缩包,解决方案
ie8 ie浏览器下载excel文件乱码,变成压缩包,解决方案
176 0
|
编解码 Java 数据库
OpenOffice格式转换中文乱码终极解决方案
Apache OpenOffice是一款先进的开源 办公软件套件,Jodconverter是一个JAVA的OpenDocument**文件转换器,利用OpenOffice可以进行多种文档格式之间的转换,它可以被用做**JAVA库,命令行工具,或者一个WEB应用。
1912 0
OpenOffice格式转换中文乱码终极解决方案