[J2EE]java web项目中调用word转html命令行工具

简介: 需求         有一批word文档需要以网页的形式呈现给用户.      需要实现动态更新解决方案      方案一:              建立数据库,把word中的内容放到数据库中去,分别设置不同的字段,通过查询数据库的方式将内容呈现到网页中。

需求

  •          有一批word文档需要以网页的形式呈现给用户.
  •       需要实现动态更新

解决方案

      方案一:         
      建立数据库,把word中的内容放到数据库中去,分别设置不同的字段,通过查询数据库的方式将内容呈现到网页中。这是我最开始的解决思路,但是分析word文档的内容以后发现建立数据库的方案并不可行,原因是word文档的内容格式不统一,比如1.docx的排版是标题+图片+文字介绍+流程图,2.docx的排版是标题+图片+表格+文字介绍,这样设计数据库的时候比较麻烦,一来是图片存储不方便,二来存在字段为空展示页面的时候没有统一的模板的问题。

    方案二:
    把所有的word文档手工编辑成html。这个方案立马就被否决了,首先word文件有几十个,其次后期更新比较困难。

    方案三:
    word直接转成HTML.这个方案是和小郎哥讨论以后,大神写了一个C#版本的word2html命令行工具。这个方案完一步到位实现了由word到html的质变,简洁粗暴!C#实现命令行转html的方法见博客《C#实现的word转html命令行工具》。word2html.exe洗完后html效果和word对比如下图,可以看出生成的html页面与原始文档相比图片位置略有不同,测试发现word中图片的插入方式会影响最终的生成效果,基本上实现了需求。

                


java调用可执行程序


       java提供了exec()方法调用外部可执行程序。(java也有实现word转html的方法,而且不止一种,poi、jacob等都可以。) java调用外部可执行程序方法如下:


package com.wordtohtml;

public class WordToHtml {
	public static void main(String[] args) {
		Runtime rn = Runtime.getRuntime();
		Process p = null;
		String word2html = "";//命令语句
		String fileArray[] = new String[] { "1mantou-ts.docx",	"2huajuan-ts.docx", "3laobing-ts.docx", "4qiemian-ts.docx","5xianshimian-ts.docx", "6guamian-ts.docx",	"7fangbianmian-ts.docx", "8youtiao-ts.docx", "9baozi-ts.docx",	"10sudongshuiiao-ts.docx", "11sudonghundun-ts.docx","12doubao-ts.docx", "13fangbianmifan-ts.docx","14fangbianzhou-ts.docx", "15mifen-ts.docx","16surongmifen.docx", "17penghuamibing.docx", "18migaots.docx","19tangyuan-ts.docx", "20yuanxiao-ts.docx", "21miba-ts.docx","22zongzi-ts.docx", "23renxingbinggan-ts.docx",	"24suxingbinggan-ts.docx", "25sudabinggan-ts.docx",	"26mianbaoyibangongyi-ts.docx", "27eluosimianbao-ts.docx","28meiguomianbao-ts.docx", "29ribenmianbao-ts.docx","30faguomianbao-ts.docx", "31yingguomianbao-ts.docx",	"32deguomianbao-ts.docx", "33yidalimianbao-ts.docx","34jianadamianbao-ts.docx", "35dangaoyibangongyi-ts.docx",	"36tianshidiangao-ts.docx", "37haimiandangao-ts.docx","38zhongnaiyoudangao-ts.docx", "39qifengdangao-ts.docx",	"40zhongnailaodangao-ts.docx", "41qingnailaodangao-ts.docx","42musidangao-ts.docx", "43tongxinfen-ts.docx","44pisabingpi-ts.docx", "45shousi-ts.docx",
		};//word文件名数组
		try {
			for (int i = 0; i < fileArray.length; i++) {
				word2html = "WebContent/W2H/word2html.exe ../upload/doc/"+ fileArray[i]; //循环转换所有word文件
				p = rn.exec(word2html);//调用exec()方法
			}

		} catch (Exception e) {
			e.printStackTrace();
		}
	}
}


       word2html.exe位于WebContent/W2H文件夹下,WordToHtml.java位于src目录下,word文件位于WebContent/upload/doc文件夹下  . 在DOS命令行下执行方式和在java下执行本质上没有区别,java中调用的时候注意文件路径。


               

  总结

  •    需求实现程度90%(高了?),word文件转换存在图片位置瑕疵,图片转换后有毛边。
  •    执行时间:转换45个word文件5秒左右(本机配置:Win7 64bit,i5 CPU,8gRAM,SSD,读取word文件需要OS多次  IO读取磁盘,在普通硬盘上转换时间会加长).
  •  后期需要实现word上传至WebContent/upload/doc文件夹下,自动转换成html并更新前端页面;获取.docx格式文件名需要自动实现。


目录
相关文章
|
22天前
|
缓存 JSON 监控
如何在项目中保证 Web 组件化的性能
保证 Web 组件化的性能需要从多个方面入手,综合运用各种优化方法和策略。通过持续的优化和改进,能够提高组件化的整体性能,为用户提供更好的体验,同时也有助于提高项目的开发效率和质量。
32 8
|
22天前
|
存储 前端开发 JavaScript
如何在项目中高效地进行 Web 组件化开发
高效地进行 Web 组件化开发需要从多个方面入手,通过明确目标、合理规划、规范开发、加强测试等一系列措施,实现组件的高效管理和利用,从而提高项目的整体开发效率和质量,为用户提供更好的体验。
27 7
|
28天前
|
监控 安全 测试技术
如何在实际项目中应用Python Web开发的安全测试知识?
如何在实际项目中应用Python Web开发的安全测试知识?
28 4
|
28天前
|
中间件 Go API
Go语言中几种流行的Web框架,如Beego、Gin和Echo,分析了它们的特点、性能及适用场景,并讨论了如何根据项目需求、性能要求、团队经验和社区支持等因素选择最合适的框架
本文概述了Go语言中几种流行的Web框架,如Beego、Gin和Echo,分析了它们的特点、性能及适用场景,并讨论了如何根据项目需求、性能要求、团队经验和社区支持等因素选择最合适的框架。
70 1
|
1月前
|
JavaScript 前端开发 开发工具
web项目规范配置(husky、eslint、lint-staged、commit)
通过上述配置,可以确保在Web项目开发过程中自动进行代码质量检查和规范化提交。Husky、ESLint、lint-staged和Commitlint共同作用,使得每次提交代码之前都会自动检查代码风格和语法问题,防止不符合规范的代码进入代码库。这不仅提高了代码质量,还保证了团队协作中的一致性。希望这些配置指南能帮助你建立高效的开发流程。
45 5
|
6天前
|
安全 Java API
java如何请求接口然后终止某个线程
通过本文的介绍,您应该能够理解如何在Java中请求接口并根据返回结果终止某个线程。合理使用标志位或 `interrupt`方法可以确保线程的安全终止,而处理好网络请求中的各种异常情况,可以提高程序的稳定性和可靠性。
36 6
|
21天前
|
设计模式 Java 开发者
Java多线程编程的陷阱与解决方案####
本文深入探讨了Java多线程编程中常见的问题及其解决策略。通过分析竞态条件、死锁、活锁等典型场景,并结合代码示例和实用技巧,帮助开发者有效避免这些陷阱,提升并发程序的稳定性和性能。 ####
|
19天前
|
存储 监控 小程序
Java中的线程池优化实践####
本文深入探讨了Java中线程池的工作原理,分析了常见的线程池类型及其适用场景,并通过实际案例展示了如何根据应用需求进行线程池的优化配置。文章首先介绍了线程池的基本概念和核心参数,随后详细阐述了几种常见的线程池实现(如FixedThreadPool、CachedThreadPool、ScheduledThreadPool等)的特点及使用场景。接着,通过一个电商系统订单处理的实际案例,分析了线程池参数设置不当导致的性能问题,并提出了相应的优化策略。最终,总结了线程池优化的最佳实践,旨在帮助开发者更好地利用Java线程池提升应用性能和稳定性。 ####
下一篇
DataWorks