Word格式转化为Html

简介:
[html]  view plain  copy
 print ?
  1. package com.wiseweb.util;  
  2.   
  3. import com.jacob.activeX.ActiveXComponent;  
  4. import com.jacob.com.Dispatch;  
  5. import com.jacob.com.Variant;  
  6.   
  7. public class WordtoHtml {  
  8.   
  9.     //------------------------------------------------------------------------------  
  10.     //方法原型: change(String paths)  
  11.     //功能描述: 将指定目录下面所有的doc文件转化为HTML并存储在相同目录下  
  12.     //输入参数: String  
  13.     //输出参数: 无  
  14.     //返 回 值: 无  
  15.     //其它说明: 递归  
  16.     //------------------------------------------------------------------------------   
  17.       public static boolean change (String FolderPath,String FileName){  
  18.   
  19.             String FileFormat = "";  
  20.             System.out.println(FolderPath);  
  21.             FileFormat = FileName.substring(FileName.length()-4,FileName.length());  
  22.             System.out.println(FileFormat);  
  23.   
  24.             if(FileFormat.equalsIgnoreCase(".doc"))  
  25.             {  
  26.                 String DocFile = FolderPath +"//"+ FileName;  
  27.   
  28.                 System.out.println("word文件路径:"+DocFile);  
  29.                 //word文件的完整路径  
  30.   
  31.                 String HtmlFile = DocFile.substring(0, (DocFile.length() - 4)) + ".html";  
  32.   
  33.                 System.out.println("htm文件路径:"+HtmlFile);  
  34.                 //html文件的完整路径  
  35.   
  36.                 ActiveXComponent app = new ActiveXComponent("Word.Application");  
  37.                 //启动word  
  38.   
  39.                 try  
  40.                 {  
  41.                     app.setProperty("Visible", new Variant(false));  
  42.                     //设置word程序非可视化运行  
  43.   
  44.                     Dispatch docs = app.getProperty("Documents").toDispatch();  
  45.   
  46.                     Dispatch doc = Dispatch.invoke(docs,"Open", Dispatch.Method, new Object[]{DocFile,new Variant(false), new Variant(true)}, new int[1]).toDispatch();   
  47.                     //打开word文件  
  48.   
  49.                     Dispatch.invoke(doc,"SaveAs",Dispatch.Method, new Object[]{HtmlFile,new Variant(8)}, new int[1]);  
  50.                     //作为htm格式保存文件  
  51.   
  52.                     Dispatch.call(doc, "Close",new Variant(false));  
  53.                     //关闭文件  
  54.   
  55.                 }  
  56.                 catch (Exception e)  
  57.                 {  
  58.                     e.printStackTrace();  
  59.                 }  
  60.                 finally  
  61.                 {  
  62.                     app.invoke("Quit", new Variant[] {});  
  63.                     //退出word程序  
  64.                 }  
  65.                 //转化完毕  
  66.                 return true;  
  67.             }  
  68.             return false;  
  69.         }  
  70.   
  71.   
  72.     //------------------------------------------------------------------------------  
  73.     //方法原型: main(String[] args)  
  74.     //功能描述: main文件  
  75.     //输入参数: 无  
  76.     //输出参数: 无  
  77.     //返 回 值: 无  
  78.     //其它说明: 无  
  79.     //------------------------------------------------------------------------------    
  80.      public static void main(String[] args)  
  81.      {  
  82.         
  83. //    String paths = new String("E://wordToHtml");  
  84.       String paths = new String("E:");  
  85. //    String filename = "a.doc";  
  86.       String filename = "servlet和jsp学习指南(Budi kurniawan).doc";  
  87.   
  88.       change(paths, filename);  
  89.   
  90.      }  
  91.   
  92.   
  93.   
  94. }  
其实原理就是利用word把文档打开,然后另存为html格式就ok了。
目录
相关文章
|
4月前
|
Java 网络安全 数据安全/隐私保护
javaMai+Springl实现给QQ邮箱发邮件(带附件,html格式)
javaMai+Springl实现给QQ邮箱发邮件(带附件,html格式)
|
23天前
|
移动开发 HTML5
HTML5文档基本格式
【8月更文挑战第28天】HTML5文档基本格式。
28 4
|
2月前
|
自然语言处理 开发者 Python
Markdown 是一种轻量级标记语言,它允许人们使用易读易写的纯文本格式编写文档,然后转换成格式丰富的 HTML 内容。Markdown 的语法简洁明了、学习容易,而且功能比纯文本更强。
Markdown 是一种轻量级标记语言,它允许人们使用易读易写的纯文本格式编写文档,然后转换成格式丰富的 HTML 内容。Markdown 的语法简洁明了、学习容易,而且功能比纯文本更强。
|
2月前
|
Unix Linux Shell
Sphinx是一个Python文档生成工具,它可以解析reStructuredText或Markdown格式的源代码注释,并生成多种输出格式,如HTML、LaTeX、PDF、ePub等。
Sphinx是一个Python文档生成工具,它可以解析reStructuredText或Markdown格式的源代码注释,并生成多种输出格式,如HTML、LaTeX、PDF、ePub等。
|
3月前
使用LabVIEW打开默认应用程序中的文档(PDF,Word,Excel,Html)
使用LabVIEW的"Open a Document on Disk.vi",存于<LabVIEW>\vi.lib\Platform\browser.llb,可让默认应用打开硬盘文档。此VI仅基础打开功能,高级控制推荐LabVIEW Report Generation Toolkit或ActiveX。注意:避免版本升级问题,最好将VI复制到vi.lib外的目录。
106 3
|
3月前
|
Java Maven
Java在线预览(word转html)--强势推荐
Java在线预览(word转html)--强势推荐
61 0
|
3月前
|
Python
Python基础教程(第3版)中文版 第20章 项目1: 自动添加标签(纯文本转HTML格式) (笔记2)
Python基础教程(第3版)中文版 第20章 项目1: 自动添加标签(纯文本转HTML格式) (笔记2)
|
3月前
|
Python
Python基础教程(第3版)中文版 第20章 项目1: 自动添加标签(纯文本转HTML格式) (笔记)
Python基础教程(第3版)中文版 第20章 项目1: 自动添加标签(纯文本转HTML格式) (笔记)
|
4月前
编程笔记 html5&css&js 007 HTML文本:段落和格式
编程笔记 html5&css&js 007 HTML文本:段落和格式
|
10月前
html转word或pdf
html转word或pdf
143 0