Word格式转化为Html

简介:
[html]  view plain  copy
 print ?
  1. package com.wiseweb.util;  
  2.   
  3. import com.jacob.activeX.ActiveXComponent;  
  4. import com.jacob.com.Dispatch;  
  5. import com.jacob.com.Variant;  
  6.   
  7. public class WordtoHtml {  
  8.   
  9.     //------------------------------------------------------------------------------  
  10.     //方法原型: change(String paths)  
  11.     //功能描述: 将指定目录下面所有的doc文件转化为HTML并存储在相同目录下  
  12.     //输入参数: String  
  13.     //输出参数: 无  
  14.     //返 回 值: 无  
  15.     //其它说明: 递归  
  16.     //------------------------------------------------------------------------------   
  17.       public static boolean change (String FolderPath,String FileName){  
  18.   
  19.             String FileFormat = "";  
  20.             System.out.println(FolderPath);  
  21.             FileFormat = FileName.substring(FileName.length()-4,FileName.length());  
  22.             System.out.println(FileFormat);  
  23.   
  24.             if(FileFormat.equalsIgnoreCase(".doc"))  
  25.             {  
  26.                 String DocFile = FolderPath +"//"+ FileName;  
  27.   
  28.                 System.out.println("word文件路径:"+DocFile);  
  29.                 //word文件的完整路径  
  30.   
  31.                 String HtmlFile = DocFile.substring(0, (DocFile.length() - 4)) + ".html";  
  32.   
  33.                 System.out.println("htm文件路径:"+HtmlFile);  
  34.                 //html文件的完整路径  
  35.   
  36.                 ActiveXComponent app = new ActiveXComponent("Word.Application");  
  37.                 //启动word  
  38.   
  39.                 try  
  40.                 {  
  41.                     app.setProperty("Visible", new Variant(false));  
  42.                     //设置word程序非可视化运行  
  43.   
  44.                     Dispatch docs = app.getProperty("Documents").toDispatch();  
  45.   
  46.                     Dispatch doc = Dispatch.invoke(docs,"Open", Dispatch.Method, new Object[]{DocFile,new Variant(false), new Variant(true)}, new int[1]).toDispatch();   
  47.                     //打开word文件  
  48.   
  49.                     Dispatch.invoke(doc,"SaveAs",Dispatch.Method, new Object[]{HtmlFile,new Variant(8)}, new int[1]);  
  50.                     //作为htm格式保存文件  
  51.   
  52.                     Dispatch.call(doc, "Close",new Variant(false));  
  53.                     //关闭文件  
  54.   
  55.                 }  
  56.                 catch (Exception e)  
  57.                 {  
  58.                     e.printStackTrace();  
  59.                 }  
  60.                 finally  
  61.                 {  
  62.                     app.invoke("Quit", new Variant[] {});  
  63.                     //退出word程序  
  64.                 }  
  65.                 //转化完毕  
  66.                 return true;  
  67.             }  
  68.             return false;  
  69.         }  
  70.   
  71.   
  72.     //------------------------------------------------------------------------------  
  73.     //方法原型: main(String[] args)  
  74.     //功能描述: main文件  
  75.     //输入参数: 无  
  76.     //输出参数: 无  
  77.     //返 回 值: 无  
  78.     //其它说明: 无  
  79.     //------------------------------------------------------------------------------    
  80.      public static void main(String[] args)  
  81.      {  
  82.         
  83. //    String paths = new String("E://wordToHtml");  
  84.       String paths = new String("E:");  
  85. //    String filename = "a.doc";  
  86.       String filename = "servlet和jsp学习指南(Budi kurniawan).doc";  
  87.   
  88.       change(paths, filename);  
  89.   
  90.      }  
  91.   
  92.   
  93.   
  94. }  
其实原理就是利用word把文档打开,然后另存为html格式就ok了。
目录
相关文章
|
20天前
|
前端开发
html 格式
【10月更文挑战第14天】html 格式
32 4
|
1月前
|
编解码 前端开发 UED
HTML多媒体格式支持与优化
在HTML中,多媒体格式的支持与优化至关重要。使用`<audio>`、`<video>`和`<img>`标签可分别嵌入音频、视频和图像。支持的格式包括MP3、OGG、JPEG等。为优化体验,应压缩文件、采用响应式设计、使用懒加载,并考虑转码及CDN托管。此外,添加字幕和描述文件可提高辅助功能。遵循这些最佳实践,能显著提升多媒体内容的加载速度与用户满意度。
|
5天前
|
移动开发 编解码 UED
除了 `<audio>` 和 `<video>` 标签,HTML5 还支持哪些多媒体格式?
【10月更文挑战第19天】HTML5对多种多媒体格式的支持,为网页开发者提供了丰富的选择,能够更好地满足不同类型多媒体内容在网页中的展示和交互需求,提升了网页的用户体验和多媒体应用的多样性。
|
1月前
|
JSON 数据格式
LangChain-20 Document Loader 文件加载 加载MD DOCX EXCEL PPT PDF HTML JSON 等多种文件格式 后续可通过FAISS向量化 增强检索
LangChain-20 Document Loader 文件加载 加载MD DOCX EXCEL PPT PDF HTML JSON 等多种文件格式 后续可通过FAISS向量化 增强检索
53 2
|
1月前
|
机器学习/深度学习 JSON JavaScript
LangChain-21 Text Splitters 内容切分器 支持多种格式 HTML JSON md Code(JS/Py/TS/etc) 进行切分并输出 方便将数据进行结构化后检索
LangChain-21 Text Splitters 内容切分器 支持多种格式 HTML JSON md Code(JS/Py/TS/etc) 进行切分并输出 方便将数据进行结构化后检索
22 0
|
2月前
|
SQL 安全 数据库
用html+javascript打造公文一键排版系统2:显示源码/显示预览、清除格式
用html+javascript打造公文一键排版系统2:显示源码/显示预览、清除格式
|
3月前
|
移动开发 HTML5
HTML5文档基本格式
【8月更文挑战第28天】HTML5文档基本格式。
38 4
|
4月前
|
自然语言处理 开发者 Python
Markdown 是一种轻量级标记语言,它允许人们使用易读易写的纯文本格式编写文档,然后转换成格式丰富的 HTML 内容。Markdown 的语法简洁明了、学习容易,而且功能比纯文本更强。
Markdown 是一种轻量级标记语言,它允许人们使用易读易写的纯文本格式编写文档,然后转换成格式丰富的 HTML 内容。Markdown 的语法简洁明了、学习容易,而且功能比纯文本更强。
|
4月前
|
Unix Linux Shell
Sphinx是一个Python文档生成工具,它可以解析reStructuredText或Markdown格式的源代码注释,并生成多种输出格式,如HTML、LaTeX、PDF、ePub等。
Sphinx是一个Python文档生成工具,它可以解析reStructuredText或Markdown格式的源代码注释,并生成多种输出格式,如HTML、LaTeX、PDF、ePub等。
|
5月前
|
Java Maven
Java在线预览(word转html)--强势推荐
Java在线预览(word转html)--强势推荐
100 0