[转]基于模板和XML在BS结构应用中生成word文件

简介: 现在的各类应用系统中时常会需要动态生成Word文件,解决比较常见的两种方法是: 1.      利用Word提供的COM自动化接口控制Word生成文档 2.      利用Word对html的支持,制作html文件,并设置其contentType为"application/msword",使浏览器调用word打开 第一种方法靠Word进程实际完成文件生成工作,而Word并为设计为在服务器端处理并发调用,所以这种方法只适合单机应用。

现在的各类应用系统中时常会需要动态生成Word文件,解决比较常见的两种方法是:
1.      
利用Word提供的COM自动化接口控制Word生成文档
2.      
利用Wordhtml的支持,制作html文件,并设置其contentType"application/msword",使浏览器调用word打开

第一种方法靠Word进程实际完成文件生成工作,而Word并为设计为在服务器端处理并发调用,所以这种方法只适合单机应用。另外,如果要生成比较复杂的word文件,相应的代码会非常烦琐,排版和调试也需要花大量时间。
第二种方法的致命问题是html文档中无法保存二进制数据,比如图片,如果在服务器端生成一堆文件,即难以在浏览器中显示,也无法让用户直接下载。

比较完善的解决办法是基于WordML来生成word文件。WordML是微软为Word设计的xml架构,其完整语法可以在MSDN找到。按照这个语法生成xml文件,可以在文档中随意得到各种word支持的格式。特别需要指出的是可以方便的在文件中内嵌图片,其语法基本是这样:

<w:pict>
    <v:shapetype id="_x0000_t75" ...>
    ... VML shape template definition ...
    </v:shapetype>
    <w:binData w:name="wordml://02000001.jpg">/9j/4AAQSkZJRgABAgAAZABkAAD/7AARRHVja3kAAQAEAAAAPAAA/+4ADkFkb2JlAGTAAAAAAf/b
AIQABgQEBAUEBgUFBgkGBQYJCwgGBggLDAoKCwoKDBAMDAwMDAwQDA4PEA8ODBMTFBQTExwbGxsc
...
更多Base6编码的图片文件数据
    </w:binData>
    <v:shape id="_x0000_i1025" type="#_x0000_t75"
      style="width:212.4pt;height:159pt">
         <v:imagedata src="wordml://02000001.jpg"
           o:title="Image title"/>
    </v:shape>
</w:pict>

关键是图片的实际数据以base64编码之后放在<w:binData></w:binData>标记之间 如果你看了MSDNWordML语法,会发现它非常复杂。这不奇怪,因为Word有非常多的功能,但要写程序根据这么多定义来生成文档就比较费事了。不过我们可以利用模板文件来解决这个问题。 同我们动态生成网页一样,要动态生成的word文件也有相当多部分是固定不变的,并且复杂的版面、格式一般都在这些固定不变的部分中。所以借用生成网页的思路,我们可以在word中先根据需要的版面和格式,结合一些虚拟的数据做出模板文件,然后将这个模板文件保存为xml格式,再在xml文件中找到那些虚拟的数据对应的文本,将它们替换为将采用的后台处理技术的数据处理指令,这样我们就可以在服务器端结合模板文件和数据库查询,生成word文件了。 下面举一个例子。假设我们采用JSP进行word文件生成,首先制作模板文件如下:

连宋个人简历

本人概况

姓名

连宋

出生日期

193777

性别

证件类型

身份证

学历

大学本科

证件号码

41043219700707011

婚姻状况

已婚

期望月薪

面议

户口所在地

然后将这个文件保存为xml格式,我们将得到如下内容的xml文件:

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<?"Word.Document"?>
<w:wordDocument xmlns:w="http://schemas.microsoft.com/office/word/2003/wordml" xmlns:v="urn:schemas-microsoft-com:vml" xmlns:w10="urn:schemas-microsoft-com:office:word" xmlns:sl="http://schemas.microsoft.com/schemaLibrary/2003/core" xmlns:aml="http://schemas.microsoft.com/aml/2001/core" xmlns:wx="http://schemas.microsoft.com/office/word/2003/auxHint" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:dt="uuid:C2F41010-65B3-11d1-A29F-00AA00C14882" xmlns:st1="urn:schemas-microsoft-com:office:smarttags" w:macrosPresent="no" w:embeddedObjPresent="no" w:ocxPresent="no" xml:space="preserve"><o:SmartTagType o:namespaceuri="urn:schemas-microsoft-com:office:smarttags" o:url="" o:name="chsdate"/><o:DocumentProperties><o:Title>
个人简历</o:Title>
... ...
<w:rPr><w:rFonts w:hint="fareast"/><wx:font wx:val="
宋体"/></w:rPr><w:t>连宋个人简历</w:t>
</w:r><w:proofErr w:type="gramStart"/><w:r><w:rPr><w:rFonts w:hint="fareast"/><wx:font wx:val="宋体"/></w:rPr>
... ...
<w:pict><v:shapetype id="_x0000_t75" coordsize="21600,21600" o:spt="75" o:preferrelative="t" path="m@4@5l@4@11@9@11@9@5xe" filled="f" stroked="f"><v:stroke joinstyle="miter"/><v:formulas><v:f eqn="if lineDrawn pixelLineWidth 0"/><v:f eqn="sum @0 1 0"/><v:f eqn="sum 0 0 @1"/><v:f eqn="prod @2 1 2"/><v:f eqn="prod @3 21600 pixelWidth"/><v:f eqn="prod @3 21600 pixelHeight"/><v:f eqn="sum @0 0 1"/><v:f eqn="prod @6 1 2"/><v:f eqn="prod @7 21600 pixelWidth"/><v:f eqn="sum @8 21600 0"/><v:f eqn="prod @7 21600 pixelHeight"/><v:f eqn="sum @10 21600 0"/></v:formulas><v:path o:extrusionok="f" gradientshapeok="t" o:connecttype="rect"/><o:lock v:ext="edit" aspectratio="t"/></v:shapetype><w:binData w:name="wordml://02000001.jpg">/9j/4AAQSkZJRgABAgAAZABkAAD/7AARRHVja3kAAQAEAAAAPAAA/+4ADkFkb2JlAGTAAAAAAf/b
... ...
</w:binData>
<v:shape id="_x0000_i1025" type="#_x0000_t75" style="width:75pt;height:75pt"><v:imagedata src="wordml://02000001.jpg" o:title="cathy"/></v:shape></w:pict>
... ...
</w:sectPr></wx:sub-section></wx:sect></w:body></w:wordDocument>

接下来首先将这个文件按照xml格式进行排版,然后在其中找到需要动态生成的文字部分(WordML中文字以<w:t></w:t>标记起始),将其替换为从后台取数据生成文字的JSP指令,再在文件头部添加JSP控制指令,得到如下的xml文件: 

<%@ page language="java" errorPage="/error.jsp" pageEncoding="GBK" contentType="application/msword;charset=UTF-8" %><%response.setHeader("Content-Disposition", "attachment; filename=resume.doc");%><?xml version="1.0" encoding="UTF-8" standalone="yes"?>

<%@ taglib uri="http://java.sun.com/jstl/core" prefix="c" %>
<%@ taglib uri="http://java.sun.com/jstl/fmt" prefix="fmt" %>


<?"Word.Document"?>
<w:wordDocument xmlns:w="http://schemas.microsoft.com/office/word/2003/wordml" xmlns:v="urn:schemas-microsoft-com:vml" xmlns:w10="urn:schemas-microsoft-com:office:word" xmlns:sl="http://schemas.microsoft.com/schemaLibrary/2003/core" xmlns:aml="http://schemas.microsoft.com/aml/2001/core" xmlns:wx="http://schemas.microsoft.com/office/word/2003/auxHint" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:dt="uuid:C2F41010-65B3-11d1-A29F-00AA00C14882" w:macrosPresent="no" w:embeddedObjPresent="no" w:ocxPresent="no" xml:space="preserve">
 <o:DocumentProperties>
  <o:Title>
个人简历</o:Title>
... ...
 <w:body>
  <wx:sect>
   <wx:sub-section>
    <w:p>
     <w:pPr>
      <w:pStyle w:val="a5"/>
      <w:rPr>
       <w:rFonts w:hint="fareast"/>
      </w:rPr>
     </w:pPr>
     <w:r>
      <w:rPr>
       <w:rFonts w:hint="fareast"/>
       <wx:font wx:val="
宋体"/>
      </w:rPr>
      <w:t><c:out value="${command.name}"/>
个人简历</w:t>

     </w:r>
    </w:p>
... ...
         <w:pict>
          <v:shapetype id="_x0000_t75" coordsize="21600,21600" o:spt="75" o:preferrelative="t" path="m@4@5l@4@11@9@11@9@5xe" filled="f" stroked="f">
           <v:stroke joinstyle="miter"/>
           <v:path o:extrusionok="f" gradientshapeok="t" o:connecttype="rect"/>
           <o:lock v:ext="edit" aspectratio="t"/>
          </v:shapetype>
          <w:binData w:name="wordml://02000001.jpg"><c:out value="${command.portraitBASE64}"/></w:binData>
          <v:shape id="_x0000_i1025" type="#_x0000_t75" style="width:75pt;height:75pt">
           <v:imagedata src="wordml://02000001.jpg" o:title="portrait"/>
          </v:shape>
         </w:pict>
... ...
 </w:body>
</w:wordDocument>

将这个文件以jsp后缀保存,就可以在J2EE系统中配合后台程序生成word文件了。如果你需要浏览器提示保存这个文件,而不是在浏览器中打开,需要在文件头部加入这句:
response.setHeader("Content-Disposition", "attachment; filename=resume.doc");
有很多免费的第三方库可以用于生成图片文件BASE64编码JDK中也有BASE64 Encoder

更简单的方法是在用word制作模板文件时直接在需要动态生成的部分输入jsp指令,然后再保存为xml文件,但要注意检查word保存为xml文件后有没有将jsp指令拆散或插入格式标记。 以上以JSPJSTL为例,换成其它后台技术,比如Velocity,或者ASPPHP,原理也是相同的。 实际上,在需要生成Word文件的应用中,多数时候需要套用固定的格式,这样本文所解释的方法就更加合适。

 

目录
相关文章
|
30天前
|
XML 数据格式
小米备份descript.xml文件
小米备份descript.xml文件
40 0
|
30天前
|
XML 数据格式 Windows
如何从xml文件创建R语言数据框dataframe
如何从xml文件创建R语言数据框dataframe
|
30天前
|
XML 前端开发 数据格式
BeautifulSoup 是一个 Python 库,用于从 HTML 和 XML 文件中提取数据
【5月更文挑战第10天】BeautifulSoup 是 Python 的一个库,用于解析 HTML 和 XML 文件,即使在格式不规范的情况下也能有效工作。通过创建 BeautifulSoup 对象并使用方法如 find_all 和 get,可以方便地提取和查找文档中的信息。以下是一段示例代码,展示如何安装库、解析 HTML 数据以及打印段落、链接和特定类名的元素。BeautifulSoup 还支持更复杂的查询和文档修改功能。
33 1
|
1天前
|
XML Java 数据库连接
idea 从mapper方法直接点进xml文件的解决方法
idea 从mapper方法直接点进xml文件的解决方法
11 2
|
13天前
|
XML 网络协议 Java
XML Web 服务技术解析:WSDL 与 SOAP 原理、应用案例一览
XML Web服务是基于WSDL、SOAP、RDF和RSS等标准的网络应用程序组件技术。WSDL描述服务接口和消息格式,SOAP用于结构化信息交换,RDF描述网络资源,RSS则用于发布网站更新。Web服务特点是自包含、自描述,基于开放协议,可重用且能连接现有软件。WSDL文档包含`types`、`message`、`portType`和`binding`元素,定义服务操作和协议。SOAP协议规定消息格式,通过HTTP等传输。
474 1
|
25天前
|
XML 数据格式 Python
python挑出训练集里图片对应的xml文件,方便统计标签框的类别与数目_python 统计voc2007xml中某一类别框个数(1)
python挑出训练集里图片对应的xml文件,方便统计标签框的类别与数目_python 统计voc2007xml中某一类别框个数(1)
|
30天前
|
Android开发
android string.xml文件中的整型和string型代替
android string.xml文件中的整型和string型代替
16 0
|
30天前
|
XML 安全 API
AndroidManifest.xml文件综合详解
AndroidManifest.xml文件综合详解
19 2
|
30天前
|
XML JavaScript 数据格式
XML Schema(XSD)详解:定义 XML 文档结构合法性的完整指南
XML Schema(XSD)是用于定义XML文档结构的规范,它描述了元素、属性及其顺序、数据类型和约束。与DTD相比,XML Schema支持更多数据类型,如字符串、日期等,并且是基于XML的,允许扩展和重用。学习XML Schema有助于确保数据通信时双方对内容的理解一致,通过验证防止错误。示例展示了如何定义一个`note`元素,包含`to`, `from`, `heading`和`body`子元素,都是字符串类型。XML文档可以通过引用XML Schema进行验证,确保内容符合预设模式。
50 0
|
30天前
|
XML 存储 Java
【OpenCV】—输入输出XML和YAML文件
【OpenCV】—输入输出XML和YAML文件
146 1