Web系统下Office文档的处理-阿里云开发者社区

开发者社区> 狗尾巴呢> 正文

Web系统下Office文档的处理

简介: 在web环境中,我们经常遇到需要对Office文档进行各种各样的处理,如:格式转化、统计、修改等各种操作,如果使用Office的客户端对象模型直接处理,一般会遇到:效率低;服务器资源负载大等一系列问题,毕竟Office对象实现时主要针对的是客户端的使用而设计的,对于批量和大负载的处理自然效率欠佳。
+关注继续查看

在web环境中,我们经常遇到需要对Office文档进行各种各样的处理,如:格式转化、统计、修改等各种操作,如果使用Office的客户端对象模型直接处理,一般会遇到:效率低;服务器资源负载大等一系列问题,毕竟Office对象实现时主要针对的是客户端的使用而设计的,对于批量和大负载的处理自然效率欠佳。

一些常见的方案如下:

  • 基于格式解析的第三方方案,NPOI,POI.net(这个最初是apache的java实现的解析office文档的库),等;不过相对来说有的复杂文档转换时存在一定的问题
  • 基于OpenXML格式,使用OpenXML SDK处理:这个是官方的方案,和MS自己的格式当然兼容性很好,最主要的是速度快
  • Excel文件也可以基于OleDB使用数据访问的形式访问,这个的使用范围有限
  • 不过微软目前新的产品逐步的提供了Server端的解决方案,如Excel Service(Sharepoint 2007引入);Word Automation Service(Sharepoint 2010引入);使用这些方案在服务端处理很有效,不过授权受限,目前独立集成有些问题

office转换,doc批量转换docx

对于以前的office文档,如何转换为openxml格式的文档,MS提供了自己的工具包,可以高效的完成转换,这样在这个基础上我们可以基于OpenXML这个开放标准进行各种应用了

http://blogs.msdn.com/b/ericwhite/archive/2008/09/19/bulk-convert-doc-to-docx.aspx

 

关于OpenXML的相关资料参考

以下这个资料对于Openxml的规范、例子等各个方面有比较详细的叙述可以参考

OpenXML

http://openxmldeveloper.org/

http://openxmldeveloper.org/articles/OpenXMLsamples.aspx

Open XML Format SDK 2.0

Mastering Text in Open XML WordprocessingML Documents
http://msdn.microsoft.com/en-us/library/ff686712.aspx

Creating Documents by Using the Open XML Format SDK 2.0
http://msdn.microsoft.com/en-us/library/dd440953.aspx
http://msdn.microsoft.com/en-us/library/dd452407.aspx
http://msdn.microsoft.com/en-us/library/dd469465.aspx

Open XML Translator 格式转换

http://blogs.msdn.com/b/brian_jones/archive/2006/07/05/657510.aspx

http://openxmldeveloper.org/articles/OpenXMLsamples.aspx

http://blogs.msdn.com/b/brian_jones/archive/2010/02/26/open-xml-sdk-office-services-better-together.aspx
http://openxmldeveloper.org/archive/2010/03/16/8296.aspx

http://blogs.msdn.com/b/acoat/archive/2010/06/19/document-creation-and-conversion-with-the-openxml-sdk-and-sharepoint-2010-word-automation-services.aspx

http://blogs.msdn.com/b/dmahugh/archive/2007/11/13/open-xml-to-daisy-xml-translator.aspx

http://blogs.msdn.com/b/dmahugh/archive/2008/03/31/open-xml-resources-for-developers.aspx

http://blogs.msdn.com/b/brian_jones/archive/2009/01/28/traversing-in-the-open-xml-dom.aspx

http://blogs.technet.com/b/gray_knowlton/archive/2010/01/11/regarding-custom-xml-patch-distribution-and-availability.aspx
Regarding Custom XML Patch distribution and availability
http://social.msdn.microsoft.com/Forums/en-US/worddev/thread/10fe3eaa-d6c2-4763-aa84-e57164cec96d/

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
jQuery EasyUI API 中文文档 - 日期框(DateBox)
DateBox 日期框 扩展自 $.fn.combo.defaults。用 $.fn.datebox.defaults 重写了 defaults。 依赖 combo calendar 用法 1. 1. $('#dd').datebox({   2.     required:true 3. });  特性 其特性扩展自 combo,下列是为 datebox 增加的特性。
839 0
Web系统下Office文档的处理
在web环境中,我们经常遇到需要对Office文档进行各种各样的处理,如:格式转化、统计、修改等各种操作,如果使用Office的客户端对象模型直接处理,一般会遇到:效率低;服务器资源负载大等一系列问题,毕竟Office对象实现时主要针对的是客户端的使用而设计的,对于批量和大负载的处理自然效率欠佳。
772 0
jQuery EasyUI API 中文文档 - 日期时间框(DateTimeBox)
DateTimeBox  日期时间框 扩展自 $.fn.datebox.defaults。用 $.fn.datetimebox.defaults 重写了 defaults。     依赖 datebox timespinner 用法 1.
954 0
Web系统下Office文档的处理 之OpenXml应用分类资料
本文对常见的处理参考和工具提供一个简要的参考。 对于实际的解决方案参考如下地址(有很多的分类知识) http://blogs.msdn.com/b/ericwhite/archive/2008/10/20/eric-white-s-blog-s-table-of-contents.
956 0
异常处理 - PHP手册笔记
原文:异常处理 - PHP手册笔记 PHP代码中所产生的异常可被throw语句抛出,并被catch语句捕获。需要进行异常处理的代码都必须放入try代码块内,每一个try至少要有一个与之对应的catch。
810 0
AKKA文档(java)——角色系统
角色是封装了状态与行为的对象,它们通过交换放入接收者信箱的消息实现两两之间的通讯。从某种意义上说,角色是最严格的面向对象编程,不过最好还是把它们当作人来看待:当用角色为一个方案建模时,想象有一群人,并给他们分配了任务,他们在一个组织结构中发挥职能作用,并想象如何做到故障升级(就像在不需要考虑实际利益的情况下与人打交道,也就是说我们不需要关心他们的情绪变化或道德问题)。
1223 0
Linux内核官方文档atomic_ops.txt【摘自Linux 内核文档】
摘自Linux内核文档 Documentation/atomic_ops.txt,不是本人原创 Semantics and Behavior of Atomic and Bitmask Operations David S.
750 0
+关注
狗尾巴呢
从事研发20年 涉及桌面软件、嵌入式设备、C/S分层系统、B/S业务系统、互联网系统等等各类系统 语言涉及C/C++ .net系统 java系列 前端系列等等不同的类别 主控和主导了国家863项目,企业业务应用系统,自然语言翻译系统,数据库审计等系列的软件研发
435
文章
2
问答
文章排行榜
最热
最新
相关电子书
更多
《2021云上架构与运维峰会演讲合集》
立即下载
《零基础CSS入门教程》
立即下载
《零基础HTML入门教程》
立即下载