Web系统下Office文档的处理 之OpenXML基础

简介: 上篇文章 http://www.cnblogs.com/2018/archive/2011/03/21/1989088.html ,看到目前不少人都遇到Web系统上office文档的处理,因此本文继续把这方面以前遇到的一些内容整理一下以飨读者。

上篇文章 http://www.cnblogs.com/2018/archive/2011/03/21/1989088.html ,看到目前不少人都遇到Web系统上office文档的处理,因此本文继续把这方面以前遇到的一些内容整理一下以飨读者。

首先Office文档的处理格式选择是选择openxml格式,这应该不是个问题,因为及时有的项目使用的是office 2003等这么老的软件通过安装MS官方的兼容包也可以打开和浏览openxml文档。而openxml是个开放的标准,因此基于这个处理有很多的候选方案和资源【相比以前的二进制私有格式是好了很多很多】。

【文档如果是以前的老格式,可以参考上篇文章的MS官方批量转换工具快速的转换为Openxml格式】

本文简要的介绍如何快速的入门和使用openxml格式

基础和参考资料

规范

Open+XML+Explained.pdf清楚的介绍了openxml的规范,有例子,而且内容不长,适合了解(129页)

例子文档

Open+XML+Explained.pdf 附书的文档

http://openxmldeveloper.org/articles/1970.aspx

Workshop: 各种例子文档

http://openxmldeveloper.org/articles/DeveloperWorkshopContent.aspx

http://openxmldeveloper.org/articles/OpenXMLsamples.aspx提供了符合openxml格式的系列文档,对于实现基于openxml的方案的测试非常有用

OpenXML/ODF Translator (sf.net) 这个项目中有测试文档,涉及了规范的几乎各个方面

其他的参考资料



http://social.msdn.microsoft.com/forums/en-US/oxmlsdk/社区,可以看到问题的讨论和解决方案,并能提交问题由社区支持

http://www.openxml.biz/

www.codeplex.com MS的官方开源站点,各种类型的代码

Open XML SDK


http://openxmldeveloper.org/articles/8264.aspx

SDK和工具包

OpenXMLSDKTool.msi

OpenXMLSDKv2.msi

http://www.microsoft.com/downloads/en/details.aspx?FamilyId=C6E744E5-36E9-45F5-8D8C-331DF206E0D0&displaylang=en 

http://www.microsoft.com/downloads/en/details.aspx?FamilyID=78bea298-a3f9-44cf-bde0-b4f30dc986df

工具Open XML SDK\V2.0\tool\OpenXmlSdkTool.exe,如下图:

可以查看文档的结构和API参考,最酷的是能够看到代码如何实现,这样编写程序时可以参考

clip_image002

通过这个工具可以分析openxml文档的结构,同时还可以看到代码生成文档的方法

参考如上的资料和工具,读取和生成openxml文档应该没有太大的问题了。

相关文章
|
27天前
|
人工智能 文字识别 自然语言处理
1.6K star!这个开源文本提取神器,5分钟搞定PDF/图片/Office文档!
Kreuzberg 是一个基于 Python 的文本提取库,支持从 PDF、图像、Office 文档等 20+ 格式中提取文本内容。采用 MIT 开源协议,具备本地处理、异步架构、智能 OCR 等特性,特别适合需要隐私保护的文档处理场景。
|
3月前
|
开发框架 数据可视化 .NET
.NET 中管理 Web API 文档的两种方式
.NET 中管理 Web API 文档的两种方式
70 14
|
2月前
|
监控 关系型数据库 MySQL
【01】客户端服务端C语言-go语言-web端PHP语言整合内容发布-优雅草网络设备监控系统-硬件设备实时监控系统运营版发布-本产品基于企业级开源项目Zabbix深度二开-分步骤实现预计10篇合集-自营版
【01】客户端服务端C语言-go语言-web端PHP语言整合内容发布-优雅草网络设备监控系统-硬件设备实时监控系统运营版发布-本产品基于企业级开源项目Zabbix深度二开-分步骤实现预计10篇合集-自营版
44 0
|
5月前
|
存储 消息中间件 缓存
构建互联网高性能WEB系统经验总结
如何构建一个优秀的高性能、高可靠的应用系统对每一个开发者至关重要
52 2
|
5月前
|
开发框架 JavaScript 前端开发
TypeScript 是一种静态类型的编程语言,它扩展了 JavaScript,为 Web 开发带来了强大的类型系统、组件化开发支持、与主流框架的无缝集成、大型项目管理能力和提升开发体验等多方面优势
TypeScript 是一种静态类型的编程语言,它扩展了 JavaScript,为 Web 开发带来了强大的类型系统、组件化开发支持、与主流框架的无缝集成、大型项目管理能力和提升开发体验等多方面优势。通过明确的类型定义,TypeScript 能够在编码阶段发现潜在错误,提高代码质量;支持组件的清晰定义与复用,增强代码的可维护性;与 React、Vue 等框架结合,提供更佳的开发体验;适用于大型项目,优化代码结构和性能。随着 Web 技术的发展,TypeScript 的应用前景广阔,将继续引领 Web 开发的新趋势。
105 2
|
5月前
|
存储 消息中间件 缓存
构建互联网高性能WEB系统经验总结
构建互联网高性能WEB系统经验总结
90 16
|
6月前
|
机器学习/深度学习 数据处理 数据库
基于Django的深度学习视频分类Web系统
基于Django的深度学习视频分类Web系统
105 4
基于Django的深度学习视频分类Web系统
|
5月前
|
C#
【Azure App Service】使用Microsoft.Office.Interop.Word来操作Word文档,部署到App Service后报错COMException
System.Runtime.InteropServices.COMException (0x80040154): Retrieving the COM class factory for component with CLSID {000209FF-0000-0000-C000-000000000046} failed due to the following error: 80040154 Class not registered (0x80040154 (REGDB_E_CLASSNOTREG)).
|
5月前
|
负载均衡 监控 算法
论负载均衡技术在Web系统中的应用
【11月更文挑战第4天】在当今高并发的互联网环境中,负载均衡技术已经成为提升Web系统性能不可或缺的一环。通过有效地将请求分发到多个服务器上,负载均衡不仅能够提高系统的响应速度和处理能力,还能增强系统的可扩展性和稳定性。本文将结合我参与的一个实际软件项目,从项目概述、负载均衡算法原理以及实际应用三个方面,深入探讨负载均衡技术在Web系统中的应用。
238 2
|
1月前
|
关系型数据库 MySQL 数据库
基于Flink CDC 开发,支持Web-UI的实时KingBase 连接器,三大模式无缝切换,效率翻倍!
TIS 是一款基于Web-UI的开源大数据集成工具,通过与人大金仓Kingbase的深度整合,提供高效、灵活的实时数据集成方案。它支持增量数据监听和实时写入,兼容MySQL、PostgreSQL和Oracle模式,无需编写复杂脚本,操作简单直观,特别适合非专业开发人员使用。TIS率先实现了Kingbase CDC连接器的整合,成为业界首个开箱即用的Kingbase CDC数据同步解决方案,助力企业数字化转型。
193 5
基于Flink CDC 开发,支持Web-UI的实时KingBase 连接器,三大模式无缝切换,效率翻倍!

热门文章

最新文章