有用到Office 文件格式的朋友可以研究一下。 另外做共享软件的朋友可以考虑格式转换工具或者类库。 我发现最近SourceForge 上有一个项目正在做这个事情:
http://b2xtranslator.sourceforge.net ,不妨参考。
Office 文件(doc, xls, ppt) 格式的官方网站:
www.microsoft.com/interop/docs/OfficeBinaryFormats.mspx
Microsoft Word
Word 97-2007 Binary File Format (.doc) Specification PDF | XPS
Word 97-2007 Binary File Format (.doc) Specification PDF | XPS
Microsoft PowerPoint
PowerPoint 97-2007 Binary File Format (.ppt) Specification PDF | XPS
PowerPoint 97-2007 Binary File Format (.ppt) Specification PDF | XPS
Microsoft Excel
Excel 97-2007 Binary File Format (.xls) Specification PDF | XPS
Excel 97-2007 Binary File Format (.xls) Specification PDF | XPS
Excel 2007 Binary File Format (.xlsb) Specification PDF | XPS
Office Drawing
Office Drawing 97-2007 Binary Format Specification PDF | XPS
Office Drawing 97-2007 Binary Format Specification PDF | XPS
而且还有一些其他文件的格式也一并公开了
Windows Compound Binary File Format Specification PDF | XPS
Windows Metafile Format (.wmf) Specification PDF | XPS
Ink Serialized Format (ISF) Specification PDF | XPS
另外,这里有一片KB文章专门讲如何从Office二进制文件里面提取信息 《How to extract information from Office files by using Office file formats and schemas》
http://support.microsoft.com/kb/840817/en-us
本文转自 陈本峰 51CTO博客,原文链接:http://blog.51cto.com/wingeek/273908
,如需转载请自行联系原作者