在下一个版本的Office12中,Office将使用一种新的文件格式,完全基于XML的格式。文档的内容全部使用XML文本的格式保存起来,并基于最新的Office XML Schema。Office12的XML Schema将是一种完全开放的标准,所有细节都会开放给开发人员,大家可以自由的(无版权费用的)参考其Schema来使用和处理Office12的文档。同时,Office文档文件的扩展名也会相应的改成:.docx、.xlsx、.pptx。
由于在Office文档中通常不会只包含文字内容,所以对于其他的图片、视频等信息,都会保存成单独的“子文件”,然后将一个Office文档所包含的所有“子文件”使用ZIP格式打包成一个完整的Office文档文件。实际上,用户可以使用诸如WinZIP这样的软件直接打开.docx,然后单独的查看里面的“子文件”的内容。当然,对于最终用户而言,只需要了解.docx文件就是标准的Word文档而已,其压缩/解压等处理过程对最终用户而言都是透明的。
Office12文件格式图示(了解InfoPath文件格式的朋友应该会会心一笑吧):
微软会在Office12发布后,针对旧版本的Office2000、XP、2003发布Add-in,使其能读写新的Office12格式文档。
相关资料:
Microsoft Office Open XML Formats Guide:http://download.microsoft.com/download/7/4/3/7437e747-aeaf-4419-8181-7307bae89db4/XMLFileFormatsGuide.doc
Microsoft Office Open XML Formats Architecture Guide:http://download.microsoft.com/download/E/3/D/E3DD6FED-0CC1-4788-A742-E1596179AE65/FileFormatsPreview.doc
Word开发组程序经理Brian Jones的blog:http://blogs.msdn.com/brian_jones/default.aspx