Epub格式的电子书——文件组成

简介: epub格式电子书遵循IDPF推出的OCF规范,OCF规范遵循ZIP压缩技术,即epub电子书本身就是一个ZIP文件,我们将epub格式电子书的后缀.epub修改为.zip后,可以通过解压缩软件(例如winrar、winzip)进行浏览或解压处理。

epub格式电子书遵循IDPF推出的OCF规范,OCF规范遵循ZIP压缩技术,即epub电子书本身就是一个ZIP文件,我们将epub格式电子书的
后缀.epub修改为.zip后,可以通过解压缩软件(例如winrar、winzip)进行浏览或解压处理。一个未经加密处理的epub电子书以三个部
分组成,其文件结构如下图所示:





1、文件:mimetype

每一本epub电子书均包含一个名为mimetype的文件,且内容不变,用以说明epub的文件格式。文件内容如下:



application/epub+zip    (注释,表示可以用epub工具和ZIP工具打开)





2、目录:META-INF

依据OCF规范,META-INF用于存放容器信息,默认情况下(即加密处理),该目录包含一个文件,即container.xml,文件内容如下:

1 <?xml version="1.0"?>  
2 <container version="1.0" xmlns="urn:oasis:names:tc:opendocument:xmlns:container">  
3    <rootfiles>  
4       <span style="color:#ff0000;"><rootfile full-path="content.opf" media-type="application/oebps-package+xml"/></span>  
5    </rootfiles>  
6 </container>  
View Code

container.xml的主要功能用于告诉阅读器,电子书的根文件(rootfile)的路径(红色部分)和打开放式,一般来讲,该container.xml文件也不需要作任何修改,除非你改变了根文件的路径和文件名称。
除container.xml文件之外,OCF还规定了以下几个文件:

(1)[manifest.xml],文件列表

 

(2)[metadata.xml],元数据

 

(3)[signatures.xml],数字签名

 

(4)[encryption.xml],加密

 

(5)[rights.xml],权限管理对于epub电子书而言,这些文件都是可选的。

3、目录:OEBPS
OEBPS目录用于存放OPS文档、OPF文档、CSS文档、NCX文档, 如果是制作中文电子书,则还包括ttf文档(即字体文档),OEBPS目录也可以建立相应的子目录,例如建立chapter目录,把各章节的OPS文档放 在chapter目录之中。下图一本epub电子书OEBPS文档的实例图:
其中content.opf文件和toc.ncx文件为必需,其它文件可根据电子书的具体情况而定。
content.opf文件见博文OPF剖析
toc.ncx文件见博文toc.ncx剖析

 

 

相关文章
|
6月前
|
索引 Windows
技术笔记:RTF文件格式
技术笔记:RTF文件格式
90 0
|
前端开发
前端实现在线预览文档(pdf、doc文件)
前端实现在线预览文档(pdf、doc文件)
|
Linux iOS开发 MacOS
一步搞定enex格式文件转换成markdown格式文件(印象笔记)
一步搞定enex格式文件转换成markdown格式文件(印象笔记)
211 0
|
存储 Web App开发 文字识别
为什么 PDF 是最好的「文件格式」| 科普
为什么 PDF 是最好的「文件格式」| 科普
479 0
|
程序员 数据安全/隐私保护 Python
|
XML 数据格式