文本,是指书面语言的表现形式,从文学角度说,通常是具有完整、系统含义的一个句子或多个句子的组合。一个文本可以是一个句子、一个段落或者一个篇章。计算机中的文本分为纯文本和富文本。
纯文本中只能保存单一的文本内容,无法保存内容无关的信息如字体、颜色、图片等。
纯文本在计算机底层使用二进制数据进行保存。在保存过程中,我们将字符转换为二进制码的过程成为编码。将二进制码转换为字符的过程称为解码。编码与解码采用字符集的规则进行。
富文本,也称为格式化文本,与纯文本相比,除了保存文本信息外,还可以保存风格、排版等信息,如颜色、式样(黑体、斜体等)、字体尺寸、特性(如超链接)等。
资料来源:
- 维基百科词条:文本文件
- 百度百科词条:文本