开发者学堂课程【Python 语言基础 1 :语法入门:文本和字符集】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/599/detail/8650
文本和字符集
内容介绍:
一、文本的分类
二、解码,编码与字符集
三、常见的字符集
四、乱码
l 文本的分类
文本分成两种,一种叫做纯文本,还有一种叫做富文本
Ø 纯文本中只能保存单一的文本内容,无法保存内容无关的东西(字体、颜色、图片...)
Ø 富文本中可以保存文本以外的内容(word 文档)
Ø
在开发时,编写程序使用的全都是纯文本!纯文本在计算机底层也会转换为二进制保存。
l 解码,编码与字符集
将字符转换为二进制码的过程,我们称为编码;
将二进制码转换为字符的过程,我们称为解码;
编码和解码时所采用的规则,我们称为字符集;
l 常见的字符集
1) ASCII:美国人编码,使用7位来对美国常用的字符进行编码,包含128个字符
2) ISO-8859-1:欧洲的编码,使用8位,包含256个字符
3) GB2312、GBK:国标码,中国的编码
4) Unicode:万国码,包含世界上所有的语言和符号,编写程序时一般都会使用Unicod e 编码 Unicode 编码有多种实现,UTF-8 UTF-16 UTF-32,最常用的就是UTF-8
l 乱码
编写程序时,如果发现程序代码出现乱码的情况,就要马上去检查字符集是否正确。