前言:计算机只能识别二进制,开发语言中数据类型还有数字,字母,中文,特殊符号等,都需要转化成二进制编码才能让技术机识别。
一. 编码方式
ACSLL、Unicode、utf-8、URL 编码、base64 等。
1. ACSLL
对英语字符与二进制位之间的关系,做了统一规定。这被称为 ASCII 码。标准 ACSLL 有 128 个字符(2^7)。分为 33 个不可见字符,95 个可见字符。这 128 个符号,只占用了一个字节的后面 7 位,最前面的一位统一规定为`0`。后面扩展为 EASCLL 有 256 个字符(2^8)
33 个不可见字符:用于进行终端的换行、响铃、删除等动作,在这不做缀叙。
95 个可见字符:48-57 代表 0-9 数字,65-90 代表大写字母 A-Z,97-122 代表小写字母 a-z,剩下的 32-126 代表 ! " # 等字符。
2. Unicode
Unicode 将世界上所有的符号都纳入其中,这是一种所有符号的编码。统一码(Unicode)规定了每个字符的数字编号,这个编号被称为码点(code point)。码点以 U+hex 的形式表示,U+是代表 Unicode 的前缀,而 hex 是一个 16 进制数。取值范围是从 U+0000 到 U+10FFFF。
Unicode 通常为两个字节,对于英文字符的一个字节即可表示,高位字节补 0,这样对比 ASCII 编码存储空间就会翻倍,在存储和传输上就十分不划算。这就会使得 Unicode 编码一时间很难推广。于是,为了较好的解决 Unicode 的编码问题, UTF-8 和 UTF-16、UTF-32 应运而生(UTF-8 是 8 位的单字节码元,UTF-16 是 16 位的双字节码元,UTF-32 是 32 位的四字节码元)。UTF 是 Unicode TransferFormat 的缩写。
3. utf-8
UTF-8 是 Unicode 使用最广的实现方式之一,UTF-8 最大的一个特点,就是它是一种变长的编码方式。它可以使用 1~4 个字节表示一个符号,根据不同的符号而变化字节长度
4. URL 编码
因为 URL 只能包含标准的 ASCII 字符,所以必须对其他特殊字符进行编码。
JavaScript 提供了四个 URL 的编码/解码方法,可以用于将非 ASCII 码的字符,如中文字符、特殊字符、表情字符等,进行 UTF-8 的编解码操作:
编码:encodeURI() 和 encodeURIComponent()
解码:decodeURI() 和 decodeURIComponent()
encodeURI 与 encodeURIComponent 区别:encodeURI 通常用于转码整个 URL,不会对 URL 元字符以及语义字符进行转码。encodeURIComponent 通常只用于转码 URL 组成部分,如 URL 中?后的一串;会转码除了语义字符之外的所有字符,即元字符也会被转码
5. base64
在图片比较多的情况为了减少 http 请求,图片地址会用 base64 编码。格式:data:图片类型 ; 编码类型, data 字符串数据
例子:<img width="900" height="450" src="data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAAGMAAAAqCAYAAA...."/>