文章目录
一、Base64 简介
二、Base64 编码原理
三、最后编码组字节不足时补位 '=' 符号
四、Base64 编码实现参考
一、Base64 简介
Base64 不是加密算法 , 是一种 可读性算法 , 其目的不是用于保护数据 , 其目的是为了可读性 ;
普通的二进制数据随机性很大 , 使用二进制文件打开后 , 参考下图 , 有很多奇怪的字符 , 都叫不上名称 , 可读性很差 , 也没办法表述出来 ;
使用 Base64 之后 , 其可读性增强很多 , 标准的 Base64 编码只能从下面的字符中选择字符 ;
private static final byte ENCODE[] = { 'A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J', 'K', 'L', 'M', 'N', 'O', 'P', 'Q', 'R', 'S', 'T', 'U', 'V', 'W', 'X', 'Y', 'Z', 'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q', 'r', 's', 't', 'u', 'v', 'w', 'x', 'y', 'z', '0', '1', '2', '3', '4', '5', '6', '7', '8', '9', '+', '/', };
Base64 由 64 6464 个字符组成 , 包括大写 A-Z , 小写 a-z , 数字 0-9 , 两个符号 + 和 / , 上面代码中的 ENCODE 字符数组中的 64 6464 个字符 ;
比特币中有一种 Base58 编码方式 , 其字符包括大写 A-Z ( 没有 I 字母 ) , 小写 a-z ( 没有 o, i 字母 ) , 数字 1-9 , 没有数字 0 00 , 这是因为数字 0 00 与字母 o 不好区分 , 此外没有 + 和 / 符号 ;
Base58 编码比 Base64 少了 数字 0 00 , 小写字母 i, o, 大写字母 I , 两个符号 + 和 / ;
二、Base64 编码原理
Base64 编码中 , 3 33 个字节一组 , 每个字节 8 88 位 , 总共 24 2424 位 ;
将每组的 3 33 个字节 , 分为 4 44 组 , 每组 6 66 位 ;
一个字节应该是 8 88 位 , 缺少两位 , 在高位的 2 22 位进行补齐 , 在高位补 0 00 ;
每个字节只有后 6 66 位有效数字 , 可以将字节的实际数据控制在 0 00 ~ 63 6363 之间 ;
6 66 位二进制数取值范围是 0 00 ~ 2 6 − 1 2^6 - 12
6
−1 ;
2 6 = 64 2^6 = 642
6
=64
0 00 ~ 63 6363 对应的字符索引表如下 :