Base64 的原理、实现及应用

简介: Base64编码是基于64个字符(字符分别为:ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxzy0123456789+/)的编码方式,因为2的6次方正好为64,所以我们用6bit就可以表示出64个字符,eg:000000对应'A',000001对应'B',111111对应'/'。

Base64编码是基于64个字符(字符分别为:ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxzy0123456789+/)的编码方式,因为2的6次方正好为64,所以我们用6bit就可以表示出64个字符,eg:000000对应'A',000001对应'B',111111对应'/'。
转换表如下:


img_5f98e3d5baba50fd4daf4f19f28e5c6e.png
QQ截图20160411092432.png

按我们的习惯,8bit是1个字节,所以我们正常使用的时候,一般都是1Byte=8bit(字符'a'=97=01100001)来使用。所以我们处理字符串的时候会遇到8bit/16bit/24bit/32bit……的情况,而Base64按照6bit为一个单元,处理的时候会遇到6bit/12bit/18bit/24bit/30bit……的情况,8和6的最小公倍数是24,所以我们用1、2、3个正常字符这三种情况就可以把所有需要转换成Base64的字符串概括了。

  • 被3整除个字符(3/6/9/12……):abc=01100001 01100010 01100011 分成Base64分组后为:011000 010110 001001 100011 即24 22 9 35,对应Base64编码的 YWJj
  • 除3余1个字符(2/5/8/11……):ab=01100001 01100010,分成Base64分组后为:011000 010110 0010,0010不够6bit,需要补0为:001000,得到YWI,因为4个Base编码为一组,最后再补上'='补齐一组,即:YWI=
  • 除3余2个字符(1/4/7/10……):a=011000010,分成Base64分组后为:011000 01,01不够6bit,需要补0为:010000,得到YQ,因为4个Base编码为一组,最后再补上'='补齐一组,即:YQ==

上面的文字归结为下图:

img_a00cab4d99b5c0068ee60f2297baf51e.png
QQ截图20160411094646.png

可以看出,所有转换后的Base64编码都是4个字符的倍数(4/8/12/16……),如果不够4个字符的,都用'='填充了。

/**
 * <p>Base64编码是基于64个字符(字符分别为:ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxzy0123456789+/)的编码方式,
 * 因为2的6次方正好为64,所以我们用6bit就可以表示出64个字符,eg:000000对应A,000001对应B</p>
 * <p>按我们的习惯,一般都是1Byte=8bit(字符'a'=97=01100001)的使用,所以我们可以用24bit(6和8的最小公倍数)来进行分组,24正好事3BYTE,可以分出4组Base64的分组,需要编码的字符串有如下情况:
 * <li>被3整除:abc=01100001 01100010 01100011 分成Base64分组后为:011000 010110 001001 100011 即24 22 9 35,对应Base64编码的 YWJj</li>
 * <li>除3余1:ab=01100001 01100010,分成Base64分组后为:011000 010110 0010,0010不够6bit,需要补0为:001000,得到YWI,因为4个Base编码为一组,最后再补上'='补齐一组,即:YWI=</li>
 * <li>除3余2:a=011000010,分成Base64分组后为:011000 01,01不够6bit,需要补0为:010000,得到YQ,因为4个Base编码为一组,最后再补上'='补齐一组,即:YQ==</li>
 * </p>
 * @author chmod400
 *
 */
public class Base64Utils {
    
    private static String codeStr = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxzy0123456789+/";
    private static char[] code = codeStr.toCharArray();
    
    /**
     * 对字符串进行Base64编码
     * @param str
     * @return
     */
    public static String encode(String str) {
        if(str == null) {
            throw new NullPointerException();
        }
        StringBuffer result = new StringBuffer();
        // 字符串转为二进制
        String binStr = str2Bin(str);
        // 6bit 为一个单元,需要补0的位数
        int tail = binStr.length() % 6;
        if(tail != 0) {//最后剩2bit,需要补4位,剩4位需要补2bit
            tail = 6 - tail;
        }
        for(int i = 0; i < tail; i++) {
            binStr += "0";
        }
        for(int i = 0; i < binStr.length() / 6; i++) {
            int beginIndex = i * 6;
            String s = binStr.substring(beginIndex, beginIndex+6);
            // 二进制转十进制
            int codePoint = Integer.valueOf(s, 2);
            // 对应的字符
            char c = code[codePoint];
            result.append(c);
        }
        // 需要补=的位数
        int groupNum = binStr.length() / 6;// 6bit为一组
        if((groupNum % 4) != 0) {
            tail = 4 - groupNum % 4;
        }
        for(int i = 0; i < tail; i++) {
            result.append("=");
        }
        return result.toString();
    }

    /**
     * base64解码
     * @param str
     * @return
     */
    public static String decode(String str) {
        if(str == null) {
            throw new NullPointerException();
        }
        StringBuffer result =  new StringBuffer();
        // 去除末尾的'='
        int index = str.indexOf("=");
        if (index >= 0) {
            str = str.substring(0, index);
        }
        // base64字符串转换为二进制
        String binStr = base64Str2Bin(str);
        // 将二进制按8bit一组还原成原字符
        for(int i = 0; i < binStr.length() / 8; i++) {
            int beginIndex = i * 8;
            String s = binStr.substring(beginIndex, beginIndex+8);
            String c = bin2Str(s);
            result.append(c);
        }
        return result.toString();
    }
    
    /**
     * 字符串转换为二进制字符串
     * @param str
     * @return
     */
    private static String str2Bin(String str) {
        StringBuffer sb = new StringBuffer();
        // 字符串转为字符数组
        char[] c = str.toCharArray();
        for(int i = 0; i < c.length; i++) {
            // 将每个字符转换为二进制
            String s = Integer.toBinaryString(c[i]);
            // 需要补0的长度
            int len = 8 - s.length();
            for(int j = 0; j < len; j++) {
                s = "0" + s;
            }
            sb.append(s);
        }
        return sb.toString();
    }
    
    /**
     * Base64字符串转换为二进制字符串
     * @param str
     * @return
     */
    private static String base64Str2Bin(String str) {
        StringBuffer sb = new StringBuffer();
        // 字符串转为字符数组
        char[] c = str.toCharArray();
        for(int i = 0; i < c.length; i++) {
            // 将每个字符转换为二进制
            int index = codeStr.indexOf(c[i]);
            String s = Integer.toBinaryString(index);
            // 需要补0的长度
            int len = 6 - s.length();
            for(int j = 0; j < len; j++) {
                s = "0" + s;
            }
            sb.append(s);
        }
        return sb.toString();
    }
    
    /**
     * 二进制转换为字符串
     * @param binStr
     * @return
     */
    private static String bin2Str(String binStr) {
        StringBuffer sb = new StringBuffer();
        for(int i = 0; i < binStr.length() / 8; i++) {
            int beginIndex = i * 8;
            String s = binStr.substring(beginIndex, beginIndex+8);
            // 二进制转十进制
            int codePoint = Integer.valueOf(s, 2);
            // 对应的字符
            char c = Character.toChars(codePoint)[0];
            sb.append(c);
        }
        return sb.toString();
    }
    
    public static void main(String[] args) {
        System.out.println(str2Bin("ab"));
//      System.out.println(bin2Str("000001000001000001000000"));
        /*System.out.println(encode("a"));
        System.out.println(encode("ab"));
        System.out.println(encode("abc"));
        System.out.println(encode(""));
        System.out.println(encode(null));*/
        
//      System.out.println(encode(codeStr));
        
        System.out.println(decode("YQ=="));
        System.out.println(decode("YWI="));
        System.out.println(decode("YWJj"));
        System.out.println(decode("QUJDREVGR0hJSktMTU5PUFFSU1RVVldYWVphYmNkZWZnaGlqa2xtbm9wcXJydHV2d3h6eTAxMjM0NTY3ODkrLw=="));
        System.out.println(decode(""));
        System.out.println(decode(null));
    }

}

目录
相关文章
|
7月前
|
存储 前端开发 数据安全/隐私保护
Base64详解:从编码原理到应用实践
Base64详解:从编码原理到应用实践
|
8月前
|
XML 存储 算法
BASE64的算法说明
【5月更文挑战第10天】BASE64的算法说明
75 3
|
数据安全/隐私保护 C++ Python
Base32系列编码 代码实现过程
Base32系列编码 代码实现过程
194 0
|
8月前
|
存储 算法 安全
C/C++学习 -- Base64算法
C/C++学习 -- Base64算法
90 0
|
8月前
|
存储 安全 数据安全/隐私保护
Base64编码的优缺点
Base64 是一种常用于将二进制数据编码为 ASCII 字符串的编码方法。下面是 Base64 编码的一些优点和缺点: ### 优点: 1. **可读性**:Base64 编码后的数据是纯文本形式的,这使得它可以轻松地在各种文本传输协议和环境中传输,而不会被误解或破坏。 2. **平台无关性**:Base64 编码是基于 ASCII 字符集的,这使得它在几乎所有的操作系统和编程语言中都是可用的。 3. **数据完整性**:Base64 可以确保数据的完整性,因为它是基于 ASCII 字符进行传输的,不会受到二进制数据在不同系统中解释方式的影响。 4. **简单易用**:许多编程语言
299 0
|
数据采集 算法 安全
Base64 编码原理 && 实现
Base64 编码原理 && 实现
111 0
什么是BASE理论?
什么是BASE理论?
127 0
|
存储 数据库 索引
深入浅出理解base编码
深入浅出理解base编码
259 0
深入浅出理解base编码
|
运维 算法 数据挖掘
Proximity-Base Approaches|学习笔记
快速学习 Proximity-Base Approaches
Proximity-Base Approaches|学习笔记
|
编解码 算法 安全
一文看懂Base64原理(并使用java实现)
Base64编码解码算是网络安全领域的很小而且很简单的一个知识点了,虽然简单但是应用场景却极其广泛,可以这样说,开发者要是不懂Base64,基本上可以告别程序猿生涯了。这篇文章从原理入手,并给出java的Base64实现。方便你掌握Base64。
290 0
一文看懂Base64原理(并使用java实现)