五分钟知识科普:什么是 Base64编码 | 算法必看系列三十九-阿里云开发者社区

开发者社区> 算法编程> 正文

五分钟知识科普:什么是 Base64编码 | 算法必看系列三十九

简介: Base64 编码是一种基于 64 个可打印字符来表示二进制数据的方法。目前 Base64 已经成为网络上常见的传输 8 位二进制字节代码的编码方式之一。本文将为大家详细介绍下 Base64 编码的相关知识。

原文链接

一、定义

Base64编码 是一种基于 64 个可打印字符来表示二进制数据的方法。目前 Base64 已经成为网络上常见的传输 8 位二进制字节代码的编码方式之一。
为什么会有 Base64 编码呢?因为有些网络传送渠道并不支持所有的字节,例如:传统的邮件只支持可见字符的传送,像 ASCII 码的控制字符就不能通过邮件传送。这样用途就受到了很大的限制。
图片的二进制流的每个字节不可能全部是可见字符,这就导致图片的二进制流无法传送。最好的解决方式就是在不改变传统协议的情况下,做一种扩展方案来支持二进制文件的传送。即把不可打印的字符也能用可打印字符来表示,问题就解决了。
Base64 编码就是为了实现这一方案而设计的编码格式。
Base64 就是一种基于 64 个可打印字符来表示二进制数据的表示方法
它的编码过程如下:

  • 将待转换的字符串每三个字节分为一组,每个字节占 8 个二进制位,那么共有 24 个二进制位。
  • 将第(1)步得到的每 24 个二进制位分为每 6 个一组,则每 3 个字节可分为 4 组。
  • 在每组前面添加两个 0 ,每组由 6 个二进制位变为 8 个二进制位,总共 32 个二进制位,即四个字节。
  • 根据 Base64编码对照表(见下表)获得对应的值。

1.jpg
大多数编码都是由字符串转化成二进制的过程,而 Base64 的编码则是从二进制转换为字符串。与常规恰恰相反,Base64 编码主要用在传输、存储、表示二进制领域,不能算得上加密,只是无法直接看到明文。也可以通过打乱Base64 编码来进行加密。中文有多种编码(比如:utf-8、gb2312、gbk等),不同编码对应Base64编码结果都不一样。

二、补充

挺多人会误以为 Base64 是加密算法,喜欢在数据传输不安全的时候来一句:使用 Base64 加密一下呗。
我们先来看一下加密的定义:在密码学中,加密(英语:Encryption)是将明文信息改变为难以读取的密文内容,使之不可读的过程。只有拥有解密方法的对象,经由解密过程,才能将密文还原为正常可读的内容。
所谓加密算法就是加密的方法。
如果你使用  Base64  进行 “加密” ,第三方拿到数据可以瞬间解密,根本无法实现你想要的 加密 效果。因此,Base64 不能说是 加密算法,只能说是 编码

三、Tips

如果你需要在网络上留下你的 微信号、邮箱、QQ 、手机号等具有隐私信息的时候,你不妨留下它们对应的 Base64 编码信息。一方面,想要联系你的人需要进行解码操作,可以过滤一部分需求没那么强烈的人;另外一方面也可以形成 简单的反爬虫 操作,不容易被爬虫收集到你的隐私信息。

作者 | 程序员小吴

来源 | 五分钟学算法

版权声明:如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件至:developerteam@list.alibaba-inc.com 进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容。

分享:
算法编程
使用钉钉扫一扫加入圈子
+ 订阅

开发者社区在线编程频道官方技术圈。包含算法资源更新,周赛动态,每日一题互动。

官方博客
链接