了解一下 - Base64 随笔 第1张

Base64编码是最常见的编码方式(使用64个字符表示任意8bit字节序列),是一种基于64个可打印字符来表示任意二进制数据的方法,是从二进制转换到可见字符的过程。

SRE实战 互联网时代守护先锋,助力企业售后服务体系运筹帷幄!一键直达领取阿里云限量特价优惠。

使用场景

  • 数据加密后通过Base64转换为可见字符串存储
  • URL(需要Url安全的Base64)、Cookie、网页中传输少量二进制数据
  • 将二进制数据(比如图片)保存在文本文件中
  • 不能传输二进制文件的网络环境可以转换Base64在进行网络传输

Base64原理

【Base64编码表】

了解一下 - Base64 随笔 第2张

对二进制数据进行处理,把每3个字节(每个字节为 8bit, 3个字节为24bit)重新划为4组(每组为6bit后,高位补两个 0 为8bit 后作为一个新字节。划分后对应的二进制数值范围是 00000000 - 00111111(十进制范围 0 - 63),正好和码表字符个数对应。), 然后将划分后的字节转换为4个数字作为索引查编码表,获得相应的4个字符,从而得到编码后的字符串。

以字符串 “ABC” 为例,将其Base64编码:
“ABC” 的二进制为 -> 01000001 01000010 01000011

了解一下 - Base64 随笔 第3张

如果要编码的数据二进制位数不是3的倍数,那么最后会在编码的末尾加上1个或2个 = 号进行补足,表示补了多少字节,解码的时候会被去掉。

以字符串 “A” 为例,将其Base64编码:
“A” 的二进制为 -> 01000001

了解一下 - Base64 随笔 第4张

Base32 和 Base16

除Base64外 ,还有不常用的Base32 和 Base16编码,Base32 是将 5个字节拆分为8组,Base16是将 1个字节拆分为2组, 和Base64编码原理是一样的。

Base32:使用26个大写字母A-Z和数字2-7的32个字符做为字符集。Base32字符集中省略了1,0等数字,记忆或手写它们,容易与字母 I, O 混淆。

【Base32编码表】

了解一下 - Base64 随笔 第5张

Base16:使用数字0-9和字母A-F或小写a-f的16个字符做为字符集。

【Base16编码表】

了解一下 - Base64 随笔 第6张

Base64编码后会使数据增大

因为Base64对二进制数据进行处理时,会将每3个字节(每个字节8bit,共为24bit),划分为4个字节,会使数据增大。

JDK提供的Base64编码方法

在Java7之前可以使用sun.misc.BASE64Encoder和sun.misc.BASE64Decoder,用来Base64编码解码,com.sun开头的包不是公开的,属于sun的内部方法,不建议使用。所以可以使用Apache提供的工具包(commons-codec-1.11.jar)来进行Base64编码解码。
从JDK 7开始Oracle发表了声明,不希望Java程序调用JDK系统包中以sun开头的类(请见:https://www.oracle.com/technetwork/java/faq-sun-packages-142232.html)。
从JKD 8开始,Oracle已经把Base64进行优化并放到JDK的java.util包里了,所以推荐直接使用java.util.Base64进行Base64编码和解码。

例:

// Base64 编码
String encoder = Base64.getEncoder().encodeToString("但愿人长久 千里共婵娟".getBytes());
System.err.println(encoder);        
// Base64 解码
String decoder = new String(Base64.getDecoder().decode(encoder));
System.err.println(decoder);

// 结果
// 5L2G5oS/5Lq66ZW/5LmFIOWNg+mHjOWFseWpteWonw==
// 但愿人长久 千里共婵娟

上面标准的Base64编码后可能出现字符 + 和 /,如果用在URL中,就不能直接作为参数,所以又有一种URL安全的Base64编码,就是把字符 + 和 / 分别变成 - 和 _ ,JDK 也提供了对应的方法。

例:

// URL安全的Base64 编码
String safeEncoder = Base64.getUrlEncoder().encodeToString("但愿人长久 千里共婵娟".getBytes());
System.err.println(safeEncoder);    
// URL安全的Base64 解码
String safeDecoder = new String(Base64.getUrlDecoder().decode(safeEncoder));
System.err.println(safeDecoder);

// 结果
// 5L2G5oS_5Lq66ZW_5LmFIOWNg-mHjOWFseWpteWonw==
// 但愿人长久 千里共婵娟

小结

Base64 是一种把任意二进制数据转换为字符串序列过程
Base64 不能用于真正意义上的数据加密

转载请注明出处: https://www.cnblogs.com/newobjectcc/p/10770084.html

欢迎关注公众号[NO编程]

了解一下 - Base64 随笔 第7张

参考:
https://tools.ietf.org/html/rfc4648
https://en.wikipedia.org

扫码关注我们
微信号:SRE实战
拒绝背锅 运筹帷幄