Skip to content

Latest commit

 

History

History
114 lines (83 loc) · 6.98 KB

24.Java加密解密之Base64.md

File metadata and controls

114 lines (83 loc) · 6.98 KB

#24.Java加密解密之Base64

##24.1 Base64 在计算中,字节(byte)是最小的计量单元。ASCII编码使用一个字节对数据进行编码,共可容纳2^8=256个字符。然而在ASCII编码的256个字符当中,有很多字符都是不可打印、对人不可见的。例如空字符、响铃、退格等等字符。如果要让数据的二进制对人可见,可以将二进制转为二进制、八进制或十六进制的字符串表示,不足的是,这些字符串表示都会占用大量计算机存储空间。

当然,还有一种选择那就是使用Base64编码。Base64是一种基于64个可打印字符([A-Za-z0-9+/])来表示二进制数据的表示方法。

Base64基于64个可打印字符,所以每一个Base64编码单元只需要log2(64) = 6个位元。而计算机的计量单元是8个位元,6与8的最小公倍数是24,所以可以使用24个位元(也就是三个字节)作为一个编码处理单元。该编码处理单元规则如下:

  • 第1个字节的前6个位元作为Base64编码的第1个编码单元;
  • 第1个字节的后2个位元和第2个字节的前4位作为Base64编码的第2个编码单元;
  • 第2个字节的后4个位元和第3个字节的后4位作为Base64编码的第3个编码单元;
  • 第3个字节的后6个位元作为Base64编码的第4个编码单元。

引用维基百科的例子:
Base64编码示例

##24.2 补足空缺位元

在Base64编码中,是以24个位元(3个字节)作为一个编码处理单元的,那就可能出现提供的位元不足3个字节(缺1个或2个字节)。处理方法如下:

  • 如果缺1个字节,使用0来填充,在Base64编码结果后面加1个**=来说明填充了1**个字节;
  • 如果缺2个字节,使用0来填充,在Base64编码结果后面加2个**=来指明填充了2**个字节;
  • 后面全部由0填充所产生的字符都需要进行删除。如果填充了1个字节0,则需要删除Base64字符序列(未填充"="前)的最后一个字符(000000对应的字符是A);如果填充了2个字节0,则需要删除Base64字符序列(未填充"="前)的最后两个字符(实际上该字符是A)。

24.3 代码实现

由于计算机最小的处理单元是字节,所以要将数据转为基于6个位元为一个编码单元的Base64编码,则需要将这6个位元转为可以处理的对应的8个位元(1个字节)。所以需要采用位操作:<<>>>|和&

import java.io.UnsupportedEncodingException;
import org.junit.Test;

public class Base64Test {

	@Test
	public void t1_encode() throws UnsupportedEncodingException {
		String text = "HelloWorld!";
		System.out.println(base64Encode(text.getBytes("ASCII"))); // SGVsbG9Xb3JsZCE=
	}

	public static String base64Encode(byte[] data) {
		int len = data.length;
		int paddingLen = 3 - (len % 3 == 0 ? 3 : len % 3); // 填充字节数

		StringBuilder dest = new StringBuilder();
		for (int i = 0; i < len - paddingLen - 1;) {
			handleUnit(data[i++], data[i++], data[i++], dest);
		}
		if (paddingLen != 0) { // 处理填充
			handlePadding(data, len, paddingLen, dest);
		}

		return dest.toString();
	}

	/**
	 * Base64编码处理单元
	 */
	public static void handleUnit(byte b1, byte b2, byte b3, StringBuilder dest) {
		dest.append(BASE64_DIGITS[b1 >>> 2]);
		dest.append(BASE64_DIGITS[(b1 << 4 | b2 >>> 4) & 0x3f]);
		dest.append(BASE64_DIGITS[(b2 << 2 | b3 >>> 6) & 0x3f]);
		dest.append(BASE64_DIGITS[b3 & 0x3f]);
	}

	public static void handlePadding(byte[] data, int len, int paddingLen, StringBuilder dest) {
		if (paddingLen == 1) {
			handleUnit(data[len - len % 3], data[len - len % 3 + 1], (byte) 0x00, dest);
		}

		if (paddingLen == 2) {
			handleUnit(data[len - len % 3], (byte) 0x00, (byte) 0x00, dest);
		}

		dest.setLength(dest.length() - paddingLen); // 删除由0填充产生的字符

		for (int j = 0; j < paddingLen; j++) { // 填充"="
			dest.append("=");
		}
	}

	private static final char[] BASE64_DIGITS = { 'A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J', 'K', 'L', 'M', 'N',
			'O', 'P', 'Q', 'R', 'S', 'T', 'U', 'V', 'W', 'X', 'Y', 'Z', 'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i',
			'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q', 'r', 's', 't', 'u', 'v', 'w', 'x', 'y', 'z', '0', '1', '2', '3',
			'4', '5', '6', '7', '8', '9', '+', '/' };
}

以上是Base64编码的一种实现,效率上当然不是最佳的,这也是本人在不参考任何现成代码实现的基础上实现的功能,主要为了加深自己对其的了解 :)。

##24.4 Base64 URL Safe

24.3节的Base64编码结果不能直接用作URL的参数传输,因为Base64的"+","/","="分别对应于URL中的空格、路径分隔符和key=val分割符,如果直接用于URL传参,则会扰乱URL的语义。为了可以让Base64编码在URL使用,人们将Base64中的**"+""/"替换成"-""_",同时不再使用"="**进行末尾填充。

##24.5 Base64应用场景

###24.5.1 将图片内嵌到img标签 HTML5中可以使用伪协议data,将图片以base64的编码内嵌到img标签中。

<img alt="" src="" />

显示结果:

###24.5.2 密钥存储

###24.5.3 数据证书存储

###24.5.4 简单加密

##24.6 参考资料