在Java中如何使用Base64编码解码_Java编码工具解析

Java 8+ 应使用 java.util.Base64,禁用 sun.misc.BASE64Encoder;编码需指定 UTF-8、区分 MIME/URL 安全场景;大文件须流式处理,避免 OOM。

Java 8+ 直接用 java.util.Base64,别碰 sun.misc.BASE64Encoder

Java 8 引入了标准、线程安全、无需额外依赖的 java.util.Base64,这是唯一推荐的方式。老项目里常见的 sun.misc.BASE64Encoder 属于内部 API,JDK 9+ 默认禁止反射调用,编译或运行时会抛 IllegalAccessError 或警告,且无任何维护保障。

使用要点:

  • Base64.getEncoder() 返回 MIME 类型编码器(每 76 字符换行,含 \r\n);如需 URL 安全或无换行,改用 Base64.getUrlEncoder()Base64.getEncoder().withoutPadding()
  • 解码一律用 Base64.getDecoder(),它自动忽略空白字符和换行,兼容 MIME 和 URL 编码格式
  • 编码/解码操作不修改原字节数组,返回新数组,线程安全,可复用同一个 encoder/decoder 实例
String original = "Hello 世界";
byte[] encoded = Base64.getEncoder().encode(original.getBytes(StandardCharsets.UTF_8));
String encodedStr = new String(encoded, StandardCharsets.US_ASCII); // "SGVsbG8g5L2g5aW9"

byte[] decoded = Base64.getDecoder().decode(encodedStr);
String result = new String(decoded, StandardCharsets.UTF_8); // "Hello 世界"

处理字符串时必须显式指定 StandardCharsets.UTF_8

Java 的 String.getBytes() 无参重载依赖系统默认编码(Windows 常为 GBK),会导致中文乱码:编码用平台默认编码,解码却用 UTF-8,结果不可逆。所有涉及文本的 Base64 操作,getBytes()new String(byte[], ...) 必须成对使用 StandardCharsets.UTF_8

常见错误现象:

  • 本地测试正常,部署到 Linux 服务器后中文变问号或方块
  • 编码后字符串在前端 JS btoa() 解不出,或 JS atob() 编码结果 Java 解不了

根本原因就是编码不一致。JS 的 TextEncoder 默认 UTF-8,Java 不显式指定就掉坑里。

URL 和文件名场景必须用 getUrlEncoder()

标准 Base64 的 +/ 在 URL 路径、HTTP 参数、文件名中会被转义或截断,= 填充符也可能引发问题。此时必须用 Base64.getUrlEncoder() —— 它把 + 换成 -/ 换成 _,并默认省略填充(即等价于 withoutPadding())。

注意:getUrlEncoder()

编码结果不能直接用 getDecoder() 解,必须配对使用 getUrlDecoder()

String token = "user:123";
String encodedForUrl = Base64.getUrlEncoder().encodeToString(token.getBytes(StandardCharsets.UTF_8));
// e.g., "dXNlcjoxMjM"

// 解码时必须用 getUrlDecoder()
byte[] decoded = Base64.getUrlDecoder().decode(encodedForUrl);

大文件或流式处理别一次性读进内存

Base64.getEncoder().encode(byte[]) 会将整个输入数组复制并扩容约 33%,对几十 MB 以上的数据极易触发 OutOfMemoryError。真实场景(如上传文件 Base64 编码传参、解析 Base64 图片流)应走流式处理。

方案选择:

  • 编码大字节数组:用 Base64.getEncoder().wrap(OutputStream) 包装目标输出流,再 write 原始数据
  • 解码 Base64 输入流(如 HTTP 请求体):用 Base64.getDecoder().wrap(InputStream),然后 read
  • 避免手动拼接 StringBuilder 处理 Base64 字符串后再 decode——先转 byte[] 再解,否则字符串中间有空格或换行会失败

流式处理不缓存全部数据,内存占用恒定,但需要正确关闭包装流,否则可能丢数据。