Java怎么合成多个WAV文件 Java将多个音频拼接成一个文件【实例】

Java合并WAV必须校验并统一所有文件的PCM参数(采样率、位深、声道等),仅拼接data块并重写RIFF头部长度字段;若格式不一致需重采样或拒绝合并,推荐用ffmpeg替代手动字节操作。

Java 合并多个 WAV 文件的底层限制必须先认清

WAV 是 RIFF 容器格式,头部包含 fmt 子块(音频格式)和 data 子块(原始采样数据)。Java 标准库 javax.sound.sampled 能读取/写入单个 WAV,但不支持直接拼接多个文件——因为合并不是简单字节追加,必须校验并统一所有文件的音频参数(采样率、位深度、声道数),且要重写最终的 RIFF 头部长度字段。跳过校验直接拼接会导致播放失败或杂音。

用 AudioSystem 检查并标准化所有 WAV 的音频格式

必须确保所有输入文件是同格式 PCM,否则无法无损拼接。以下检查逻辑不可省略:

  • AudioFormat.getEncoding() 必须为 AudioFormat.Encoding.PCM_SIGNED
  • AudioFormat.getSampleRate()getSampleSizeInBits()getChannels()getFrameRate()getFrameSize() 全部一致
  • 若发现不一致,需用重采样(如 TarsosDSP)或拒绝合并,不能强行写入

示例校验代码:

for (File file : wavFiles) {
    AudioInputStream ais = AudioSystem.getAudioI

nputStream(file); AudioFormat format = ais.getFormat(); if (!format.getEncoding().equals(AudioFormat.Encoding.PCM_SIGNED)) { throw new IllegalArgumentException("Only PCM_SIGNED WAV supported: " + file); } if (!format.equals(firstFormat)) { // firstFormat 来自第一个文件 throw new IllegalArgumentException("Format mismatch at " + file + ": " + format); } }

手动拼接 data 块并重写 RIFF 头部长度字段

WAV 文件结构是:"RIFF" + 4-byte length + "WAVE" + fmt-chunk + data-chunk。拼接时只取第一个文件的 RIFF 头 + fmt 块,再把所有文件的 data 块内容顺序追加,最后更新总长度字段(从第 4 字节开始的 4 字节小端整数)。

  • 不能用 AudioSystem.write() 直接写多段流——它会为每段生成独立头部
  • 必须用 FileInputStream 读原始字节,跳过前 44 字节(标准头大小),提取 fmt 块(通常 24 字节,但需按 chunk size 解析)
  • 最终文件总长度 = 4("RIFF")+ 4(length field)+ 4("WAVE")+ fmtChunk.length + 所有 data 块字节总和

关键字节操作示例(简化版):

byte[] riffHeader = readFirstWavHeader(firstWav); // 读前 12 字节确认 "RIFFxxxxWAVE"
byte[] fmtChunk = extractFmtChunk(firstWav);       // 从第一个文件中完整提取 fmt 子块
long totalDataBytes = 0;
for (File f : wavFiles) totalDataBytes += getDataLength(f); // 跳过头,读 data chunk size

int totalLength = 4 + 4 + 4 + fmtChunk.length + (int)totalDataBytes;
riffHeader[4] = (byte)(totalLength & 0xFF);
riffHeader[5] = (byte)((totalLength >> 8) & 0xFF);
riffHeader[6] = (byte)((totalLength >> 16) & 0xFF);
riffHeader[7] = (byte)((totalLength >> 24) & 0xFF); // 小端写入 length 字段

绕过手动字节操作的替代方案:用 JAVE 或 ffmpeg CLI

如果项目允许引入外部依赖或命令行工具,比手写 RIFF 解析更可靠:

  • JAVE (Java Audio Video Encoder) 底层调用 ffmpeg,支持 WAV 拼接,但需注意其 MultiInputAudioAttributes 对 WAV 支持有限,建议转为临时 MP3 再合并回 WAV
  • 更稳的方式是调用系统 ffmpegffmpeg -i "concat:file1.wav|file2.wav|file3.wav" -c copy output.wav —— 这要求所有输入严格同格式,且 ffmpeg 版本 ≥ 4.1
  • Java 中用 Runtime.getRuntime().exec() 调用时,务必检查 ffmpeg 是否在 PATH,并捕获 stderr 判断是否因格式不匹配失败

纯 Java 方案看似“干净”,但 RIFF 头解析稍有偏差(比如忽略可能存在的 LISTfact 块)就会导致文件损坏;生产环境建议优先走 ffmpeg 路径。