Java怎么合成多个WAV文件 Java将多个音频拼接成一个文件【实例】_技术教程

Java合并WAV必须校验并统一所有文件的PCM参数（采样率、位深、声道等），仅拼接data块并重写RIFF头部长度字段；若格式不一致需重采样或拒绝合并，推荐用ffmpeg替代手动字节操作。

Java 合并多个 WAV 文件的底层限制必须先认清

WAV 是 RIFF 容器格式，头部包含 fmt 子块（音频格式）和 data 子块（原始采样数据）。Java 标准库 javax.sound.sampled 能读取/写入单个 WAV，但不支持直接拼接多个文件——因为合并不是简单字节追加，必须校验并统一所有文件的音频参数（采样率、位深度、声道数），且要重写最终的 RIFF 头部长度字段。跳过校验直接拼接会导致播放失败或杂音。

用 AudioSystem 检查并标准化所有 WAV 的音频格式

必须确保所有输入文件是同格式 PCM，否则无法无损拼接。以下检查逻辑不可省略：

AudioFormat.getEncoding() 必须为 AudioFormat.Encoding.PCM_SIGNED
AudioFormat.getSampleRate()、getSampleSizeInBits()、getChannels()、getFrameRate()、getFrameSize() 全部一致
若发现不一致，需用重采样（如 TarsosDSP）或拒绝合并，不能强行写入

示例校验代码：

for (File file : wavFiles) {
    AudioInputStream ais = AudioSystem.getAudioInputStream(file);
    AudioFormat format = ais.getFormat();
    if (!format.getEncoding().equals(AudioFormat.Encoding.PCM_SIGNED)) {
        throw new IllegalArgumentException("Only PCM_SIGNED WAV supported: " + file);
    }
    if (!format.equals(firstFormat)) { // firstFormat 来自第一个文件
        throw new IllegalArgumentException("Format mismatch at " + file + ": " + format);
    }
}

手动拼接 data 块并重写 RIFF 头部长度字段

WAV 文件结构是："RIFF" + 4-byte length + "WAVE" + fmt-chunk + data-chunk。拼接时只取第一个文件的 RIFF 头 + fmt 块，再把所有文件的 data 块内容顺序追加，最后更新总长度字段（从第 4 字节开始的 4 字节小端整数）。

不能用 AudioSystem.write() 直接写多段流——它会为每段生成独立头部
必须用 FileInputStream 读原始字节，跳过前 44 字节（标准头大小），提取 fmt 块（通常 24 字节，但需按 chunk size 解析）
最终文件总长度 = 4（"RIFF"）+ 4（length field）+ 4（"WAVE"）+ fmtChunk.length + 所有 data 块字节总和

关键字节操作示例（简化版）：

byte[] riffHeader = readFirstWavHeader(firstWav); // 读前 12 字节确认 "RIFFxxxxWAVE"
byte[] fmtChunk = extractFmtChunk(firstWav);       // 从第一个文件中完整提取 fmt 子块
long totalDataBytes = 0;
for (File f : wavFiles) totalDataBytes += getDataLength(f); // 跳过头，读 data chunk size

int totalLength = 4 + 4 + 4 + fmtChunk.length + (int)totalDataBytes;
riffHeader[4] = (byte)(totalLength & 0xFF);
riffHeader[5] = (byte)((totalLength >> 8) & 0xFF);
riffHeader[6] = (byte)((totalLength >> 16) & 0xFF);
riffHeader[7] = (byte)((totalLength >> 24) & 0xFF); // 小端写入 length 字段

绕过手动字节操作的替代方案：用 JAVE 或 ffmpeg CLI

如果项目允许引入外部依赖或命令行工具，比手写 RIFF 解析更可靠：

JAVE (Java Audio Video Encoder) 底层调用 ffmpeg，支持 WAV 拼接，但需注意其 MultiInputAudioAttributes 对 WAV 支持有限，建议转为临时 MP3 再合并回 WAV
更稳的方式是调用系统 ffmpeg：ffmpeg -i "concat:file1.wav|file2.wav|file3.wav" -c copy output.wav —— 这要求所有输入严格同格式，且 ffmpeg 版本 ≥ 4.1
Java 中用 Runtime.getRuntime().exec() 调用时，务必检查 ffmpeg 是否在 PATH，并捕获 stderr 判断是否因格式不匹配失败

纯 Java 方案看似“干净”，但 RIFF 头解析稍有偏差（比如忽略可能存在的 LIST 或 fact 块）就会导致文件损坏；生产环境建议优先走 ffmpeg 路径。