如何使用Golang解压缩gzip文件_读取压缩文件并还原内容

Go标准库原生支持gzip解压,需用gzip.NewReader包装os.Open打开的文件,注意手动关闭file和gr;小文件用io.ReadAll,大文件推荐bufio.Scanner或io.Copy流式处理。

Go语言标准库提供了完整的gzip支持,无需额外依赖就能解压缩gzip文件并读取原始内容。关键在于用gzip.NewReader包装一个已打开的文件(或任意io.Reader),再通过常规方式读取解压后的数据。

打开gzip文件并创建解压读取器

先用os.Open打开.gz后缀的文件,然后将其传给gzip.NewReader。该函数返回一个*gzip.Reader,它实现了io.Reader接口,可直接用于读取解压后的内容。

  • 如果文件不是有效的gzip格式,gzip.NewReader会立即返回错误
  • 注意:gzip.NewReader不负责关闭底层文件,需手动调用file.Close()
  • 解压读取器本身也实现了io.Closer,调用gr.Close()可释放相关资源(如内部缓冲区)

一次性读取全部解压内容

适合小文件(如配置、日志片段等)。用io.ReadAll直接读取整个解压流:

file, err := os.Open("data.txt.gz")
if err != nil {
    log.Fatal(err)
}
defer file.Close()

gr, err := gzip.NewReader(file)
if err != nil {
    log.Fatal(err)
}
defer gr.Close()

data, err := io.ReadAll(gr)
if err != nil {
    log.Fatal(err)
}

fmt.Println(string(data)) // 输出原始文本

流式读取大文件避免内存占用过高

对大文件(如GB级日志归档),应避免一次性加载到内存。可用bufio.Scanner按行处理,或用io.Copy写入目标文件/网络连接:

  • 使用bufio.NewScanner(gr)逐行扫描,适合文本类gzip文件
  • io.Copy(dst, gr)将解压内容直接写入文件、stdout或HTTP响应体
  • 若需自定义缓冲区大小,可配合io.CopyBuffer传入指定字节切片

常见问题与注意事项

实际使用中容易忽略几个细节:

  • gzip文件可能不含原始文件名或时间戳,gr.Header可访问有限元信息,但不可靠
  • 标准库不支持多文件gzip归档(即tar.gz),遇到这类文件需先用archive/tar解包
  • 若输入是内存中的[]bytestring,可转为bytes.NewReader(b)再套gzip读取器
  • 错误处理不能省略:gzip校验失败、I/O中断、数据截断都会在读取时暴露,而非构造时