Golang如何读取CSV文件_Golang encoding/csv文件解析与读取方法

答案:Go语言通过encoding/csv包读取CSV文件,支持文件整体读取、逐行读取大文件及处理带标题的CSV数据。使用os.Open打开文件后,csv.NewReader创建读取器,ReadAll()一次性读取所有记录适用于小文件;对大文件应调用Read()循环逐行解析以降低内存占用;对于含表头的CSV,先读取首行为header,再将后续每行数据与表头对应映射处理,实现结构化数据提取。

在Go语言中读取CSV文件非常简单,主要依赖标准库 encoding/csv。结合 osio 包,可以高效地解析本地或网络获取的CSV数据。下面介绍几种常见的CSV读取方式和使用技巧。

1. 从文件读取CSV数据

最常见的场景是从本地CSV文件中读取数据。使用 os.Open 打开文件,再用 csv.NewReader 创建读取器。

package main

import (
    "encoding/csv"
    "log"
    "os"
)

func main() {
    file, err := os.Open("data.csv")
    if err != nil {
        log.Fatal("无法打开文件:", err)
    }
    defer file.Close()

    reader := csv.NewReader(file)
    records, err := reader.ReadAll()
    if err != nil {
        log.Fatal("读取CSV失败:", err)
    }

    for _, record := range records {
        // 每一行是一个字符串切片
        for _, field := range record {
            print(field + "\t")
        }
        println()
    }
}

2. 逐行读取大文件

当CSV文件较大时,一次性加载到内存可能造成内存压力。此时应使用 Read() 方法逐行读取。

reader := csv.NewReader(file)

for {
    record, err := reader.Read()
    if err == io.EOF {
        break
    }
    if err != nil {
        log.Fatal("读取行出错:", err)
    }

    // 处理每一行
    for _, field := range record {
        print(field + "\t")
    }
    println()
}

3. 处理带标题的CSV(如表格数据)

很多CSV文件第一行为字段名。可以先读取首行作为表头,后续行作为数据内容。

header, err := reader.Read()
if err != nil {
    log.Fatal("读取表头失败:", err)
}

for {
    record, err := reader.Read()
    if err == io.EOF {
        break
    }
    if err != nil {
        log.Fatal("读取数据行失败:", err)
    }

    // 将每行与表头对应
    for i, value := range record {
        if i < len(header) {
            println(header[i] + ": " + value)
        }
    }
    println("---")
}

4. 自定义分隔符和其他选项

CSV不一定是逗号分隔,也可能是制表符、分号等。可以通过设置 Comma 字段来自定义。

reader := csv.NewReader(file)
reader.Comma = ';'  // 使用分号分隔
reader.TrimLeadingSpace = true  // 忽略空格

常见可配置项:

  • Comma:指定分隔符,默认为 ','
  • Comment:指定注释字符,遇到该字符开头的行会被跳过
  • TrimLeadingSpace:是否忽略字段前的空格
  • FieldsPerRecord:期望每行字段数量,设为负值表示不限制

基本上就这些。Golang的 encoding/csv 包设计简洁,适合大多数CSV读取需求,无需引入第三方库即可完成解析任务。注意错误处理和资源释放,能有效避免运行时问题。