如何用Golang使用bufio.Scanner读取文件行_Golang Scanner文件行读取实践

答案:bufio.Scanner适用于按行读取文件,需注意缓冲区限制和错误处理。首先用os.Open打开文件并创建Scanner实例,通过Scan()逐行读取,Text()获取内容,循环后须检查scanner.Err()是否有I/O错误;处理大文件时可调用Buffer()扩大缓冲区以避免ErrTooLong;还可读取strings.NewReader的字符串,适用于测试或配置解析;注意Text()返回值不可重复引用,且需defer关闭文件。

在Go语言中,bufio.Scanner 是读取文件行的常用方式,尤其适合处理按行分割的文本文件。它简洁、高效,适用于日志解析、配置读取等场景。下面介绍如何使用 bufio.Scanner 正确读取文件中的每一行,并提供实用示例和注意事项。

打开文件并创建Scanner

要读取文件,先用 os.Open 打开文件,再通过 bufio.NewScanner 创建一个扫描器实例。

file, err := os.Open("example.txt")
if err != nil {
    log.Fatal(err)
}
defer file.Close()

scanner := bufio.NewScanner(file) for scanner.Scan() { line := scanner.Text() fmt.Println(line) } if err := scanner.Err(); err != nil { log.Fatal(err) }

这段代码会逐行读取文件内容并打印。注意:必须检查 scanner.Err(),以确保读取过程中没有发生错误。

处理大文件时的性能考虑

Scanner 默认使用的缓冲区大小为 4096 字节,对于超长行或大文件可能需要调整。如果某一行超过缓冲区限制,scanner.Scan() 会返回 false 并设置 error。

可以通过自定义 Scanner.Buffer 来扩展缓冲区:

file, _ := os.Open("large_file.txt")
defer file.Close()

scanner := bufio.NewScanner(file) const maxCapacity = 1024 * 1024 // 1MB buf := make([]byte, maxCapacity) scanner.Buffer(buf, maxCapacity)

for scanner.Scan() { fmt.Println(scanner.Text()) } if err := scanner.Err(); err != nil { if err == bufio.ErrTooLong { log.Println("一行内容过长,超出缓冲区限制") } else { log.Fatal(err) } }

读取字符串而非文件

除了文件,Scanner 也能读取内存中的字符串。只需将 strings.NewReader 作为输入源:

input := "第一行\n第二行\n第三行"
reader := strings.NewReader(input)
scanner := bufio.NewScanner(reader)

for scanner.Scan() { fmt.Println(scanner.Text()) }

这在单元测试或配置解析中非常有用。

常见问题与注意事项

  • 不要重复使用 Text() 返回的字符串引用:每次调用 Scan() 后,之前 Text() 返回的内容可能被覆盖。
  • 及时关闭文件:使用 defer file.Close() 防止资源泄露。
  • 错误处理不能省略:即使循环结束,也要检查 scanner.Err() 是否有底层I/O错误。
  • Scanner 不自动处理换行符差异:无论 Unix(\n) 还是 Windows(\r\n),都能正确识别行尾,无需额外处理。

基本上就这些。只要掌握基本用法和边界情况,bufio.Scanner 就能稳定高效地完成大多数按行读取任务。