Java 怎么按行读取大文本文件？高效方案

舞夢輝影 2026-01-02 00:00:00 次阅读

推荐用 BufferedReader 配合 Files.newBufferedReader() 按行读取大文本文件，兼顾性能、简洁和资源安全；需显式指定编码、避免 Scanner，超大文件分片处理可选 Apache Commons IO。

Java 按行读取大文本文件，核心是避免一次性加载全部内容到内存，推荐用 BufferedReader 配合 Files.newBufferedReader()，兼顾性能、简洁和资源安全。

用 try-with-resources + BufferedReader（最常用）

这是标准、高效且不易出错的方式。底层使用默认 8KB 缓冲区，IO 效率高，自动关闭流。

直接传入 Path，无需手动创建 FileInputStream
指定字符集（如 StandardCharsets.UTF_8），避免乱码
逐行处理，内存占用稳定，适合 GB 级文件

示例：

Path path = Paths.get("huge.log");
try (BufferedReader reader = Files.newBufferedReader(path, StandardCharsets.UTF_8)) {
    String line;
    while ((line = reader.readLine()) != null) {
        // 处理每一行，例如过滤、解析、写入数据库等
        processLine(line);
    }
}

用 Stream API 流式处理（JDK 8+，适合函数式风格）

如果只需遍历、过滤或映射，Files.lines() 返回的 Stream 更简洁，内部也基于 BufferedReader，同样懒加载。

必须用 try 包裹或确保 close()，否则可能泄露资源
不适合需要随机访问或多次遍历的场景（Stream 只能消费一次）
对超大文件做简单转换（如去空行、提取字段）很顺手

示例：

try (Stream lines = Files.lines(path, StandardCharsets.UTF_8)) {
    lines.filter(line -> !line.trim().isEmpty())
         .map(String::toUpperCase)
         .forEach(System.out::println);
}