Java里Stream分组功能怎么实现_Stream在Java中的分组应用说明

Java中Stream分组主要用Collectors.groupingBy(),返回Map;支持基础分组、二级分组、自定义逻辑(含空值处理)及聚合统计(如counting、averagingDouble),需注意keyMapper类型、null安全与下游收集器选择。

Java中Stream的分组功能主要通过 Collectors.groupingBy() 实现,它能把流中的元素按指定规则分类,返回一个 Map,键是分组依据,值是该组内所有元素的集合。

基础分组:按字段或简单条件分组

最常见的是按对象的某个属性分组。比如有一个 List,想按年龄分组:

Map> byAge = people.stream()
    .collect(Collectors.groupingBy(Person::getAge));

这时 Map 的 key 是 Integer(年龄),value 是对应年龄的所有 Person 对象组成的 List。

  • 如果属性值为 null,会抛出 NullPointerException,可先用 Objects::nonNull 过滤或用 groupingBy(keyMapper, HashMap::new, …) 自定义 map 类型
  • keyMapper 函数必须返回可比较、可哈希的类型,否则可能出错或分组异常

二级分组:嵌套 groupingBy 实现多级分类

需要按多个维度分组时,可以把另一个 groupingBy 作为下游收集器:

Map>> byAgeAndCity = people.stream()
    .collect(Collectors.groupingBy(
        Person::getAge,
        Collectors.groupingBy(Person::getCity)
    ));

结果是 Map>>,适合做交叉统计或层级报表。

  • 下游收集器不限于 groupingBy,也可以是 counting()、summingInt() 等,实现聚合统计
  • 注意嵌套过深会影响可读性,必要时可封装成独立方法

自定义分组逻辑与空值处理

当分组逻辑较复杂(如按年龄段分组:0-18、19-35、36+),或源数据含 null 字段时,推荐用 lambda 显式定义 key:

Map> byAgeRange = people.stream()
    .collect(Collectors.groupingBy(p -> {
        int age = p.getAge() == null ? -1 : p.getAge();
        if (age < 0) return "未知";
        else if (age <= 18) return "未成年";
        else if (age <= 35) return "青年";
        else return "成年";
    }));

这样既避免空指针,又灵活支持业务语义分组。

  • 可配合 Collectors.toMap() 或 Collectors.collectingAndThen 做后处理(如排序、去重)
  • 若需保持插入顺序,用 LinkedHashMap::new 作为 map 工厂参数

分组后聚合统计(不存全量数据)

有时只需统计数量、平均值等,不必保留原始列表,节省内存:

// 按部门统计人数
Map countByDept = employees.stream()
    .collect(Collectors.groupingBy(Employee::getDept, Collectors.counting()));

// 按状态统计平均薪资
Map avgSalaryByStatus = employees.stream()
    .collect(Collectors.groupingBy(
        Employee::getStatus,
        Collectors.averagingDouble(Employee::getSalary)
    ));

这类组合使用让 Stream 分组兼具灵活性和性能优势。

  • counting() 返回 Long,summingInt/Double/Long 返回对应数值类型
  • 若某组无数据,对应 key 仍存在,value 为 0 或 0.0(取决于聚合器)

基本上就这些。Stream 分组不复杂但容易忽略细节,关键是选对 keyMapp

er 和下游收集器,再结合业务场景做空值和异常处理。