在Java中StreamAPI能做什么_Java函数式流处理说明

Java Stream API 是数据处理管道,支持懒加载的中间操作(如filter、map、sorted)和触发执行的终端操作(如collect、forEach);不可复用,不适用于存储,慎用parallelStream。

Java Stream API 不是用来替代集合或存储数据的,它本质是一个**数据处理管道**——你把数据源“塞进去”,用一串声明式操作“加工”,最后用终端操作“取出来”或“消费掉”。能做什么?一句话:把原本要写 for 循环 + if + new ArrayList() 的事,变成可读、可链、可并行的一行逻辑。

filtermapsorted 这些中间操作到底在干啥?

它们不立即执行,只记下“等会儿要这么处理”,属于懒加载。只有遇到 collectforEachcount 这类终端操作时,整条链才真正跑起来。

  • filter 是守门员:只放行满足 Predicate 条件的元素(比如 n -> n % 2 == 0
  • map 是翻译官:把每个元素按规则转成另一个值(比如 String::length 把字符串变数字)
  • sorted 是排序器:默认按自然序,也可传 Comparator 自定义(注意:对引用类型排序前确保 compareToComparator 不抛 NullPointerException
List numbers = Arrays.asList(3, 1, 4, 1, 5);
List evensSorted = numbers.stream()
    .filter(n -> n % 2 == 0)   // 留下 4
    .map(n -> n * 2)            // 变成 8
    .sorted()                   // 单元素,效果不显,但合法
    .collect(Collectors.toList());

collect 是终点,但不是万能终点

它负责把流“收口”成你要的结果,但选错收集器会出问题:

  • 想转 List?用 Collectors.toList() —— 它不保

    证线程安全,也不保证返回的是 ArrayList(可能是不可变实现)
  • 要唯一去重?Collectors.toSet() 更合适,但注意元素必须正确重写 equalshashCode
  • 聚合统计?别硬写循环:Collectors.summingInt(Person::getAge) 比手写 reduce 直观且不易空指针
  • 千万别对空流用 Collectors.collectingAndThen(..., Objects::requireNonNull) 这类包装——先判空再 collect 更稳妥

什么时候该用 parallelStream()

不是“用了就快”,而是“大集合 + 无状态计算 + CPU 密集”才值得开并行:

  • 小列表(比如 parallelStream() 反而更慢——线程调度开销压倒收益
  • 操作里有共享变量、System.out.println、数据库连接等副作用?并行下结果不可预测,直接禁用
  • 数据源本身是 LinkedList?并行性能可能暴跌——因为 Spliterator 切分效率低
  • 真要用,优先从 ArrayList 或数组出发,并确认所有中间操作是无状态的(比如不用 peek 改外部计数器)

最常被忽略的一点:Stream 不能复用。调一次 collect 后再调 forEach,会直接抛 IllegalStateException。需要多次消费?要么重新生成 Stream(list.stream() 再来一遍),要么先 collect 成集合再反复用——别试图“缓存 Stream 对象”。