在Java里如何将List按字段去重_Java对象去重方案

推荐使用Stream + Collectors.toMap保留首次出现对象,原理是按字段作key、遇重复key保留第一个,配合LinkedHashMap维持顺序;也可重写equals/hashCode后用LinkedHashSet,或TreeSet实现排序去重,手动遍历则适合复杂条件。

Java中对List对象按指定字段去重,核心思路是利用Stream + Collectors.toMap 或自定义Comparator + TreeSet,也可以借助LinkedHashSet配合重写equals/hashCode。关键不在于“能不能去重”,而在于“是否保留原始顺序”“是否需要线程安全”“对象是否可修改”。下面给出几种常用、可靠、贴近实际场景的方案。

用Stream + toMap保留首次出现的对象(推荐)

这是最简洁、可读性强、且能保持原List顺序的方式。原理是把对象按去重字段作为key,value为对象本身,遇到重复key时保留第一个((a, b) -> a)。

List uniqueList = list.stream()
    .collect(Collectors.toMap(
        User::getId,      // 去重字段:id
        user -> user,     // value就是当前对象
        (a, b) -> a,      // 冲突时保留第一个
        LinkedHashMap::new // 保证插入顺序
    ))
    .values()
    .stream()
    .collect(Collectors.toList());
  • ✅ 保持原始顺序(靠LinkedHashMap
  • ✅ 空间换时间,性能较好(O(n))
  • ⚠️ 注意:字段值不能为null,否则toMap会抛NullPointerException;如需支持null,可先filter(Objects::nonNull)或改用其他方式

重写equals和hashCode后用LinkedHashSet

如果该对象在多个地方都需要按某字段判断相等(比如User按id唯一),建议直接在类中重写equalshashCode,之后用LinkedHashSet自动去重:

// 在User类中
@Override
public boolean equals(Object o) {
    if (this == o) return true;
    if (o == null || getClass() != o.getClass()) return false;
    User user = (User) o;
    return Objects.equals(id, user.id); // 只比较id
}

@Override
public int hashCode() {
    return Objects.hash(id);
}

然后去重就一行:

List uniqueList = new ArrayList<>(new LinkedHashSet<>(list));

  • ✅ 一次定义,处处可用;语义清晰
  • ✅ 自动保持顺序(LinkedHashSet
  • ⚠️ 谨慎使用:若该类还有其他业务场景需按多个字段判等,这种单字段equals可能引发逻辑错误

用TreeSet + 自定义Comparator(适合已排序或需二次处理)

当你要去重的同时还希望结果有序(比如按id升序),可以用TreeSet

Set set = new TreeSet<>((u1, u2) -> Long.compare(u1.getId(), u2.getId()));
set.addAll(list);
List uniqueList = new ArrayList<>(set);
  • ✅ 自动排序 + 去重一步到位
  • ⚠️ 不保留原始顺序;且TreeSet要求Comparator不能对相同字段返回0以外的结果,否则逻辑混乱
  • ⚠️ 如果只是去重,不用排序,不建议用这个——比LinkedHashSet慢(O(n log n))

手动遍历+Set记录已见字段(兼容老版本/复杂条件)

JDK 7或需要动态字段名(比如通过反射)、或字段组合去重(如 name + age 联合唯一)时,手动控制更灵活:

Set seenIds = new HashSet<>();
List uniqueList = new ArrayList<>();
for (User user : list) {
    if (seenIds.add(user.getId())) { // add返回true表示首次加入
        uniqueList.add(user);
    }
}
  • ✅ 兼容所有JDK版本
  • ✅ 易扩展:比如seenIds.add(user.getName() + "-" + user.getAge())实现联合去重
  • ✅ 零依赖、无副作用、易调试

基本上就这些。选哪种取决于你的具体约束:要不要保序、字段是否可能为空、是否已在类层面定义相等逻辑、是否需要排序。多数新项目推荐第一种(Stream + toMap),干净利落又可控。