背景

项目中使用Lists.Partition批量处理数据,在循环处理的过程中会有remove操作,导致部分数据更新有问题。

原因

最后自己单元测试发现是List<List> resultPartition = Lists.partition(list, 100)之后再对list进行remove操作,resultPartition也会被remove。看了源码才发现它最终会调用 list.subList。subList执行结果是获取ArrayList的一部分,返回的是ArrayList的部分视图。对子集合的操作会反映到原集合, 对原集合的操作也会影响子集合。

源码

public static <T> List<List<T>> partition(List<T> list, int size) {
    checkNotNull(list);
    checkArgument(size > 0);
    return (list instanceof RandomAccess)
        ? new RandomAccessPartition<T>(list, size)
        : new Partition<T>(list, size);
  }

  private static class Partition<T> extends AbstractList<List<T>> {
    final List<T> list;
    final int size;

    Partition(List<T> list, int size) {
      this.list = list;
      this.size = size;
    }

    @Override
    public List<T> get(int index) {
      checkElementIndex(index, size());
      int start = index * size;
      int end = Math.min(start + size, list.size());
      return list.subList(start, end);
    }

    @Override
    public int size() {
      return IntMath.divide(list.size(), size, RoundingMode.CEILING);
    }

    @Override
    public boolean isEmpty() {
      return list.isEmpty();
    }
  }

个人账号