Java【代码分享 09】多线程处理List数据核心代码说明（下标越界、数据丢失及效率问题）-阿里云开发者社区

Java【代码分享 09】多线程处理List数据核心代码说明（下标越界、数据丢失及效率问题）

2023-12-23 400

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： Java【代码分享 09】多线程处理List数据核心代码说明（下标越界、数据丢失及效率问题）

1.问题说明

大数据量的List问题处理，多线程分批处理，需要解决的问题：

下标越界。
线程安全。
数据丢失。

private List<Map<String, Object>> dealDataByThreads(List<String> dataList) {
        int dataSize = dataList.size();
        // 结果数据【1】
        List<Map<String, Object>> dataMap = Collections.synchronizedList(new ArrayList<>(dataSize));
        // 每批的记录数据并计算批次
        int numberBatch = 2000;
        double number = dataSize * 1.0 / numberBatch;
        int n = ((Double) Math.ceil(number)).intValue();
        // 根据参数开启线程
        CountDownLatch countDownLatch = new CountDownLatch(n);
        ThreadPoolExecutor executor = ThreadManager.executor;
        // 分批处理数据
        for (int i = 0; i < n; i++) {
            // 计算sub的toIndex
            int end = numberBatch * (i + 1);
            if (end > dataSize) {
                end = dataSize;
            }
            // 获取分批数据
            List<String> dataListSub = dataList.subList(numberBatch * i, end);
            int finalI = i;
            int finalEnd = end;
            executor.submit(() -> {
                long startMillis = System.currentTimeMillis();
                //【2】
                dataMap.addAll(dealData(dataListSub));
                countDownLatch.countDown();
                long endMillis = System.currentTimeMillis();
                log.info("当前线程[{}]处理{}-{}/{}耗时[{}]毫秒", Thread.currentThread().getName(), numberBatch * finalI, finalEnd, dataSize, endMillis - startMillis);
            });
        }
        // 主线程等待
        try {
            countDownLatch.await();
        } catch (InterruptedException e) {
            e.printStackTrace();
        }
        return dataMap;
    }

2.代码说明

使用dataSize初始化 Map 对象，可以避免 Map 对象的重构导致的下标越界。

List<Map<String, Object>> dataMap = Collections.synchronizedList(new ArrayList<>(dataSize));

不要将dataMap对象给线程，dataMap.add(dataListSubAfterDeal) 方法可能会覆盖 List 内的对象。

// 正确方式
dataMap.addAll(dealData(dataListSub));
// 错误方式
dealData(dataListSub,dataMap);
dataMap.add(dataListSubAfterDeal);

为什么不使用线程安全的Vector或CopyOnWriteArrayList。

// 没有达到多线程期待的效果。

3.方案效率

3 > 2 >1

// 1.线程安全，性能较低，没有达到多线程期待的效果。
Vector<Map<String, Object>> vector = new Vector<>(dataSize);
// 2.CopyOnWriteArrayList比Vector效率好一些前者synchronized后者lock
List<Map<String, Object>> resultList = new CopyOnWriteArrayList<>();
// 3.Collections.synchronizedList将线程不安全的集合转成线程安全的集合
List<Map<String, Object>> dataMap = Collections.synchronizedList(new ArrayList<>(dataSize));

Java【代码分享 09】多线程处理List数据核心代码说明（下标越界、数据丢失及效率问题）

1.问题说明

2.代码说明

3.方案效率

热门文章

最新文章

相关课程

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Java【代码分享 09】多线程处理List数据核心代码说明（下标越界、数据丢失及效率问题）

1.问题说明

2.代码说明

3.方案效率

热门文章

最新文章

相关课程

相关电子书