Java 数据分批调用接口的正确姿势

简介: Java 数据分批调用接口的正确姿势


一、背景
 

现实业务开发中,通常为了避免超时、对方接口限制等原因需要对支持批量的接口的数据分批调用。

比如List参数的size可能为 几十个甚至上百个,但是假如对方dubbo接口比较慢,传入50个以上会超时,那么可以每次传入20个,分批执行。

通常很多人会写 for 循环或者 while 循环,非常不优雅,无法复用,而且容易出错。

下面结合 Java8 的 Stream ,Function ,Consumer 等特性实现分批调用的工具类封装和自测。

并给出 CompletableFuture 的异步改进方案。

二、实现
工具类:

package com.chujianyun.common.java8.function;

import com.google.common.base.Preconditions;
import com.google.common.collect.Lists;
import org.apache.commons.collections4.CollectionUtils;

import java.util.*;
import java.util.function.Consumer;
import java.util.function.Function;

/**

  • 执行工具类

*

  • @author 明明如月

*/
public class ExecuteUtil {

public static <T> void partitionRun(List<T> dataList, int size, Consumer<List<T>> consumer) {
    if (CollectionUtils.isEmpty(dataList)) {
        return;
    }
    Preconditions.checkArgument(size > 0, "size must not be a minus");
    Lists.partition(dataList, size).forEach(consumer);
}

public static <T, V> List<V> partitionCall2List(List<T> dataList, int size, Function<List<T>, List<V>> function) {

    if (CollectionUtils.isEmpty(dataList)) {
        return new ArrayList<>(0);
    }
    Preconditions.checkArgument(size > 0, "size must not be a minus");

    return Lists.partition(dataList, size)
            .stream()
            .map(function)
            .filter(Objects::nonNull)
            .reduce(new ArrayList<>(),
                    (resultList1, resultList2) -> {
                        resultList1.addAll(resultList2);
                        return resultList1;
                    });


}

public static <T, V> Map<T, V> partitionCall2Map(List<T> dataList, int size, Function<List<T>, Map<T, V>> function) {
    if (CollectionUtils.isEmpty(dataList)) {
        return new HashMap<>(0);
    }
    Preconditions.checkArgument(size > 0, "size must not be a minus");
    return Lists.partition(dataList, size)
            .stream()
            .map(function)
            .filter(Objects::nonNull)
            .reduce(new HashMap<>(),
                    (resultMap1, resultMap2) -> {
                        resultMap1.putAll(resultMap2);
                        return resultMap1;
                    });


}

}

待调用的服务(模拟)

package com.chujianyun.common.java8.function;

import java.util.ArrayList;
import java.util.HashMap;
import java.util.List;
import java.util.Map;

public class SomeManager {

public void aRun(Long id, List<String> data) {

}

public List<Integer> aListMethod(Long id, List<String> data) {
    return new ArrayList<>(0);
}

public Map<String, Integer> aMapMethod(Long id, List<String> data) {
    return new HashMap<>(0);
}

}
单元测试:

package com.chujianyun.common.java8.function;

import org.apache.commons.lang3.RandomUtils;
import org.jeasy.random.EasyRandom;
import org.junit.Assert;
import org.junit.Before;
import org.junit.Test;
import org.junit.runner.RunWith;
import org.mockito.Mock;
import org.mockito.Mockito;
import org.mockito.internal.verification.Times;
import org.powermock.api.mockito.PowerMockito;
import org.powermock.modules.junit4.PowerMockRunner;

import java.util.ArrayList;
import java.util.HashMap;
import java.util.List;
import java.util.Map;
import java.util.stream.Collectors;
import java.util.stream.Stream;

import static org.mockito.ArgumentMatchers.any;
import static org.mockito.ArgumentMatchers.anyLong;

@RunWith(PowerMockRunner.class)
public class ExecuteUtilTest {

private EasyRandom easyRandom = new EasyRandom();

@Mock
private SomeManager someManager;

// 测试数据
private List<String> mockDataList;

private int total = 30;

@Before
public void init() {
    // 构造30条数据
    mockDataList = easyRandom.objects(String.class, 30).collect(Collectors.toList());

}

@Test
public void test_a_run_partition() {
    // mock aRun
    PowerMockito.doNothing().when(someManager).aRun(anyLong(), any());

    // 每批 10 个
    ExecuteUtil.partitionRun(mockDataList, 10, (eachList) -> someManager.aRun(1L, eachList));

    //验证执行了 3 次
    Mockito.verify(someManager, new Times(3)).aRun(anyLong(), any());
}


@Test
public void test_call_return_list_partition() {
    // mock  每次调用返回条数(注意每次调用都是这2个)
    int eachReturnSize = 2;
    PowerMockito
            .doReturn(easyRandom.objects(String.class, eachReturnSize).collect(Collectors.toList()))
            .when(someManager)
            .aListMethod(anyLong(), any());

    // 分批执行
    int size = 4;
    List<Integer> resultList = ExecuteUtil.partitionCall2List(mockDataList, size, (eachList) -> someManager.aListMethod(2L, eachList));

    //验证执行次数
    int invocations = 8;
    Mockito.verify(someManager, new Times(invocations)).aListMethod(anyLong(), any());

    // 正好几轮
    int turns;
    if (total % size == 0) {
        turns = total / size;
    } else {
        turns = total / size + 1;
    }
    Assert.assertEquals(turns * eachReturnSize, resultList.size());
}


@Test
public void test_call_return_map_partition() {
    // mock  每次调用返回条数
    // 注意:
    // 如果仅调用doReturn一次,那么每次返回都是key相同的Map,
    // 如果需要不覆盖,则doReturn次数和 invocations 相同)
    int eachReturnSize = 3;
    PowerMockito
            .doReturn(mockMap(eachReturnSize))
            .doReturn(mockMap(eachReturnSize))
            .when(someManager).aMapMethod(anyLong(), any());

    // 每批
    int size = 16;
    Map<String, Integer> resultMap = ExecuteUtil.partitionCall2Map(mockDataList, size, (eachList) -> someManager.aMapMethod(2L, eachList));

    //验证执行次数
    int invocations = 2;
    Mockito.verify(someManager, new Times(invocations)).aMapMethod(anyLong(), any());

    // 正好几轮
    int turns;
    if (total % size == 0) {
        turns = total / size;
    } else {
        turns = total / size + 1;
    }
    Assert.assertEquals(turns * eachReturnSize, resultMap.size());
}

private Map<String, Integer> mockMap(int size) {
    Map<String, Integer> result = new HashMap<>(size);
    for (int i = 0; i < size; i++) {

// 极力保证key不重复

        result.put(easyRandom.nextObject(String.class) + RandomUtils.nextInt(), easyRandom.nextInt());
    }
    return result;
}

}
注意:

1 判空

.filter(Objects::nonNull)
这里非常重要,避免又一次调用返回 null,而导致空指针异常。

2 实际使用时可以结合apollo配置, 灵活设置每批执行的数量,如果超时随时调整

3 用到的类库

集合工具类: commons-collections4、guava (可以不用)

这里的list划分子list也可以使用stream的 skip ,limit特性自己去做,集合判空也可以不借助collectionutils.

构造数据:easy-random

单元测试框架: Junit4 、 powermockito、mockito

4 大家可以加一些更强大的功能,如允许设置每次调用的时间间隔、并行或并发调用等。

三、改进
以上面的List接口为例,将其改为异步版本:

public static <T, V> List<V> partitionCall2ListAsync(List<T> dataList,
                                                     int size,
                                                     ExecutorService executorService,
                                                     Function<List<T>, List<V>> function) {

    if (CollectionUtils.isEmpty(dataList)) {
        return new ArrayList<>(0);
    }
    Preconditions.checkArgument(size > 0, "size must not be a minus");

    List<CompletableFuture<List<V>>> completableFutures = Lists.partition(dataList, size)
            .stream()
            .map(eachList -> {
                if (executorService == null) {
                    return CompletableFuture.supplyAsync(() -> function.apply(eachList));
                } else {
                    return CompletableFuture.supplyAsync(() -> function.apply(eachList), executorService);
                }

            })
            .collect(Collectors.toList());


    CompletableFuture<Void> allFinished = CompletableFuture.allOf(completableFutures.toArray(new CompletableFuture[0]));
    try {
        allFinished.get();
    } catch (Exception e) {
        throw new RuntimeException(e);
    }
    return completableFutures.stream()
            .map(CompletableFuture::join)
            .filter(CollectionUtils::isNotEmpty)
            .reduce(new ArrayList<V>(), ((list1, list2) -> {
                List<V> resultList = new ArrayList<>();
                if(CollectionUtils.isNotEmpty(list1)){
                   resultList.addAll(list1);
                   }

                if(CollectionUtils.isNotEmpty(list2)){
                     resultList.addAll(list2);
                   }
                return resultList;
            }));
}

测试代码:

// 测试数据

private List<String> mockDataList;

private int total = 300;

private AtomicInteger atomicInteger;

@Before
public void init() {
    // 构造total条数据
    mockDataList = easyRandom.objects(String.class, total).collect(Collectors.toList());

}


@Test
public void test_call_return_list_partition_async() {

    ExecutorService executorService = Executors.newFixedThreadPool(10);

    atomicInteger = new AtomicInteger(0);
    Stopwatch stopwatch = Stopwatch.createStarted();
    // 分批执行
    int size = 2;
    List<Integer> resultList = ExecuteUtil.partitionCall2ListAsync(mockDataList, size, executorService, (eachList) -> someCall(2L, eachList));

    Stopwatch stop = stopwatch.stop();
    log.info("执行时间: {} 秒", stop.elapsed(TimeUnit.SECONDS));

    Assert.assertEquals(total, resultList.size());
    // 正好几轮
    int turns;
    if (total % size == 0) {
        turns = total / size;
    } else {
        turns = total / size + 1;
    }
    log.info("共调用了{}次", turns);
    Assert.assertEquals(turns, atomicInteger.get());

  // 顺序也一致
    for(int i =0; i< mockDataList.size();i++){
        Assert.assertEquals((Integer) mockDataList.get(i).length(), resultList.get(i));
    }
}

/**

 * 模拟一次调用
 */
private List<Integer> someCall(Long id, List<String> strList) {

    log.info("当前-->{},strList.size:{}", atomicInteger.incrementAndGet(), strList.size());
    try {
        TimeUnit.SECONDS.sleep(2L);
    } catch (InterruptedException e) {
        e.printStackTrace();
    }
    return strList.stream()
            .map(String::length)
            .collect(Collectors.toList());
}

通过异步可以尽可能快得拿到执行结果。

四、总结
1 要灵活运用Java 8 的 特性简化代码

2 要注意代码的封装来使代码更加优雅,复用性更强

3 要利用来构造单元测试的数据框架如 java-faker和easy-random来提高构造数据的效率

4 要了解性能改进的常见思路:合并请求、并发、并行、缓存等。

相关文章
|
4月前
|
Java API 开发工具
【Azure Developer】Java代码实现获取Azure 资源的指标数据却报错 "invalid time interval input"
在使用 Java 调用虚拟机 API 获取指标数据时,因本地时区设置非 UTC,导致时间格式解析错误。解决方法是在代码中手动指定时区为 UTC,使用 `ZoneOffset.ofHours(0)` 并结合 `withOffsetSameInstant` 方法进行时区转换,从而避免因时区差异引发的时间格式问题。
273 3
|
5月前
|
消息中间件 缓存 前端开发
从资损百万到零事故:Java 接口幂等设计的艺术与实践
在分布式系统中,重复请求常引发严重资损,如支付双扣、库存超卖等问题,其根源在于接口缺乏幂等性设计。本文通过真实案例揭示幂等性的重要性,并详解8种主流解决方案,涵盖唯一请求ID、乐观锁、悲观锁、状态机等,帮助开发者构建稳定系统,保障业务一致性。无论你是架构师还是开发工程师,都能从中获得实战指导,有效规避重复调用带来的风险。
474 2
|
5月前
|
数据采集 JSON Java
Java爬虫获取1688店铺所有商品接口数据实战指南
本文介绍如何使用Java爬虫技术高效获取1688店铺商品信息,涵盖环境搭建、API调用、签名生成及数据抓取全流程,并附完整代码示例,助力市场分析与选品决策。
|
5月前
|
数据采集 存储 前端开发
Java爬虫性能优化:多线程抓取JSP动态数据实践
Java爬虫性能优化:多线程抓取JSP动态数据实践
|
4月前
|
算法 安全 Java
除了类,Java中的接口和方法也可以使用泛型吗?
除了类,Java中的接口和方法也可以使用泛型吗?
180 11
|
3月前
|
Java Go 开发工具
【Java】(9)抽象类、接口、内部的运用与作用分析,枚举类型的使用
抽象类必须使用abstract修饰符来修饰,抽象方法也必须使用abstract修饰符来修饰,抽象方法不能有方法体。抽象类不能被实例化,无法使用new关键字来调用抽象类的构造器创建抽象类的实例。抽象类可以包含成员变量、方法(普通方法和抽象方法都可以)、构造器、初始化块、内部类(接 口、枚举)5种成分。抽象类的构造器不能用于创建实例,主要是用于被其子类调用。抽象类中不一定包含抽象方法,但是有抽象方法的类必定是抽象类abstract static不能同时修饰一个方法。
249 1
|
4月前
|
算法 Java
Java多线程编程:实现线程间数据共享机制
以上就是Java中几种主要处理多线程序列化资源以及协调各自独立运行但需相互配合以完成任务threads 的技术手段与策略。正确应用上述技术将大大增强你程序稳定性与效率同时也降低bug出现率因此深刻理解每项技术背后理论至关重要.
364 16
|
5月前
|
存储 缓存 安全
Java集合框架(二):Set接口与哈希表原理
本文深入解析Java中Set集合的工作原理及其实现机制,涵盖HashSet、LinkedHashSet和TreeSet三大实现类。从Set接口的特性出发,对比List理解去重机制,并详解哈希表原理、hashCode与equals方法的作用。进一步剖析HashSet的底层HashMap实现、LinkedHashSet的双向链表维护顺序特性,以及TreeSet基于红黑树的排序功能。文章还包含性能对比、自定义对象去重、集合运算实战和线程安全方案,帮助读者全面掌握Set的应用与选择策略。
344 23
|
9月前
|
自然语言处理 Java 关系型数据库
Java|小数据量场景的模糊搜索体验优化
在小数据量场景下,如何优化模糊搜索体验?本文分享一个简单实用的方案,虽然有点“土”,但效果还不错。
235 0