Flink中和各位大哥请教一下, 自定义redis数据源,定时扫描key,然后供下游使用, 请问下多并行度意义不大吧 ?
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
在Flink中自定义Redis数据源,可以通过以下步骤实现定时扫描key并供下游使用:
1、创建一个Redis连接池,用于连接Redis数据库。
RedisClient redisClient = RedisClient.create("redis://localhost:6379");  
StatefulRedisConnection<String, String> connection = redisClient.connect();
  
  // 省略其他配置项
}
2、创建一个自定义数据源,并实现createReader()方法。在该方法中,使用StatefulRedisConnection对象连接Redis数据库,并使用Redis命令扫描指定的key。
public class RedisCustomDataSource implements DataSource<String> {  
    private final String keyPattern;  
    private final long startTime;  
    private final long endTime;  
    private final int batchSize;  
    private final long interval;  
    private final int port;  
    private final String password;  
    private final int databaseIndex;  
  
    public RedisCustomDataSource(String keyPattern, long startTime, long endTime, int batchSize, long interval, int port, String password, int databaseIndex) {  
        this.keyPattern = keyPattern;  
        this.startTime = startTime;  
        this.endTime = endTime;  
        this.batchSize = batchSize;  
        this.interval = interval;  
        this.port = port;  
        this.password = password;  
        this.databaseIndex = databaseIndex;  
    }  
  
    @Override  
    public Cancellable schedule(SourceFunction.SourceContext<String> ctx) {  
        return new ScheduledSource(ctx);  
    }  
  
    private class ScheduledSource implements Cancellable {  
        private final SourceFunction.SourceContext<String> ctx;  
        private boolean running = true;  
        private ScheduledFuture<?> exec
实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。