暂无个人介绍
问题很久远了,因为做过类似的设备监控的事情,简单说下我的做法:不靠flink本身来做,而是通过redis的timeout来做的。
keyby后,数据会根据key值发往下游的operator。建议你看下graph中哪个task产生了反压,是不是和IO相关。
个人理解是管理和监控上的事情,这两点对生产环境尤为重要。standalone缺少系统层面的管理、缺少资源隔离、缺少进程级异常恢复。另外如果想做高可用,还要依赖hdfs,所以不如yarn和hdfs一起上。
这个问题能再拿出聊一下么?
老哥,给点上下文,cp写哪啊,需要写这么长时间。
关键栈信息是不能发送到kafka。。。。
join实现方式是nested-loop join , 得出的是笛卡儿积。具体到0,1 和1,0。对应的就是第一个窗口内的,。官方文档可以参考这个: https://flink.apache.org/news/2015/03/13/peeking-into-Apache-Flinks-Engine-Room.html