代码: val env = StreamExecutionEnvironment.getExecutionEnvironment
env.setRuntimeMode(RuntimeExecutionMode.BATCH) // 在DataStream API上以批处理方式执行
// 本地测试文件 val inputStream = env.readTextFile(getClass.getResource("/hello.txt").getPath)
// 分词统计,问题:批处理模式的时候,sum 为 1 的单词不会被打印 val resultStream = inputStream .flatMap(.split(",")) .filter(.nonEmpty) .map((, 1)) .keyBy(._1) .sum(1) resultStream.print() env.execute("word count")
测试文件的数据内容: hello,flink hello,flink hello,hive hello,hive hello,hbase hello,hbase hello,scala hello,kafka hello,kafka
测试结果:hello/flink/hive/hbase/kafka的和大于1,会打印出来;但是 scala的个数为1,不会被打印出来*来自志愿者整理的flink邮件归档
你用的应该是 1.12.0 版本吧。这是一个已知问题 ,升级到 1.12.1 有修复。*来自志愿者整理的flink邮件归档
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。