各位大佬,我现在通过pyflink实时将kafka的消息获取,一条线直接进入mysql,另一条线通过udf去查该mysql的历史数据进行计算,当数据量达到1百万的时候,性能就下降了。怎么优化呢*来自志愿者整理的flink
Hi, 我理解主要是在写入或者查询的网络IO上。对于写入的化,可以批量写入,减少网络IO。 查询的话,如果数据特点比较适合做缓存的话,可以增加 LRU 缓存,异步查询等。*来自志愿者整理的flink
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。