开发者社区> 问答> 正文

简单插数etl, 基本的过滤, 窗口. 请问还有没有什么定性定量的方式可以测量框架性能?

近期我需要做一个 Flink/SparkStreaming 吞吐/延时的性能分析, 我发现网上这方面资料很少, 只有17年美团/15年yahoo 做了一个类似的分析. 问题如下: 1. 简单的读kafka写kafka 要如何记录数据进flink/出flink 的时间? 如果是打时间戳要怎么打? 打的话会不会影响性能? 2. 我想到的场景是: 简单插数etl, 基本的过滤, 窗口. 请问还有没有什么定性定量的方式可以测量框架性能?

yahoo: https://yahooeng.tumblr.com/post/135321837876/benchmarking-streaming-computation-engines-at

*来自志愿者整理的flink邮件归档

展开
收起
游客nnqbtnagn7h6s 2021-12-06 20:12:19 403 0
1 条回答
写回答
取消 提交回答
  • 我们最近做了一个基于beam nexmark的性能对比测试[1],你可以参考一下。 和beam的测试不同的是,我们用各自引擎的API对着测试case描述的场景重新写了一下,并不是像这个里面一样全都用 beam的api写测试case,然后翻译到多个runner之上。

    [1] https://beam.apache.org/documentation/sdks/java/testing/nexmark/

    *来自志愿者整理的flink邮件归档

    2021-12-06 21:40:07
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
百度大规模时序指标自动异常检测实战 立即下载
智能运维里的时间序列:异常检测、根源分析、预测 立即下载
360病毒样本大规模异构实时扫描平台 立即下载