2019-5-12的kafka&Flink沙龙收获

本文涉及的产品
实时计算 Flink 版,5000CU*H 3个月
简介: kafka 大会,美团、京东大厂的kafka最佳实践经验

地址 360大厦A座
花了一下午时间,总要有所收获,本人正在负责公司小kafka集群,所以对kafka相关课题比较关心,也有收获,Flink还未入坑,这里并没有Flink相关的收获。

美团

  • 介绍了现状,Kafka集群在数据平台中的功能,通过介绍得知,其负责数据传输

    • 一类是日志数据,业务日志和用户行为,一类是DB数据,应该是二进制流。
    • 下游接入的是离线计算,实时计算,日志中心和OLAP。
    • 入流峰值,3千万/s
  • 然后介绍了高吞吐方面的优化

    • 二次开发:Disk层面的Rebalance,解决了以下痛点:

      • broker分配依据是Partition数,不够精细,会产生数倾斜。
      • 新加入节点不会Rebalance
    • Flink实时入仓,这个没懂。
    • 硬件选型:与计算密集型混部,充分利用磁盘资源;JBOD最大化利用率;引入大CacheRaid卡,进一步增加缓存。
    • 新缓存架构探索:FlashCache.
  • 最后介绍了超大集群:1000+broker,40kTopics

    • 由于controller的瓶颈问题,集群规模一般不超过200broker,比如京东。
    • 找到瓶颈,做了controller与broker分离,并集群化,提高其管理能力,解决大集群瓶颈问题。
    • 建立了region隔离机制。(看来大集群还是要分割)
    • 增加了SafeMode机制,中心节点不可用时集群仍能工作。
  • 总结,目前阶段对我直接有用的(1)硬件选型和规划(2)普通集群瓶颈在哪,避免过大。

京东

  • 现状:56个集群,broker1530,topic15699,分区460301
  • 产品化:

    • 跨机房灾备:mirror maker同步数据,就近消费,跨机房容灾靠dns切换域名。
    • 读写分离:分别建立生产者集群和消费者集群,来解决消费者横向扩展问题和生产消费干扰的问题。(这个方案很新颖,是否合理呢?)
    • 安全认证改进:去keytab,去jaas,Keberos认证,增加域名认证。
    • 周边功能完善:集群管理、运维管理、权限管理、用户认证;监控,挤压监控、实时大屏;SDK封装、消息查询工具、样本提取过滤工具、运营报表
  • 探索:

    • 性能测试,挖掘:crc32优化,服务端解压缩问题,v1和v2协议性能对比
    • 全链路域名化:对跨机房灾备,对用户访问透明有非常大的好处。
    • Kafka on K8S vs 与实时计算服务器混部
  • 总结:觉得京东还是做了些有意义的工作,没有过度定制kafka,尊重生态,改进生态。很多建议和经验放到小公司也可以得到借鉴。
目录
相关文章
|
1天前
|
消息中间件 Java Kafka
实时计算 Flink版产品使用合集之在处理Kafka实时同步时,遇到反压的情况,该怎么办
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
18 1
|
1天前
|
消息中间件 关系型数据库 网络安全
实时计算 Flink版操作报错合集之Flink sql-client 针对kafka的protobuf格式数据建表,报错:java.lang.ClassNotFoundException 如何解决
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
11 1
|
1天前
|
消息中间件 关系型数据库 Kafka
实时计算 Flink版产品使用合集之想要加快消费 Kafka 数据的速度,该怎么配置参数
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
15 2
|
2天前
|
消息中间件 SQL 关系型数据库
实时计算 Flink版产品使用合集之读取kafka数据然后入库到starrocks,出现未知问题如何解决
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
13 1
|
2天前
|
SQL 消息中间件 Kafka
实时计算 Flink版产品使用合集之支持sink到多分区的kafka ,还能保持有序吗
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
16 0
|
消息中间件 Kafka 流计算
|
3天前
|
消息中间件 Kafka Apache
Apache Flink 是一个开源的分布式流处理框架
Apache Flink 是一个开源的分布式流处理框架
722 5
|
3天前
|
消息中间件 API Apache
官宣|阿里巴巴捐赠的 Flink CDC 项目正式加入 Apache 基金会
本文整理自阿里云开源大数据平台徐榜江 (雪尽),关于阿里巴巴捐赠的 Flink CDC 项目正式加入 Apache 基金会。
1809 2
官宣|阿里巴巴捐赠的 Flink CDC 项目正式加入 Apache 基金会
|
3天前
|
SQL Java API
官宣|Apache Flink 1.19 发布公告
Apache Flink PMC(项目管理委员)很高兴地宣布发布 Apache Flink 1.19.0。
1794 2
官宣|Apache Flink 1.19 发布公告
|
3天前
|
SQL Apache 流计算
Apache Flink官方网站提供了关于如何使用Docker进行Flink CDC测试的文档
【2月更文挑战第25天】Apache Flink官方网站提供了关于如何使用Docker进行Flink CDC测试的文档
348 3