开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

【百问百答】《零基础入门:从0到1学会Apache Flink》

  1. Flink是如何部署的
  2. Flink 和Spark、Storm区别
  3. Flink特点
  4. Flink Runtime 层的主要架构是什么
  5. Flink Runtime Master 组件有哪些?分别有什么作用
  6. Flink 资源有哪些模式
  7. Flink Session 模式适用什么类型任务
  8. Flink Per-Job 模式适用什么类型任务
  9. Flink Session 模式下任务提交流程是怎样的
  10. Flink Per-Job 模式下任务提交流程是怎样的
  11. Flink 资源管理模式和与作业调度是怎样的
  12. Flink 任务 Slot 选择策略
  13. Flink 中按什么顺序来调度 Task 的
  14. Flink 中资源管理的实现是什么过程
  15. Flink 中JobManager 是如何申请 Task 的资源的?
  16. Flink Task 结束,Slot释放流程是怎样的
  17. Flink Slot结束为什么使用延时释放
  18. Flink 如何解决 Slot可能存在的状态不一致问题
  19. Flink 中 Task 执行错误,如何恢复错误
  20. Flink 中集群的 Master 进行发生异常如何恢复
  21. Flink 后续版本大概会有哪些优化和扩展
  22. Flink Api主要分为几层
  23. Flink 中有哪些时间类型
  24. 如何判断 Flink 任务中应该使用哪种时间类型
  25. Flink中 Processing Time 和 Event Time 数据特性有什么不同
  26. Flink 中 WaterMark 作用是什么
  27. Flink 中 WaterMark 生成方式有哪些
  28. Flink 中 WaterMark 生成策略哪些?
  29. Flink WaterMark 处理流程
  30. ProcessFunction 和时间相关的功能有哪些
  31. Flink Table/SQL 如何注册一个 Table ?
  32. Flink 中默认窗口有哪些
  33. Flink 中数据进入窗口流程是怎样的
  34. Flink 窗口触发器是什么
  35. Flink 窗口触发器(Trigger)有哪些状态?
  36. Flink 窗口过滤器(Evictor)作用是什么
  37. Flink 内置窗口过滤器(Evictor)有几种
  38. 什么是 Flink State
  39. Flink State 根据状态分为几种
  40. 如何做好 State 管理
  41. Flink Checkpoint 与 state 的关系
  42. Flink KeyedState 支持哪些类型状态?
  43. Flink OperatorState 支持哪些类型状态?
  44. Flink 中什么是 keyed state
  45. Flink 中什么是 operator state
  46. Flink 原始状态和托管状态有什么区别
  47. Flink 状态 Statebackend 的分类
  48. Flink HeapKeyedStateBackend 是如何实现的
  49. Flink RocksDBStateBackend 适用场景有哪些
  50. Flink 状态持久化策略有哪些?
  51. Flink Checkpoint 执行流程详解
  52. 什么是 FLink 状态重分布
  53. Flink OperatorState 是如何重分布的
  54. Flink KeyedState 是如何重分布的
  55. Savepoint 与 Checkpoint 的区别
  56. Flink 如何实现 Checkpoint 的 EXACTLY_ONCE 语义
  57. Flink DataStream 状态过期是怎样配置的
  58. Flink 状态过期是如何清理的?
  59. Flink 有哪些运行模式
  60. JobManager 功能有哪些
  61. TaskManager 里面的主要组件有什么
  62. Flink Standalone 模式有什么特点
  63. Flink 中一个 Standalone 任务的运行过程是怎样的
  64. Flink 运行时的一些组件有什么
  65. Yarn 集群的组件有哪些
  66. Yarn 交互流程是怎样的
  67. Yarn 中任务提交流程是怎样的
  68. Flink on Yarn 中的 Per Job 模式是指什么
  69. Flink on Yarn 中的 Per Job 模式运行流程是怎样的
  70. Flink on Yarn 中的 Session 模式是什么
  71. Flink on Yarn 中的 Session 模式运行流程是怎样的
  72. Flink on Yarn 的 Session 模式和 Per Job 模式的应用场景有什么区别
  73. Flink on Yarn 有什么优缺点
  74. Kubernetes 中基础组件有哪些
  75. Kubernetes 运行流程是怎样的
  76. Kubernetes 核心概念有哪些
  77. Flink on Kubernetes 任务在 Kubernetes 上运行的步骤是怎样的
  78. Flink on Kubernetes JobManager 的执行过程是怎样的
  79. Flink on Kubernetes 交互流程是怎样的
  80. Flink on Kubernetes 中 k8s 各个组件具体的作用是什么
  81. Flink 在 K8s 上可以通过 Operator 方式提交任务吗?
  82. Flink 在 K8s 集群上如果不使用 Zookeeper 有没有其他高可用(HA)的方案?
  83. Flink on K8s 在任务启动时需要指定 TaskManager 的个数,有和 Yarn 一样的动态资源申请方式吗?
  84. 为什么要为 Flink 量身定制序列化框架
  85. 数据分析引擎面对 Java 对象存储密度较低,是怎样解决的
  86. Flink 中数据类型有哪些
  87. Flink 内部是如何表示数据类型的
  88. Flink 中 TypeInformation 有哪些类型
  89. Flink 中 TypeInformation 作用是什么
  90. Flink 的序列化过程是怎样的
  91. Flink 常见的序列化应用场景有哪些
  92. Flink 通信层的序列化是怎样的
  93. 在 Flink 通信层的序列化中,何时确定 Function 的输入输出类型
  94. 在 Flink 通信层的序列化中,何时确定 Function 的序列化 / 反序列化器
  95. 在 Flink 通信层的序列化中,何时进行真正的序列化 / 反序列化操作?
  96. Flink 对于无法序列化的类型是如何处理的
  97. Flink 序列化过程中,进行序列化操作的序列化器从何而来?
  98. Flink Pojo 的序列化与反序列化的类型规则是怎样的
  99. Flink 类型信息系统如何拓展
  100. Flink 任务执行时如何转换的
  101. Flink 任务 Program 到 StreamGraph 是怎样转化
  102. Flink 中 StreamNode 和 StreamEdge 是什么
  103. Flink 任务 StreamGraph 到 JobGraph 是怎样转化
  104. Flink 任务中为什么要为每个 operator 生成 hash 值?
  105. Flink 中每个 operator 是怎样生成 hash 值的?
  106. Flink operator 合并具体条件有哪些
  107. Flink operator 自动生成 hash 值因素有哪些
  108. Flink JobGraph 到 ExexcutionGraph 以及物理执行计划是怎样的
  109. Fink on Yarn 的缺陷具体是什么
  110. Flink Dispatcher 是什么
  111. 为什么 Flink 要引入 Dispatcher
  112. 为什么需要网络流控
  113. 网络流控是怎样实现的
  114. 静态网络限速有什么限制
  115. Flink 1.5 以前如何实现 feedback 机制?
  116. Flink 1.5 TCP 流控机制是怎样的
  117. Flink TCP-based 反压机制是怎样的
  118. Flink TCP-based 反压机制弊端有哪些
  119. Flink 是如何实现的流控机制的
  120. Flink Credit-based 反压过程是怎样的
  121. 有了动态反压,静态限速是不是完全没有作用了?
  122. Flink Metric 有哪些类型
  123. Flink 中获取 Metrics 有哪些方法
  124. 如何定位 Flink 任务运行慢的问题
  125. Metrics 是系统内部的监控,那是否可以作为 Flink 日志分析的输出?
  126. Flink Reporter 是有专门的线程吗?
  127. Flink 有哪些方式可以跟外界进行数据交换?
  128. Flink 预定义 source 和 sink 有哪些
  129. Apache Bahir 中提供了哪些 Flink connecter
  130. FlinkKafkaConsumer 中消费起始位置如何设置?
  131. FlinkKafkaConsumer 如何在不重启作业情况下动态感知新扩容的 partition
  132. FlinkKafkaConsumer offset 是如何提交的?
  133. FlinkKakfaConsumer Watermark 如何生成
  134. Flink kafka Producer 分区是怎样的
  135. Flink kafka Producer 如何达到 at-least-once 语义
  136. 在 Flink consumer 的并行度的设置是对应 topic 的 partitions 个数吗?要是有多个主题数据源,并行度是设置成总体的 partitions 数吗?
  137. 在构造 FlinkKafkaProducer 时, 如果 partitioner 传 null 的时候是 round-robin 发到每一个 partition ?如果有 key 的时候行为是 kafka 那种按照 key 分布到具体分区的行为吗?
  138. 如果 checkpoint 时间过长,offset 未提交到 kafka,此时节点宕机了,重启之后的重复消费如何保证呢?
  139. Flink operator state 以及 keyed state 有什么区别
  140. Flink Operator state 使用有哪些注意事项
  141. Flink Keyed state 使用有哪些注意事项
  142. Flink Checkpoint 使用有哪些注意事项
  143. 典型的机器学习工作流程有哪些问题
  144. Flink 如何实现对机器学习的抽象、扩展
  145. Flink TableEnvironment 组成部分有哪些
  146. Flink TableEnvironment 的适用场景有什么
  147. Flink Table API&SQL 解析验证
  148. Flink 为什么选择支持 Python
  149. Flink Python Table API 架构是怎样的
  150. Flink PythonVM 和 JavaVM 是怎样通讯的?
  151. Flink Python Table API 环境搭建流程是怎样的
  152. Flink Python Table API 作业是如何提交的
  153. 容错保证语义有哪些层次
  154. Flink 检查点保留策略有哪些
  155. Flink 作业自动重启策略有哪些
  156. Flink 在作业有变更请求, 有哪些操作可能会导致无法从检查点恢复
  157. Flink 检查点协调器是什么
  158. Flink 中检查点协调器在 Checkpoint 中作用是什么
  159. Flink 检查点信息中有哪些信息
  160. 为什么 Flink 使用轻量级分布式快照
  161. Flink 分布式快照如何切分数据流
  162. Flink 算子接收到 Barrier 会如何处理
  163. Flink Checkpoint 时,为什么要对齐 Barrier
  164. Flink Checkpoint 时,Barrier 是如何对齐的
  165. Flink Checkpoint JobMaster 执行需要做哪些检查
  166. Flink Checkpoint TaskExecutor 需要做哪些工作
  167. Flink Source/Sink 如何才能支持端到端严格一次
  168. Flink 分布式多个并发执行中如何实现端到端严格一次
  169. Flink 两阶段提交流程是怎样的
  170. Flink 为什么选择使用自主的内存管理
  171. Flink 中 Java 对象内存中是如何存储的
  172. Flink 1.10 以前的内存模型有哪些缺陷
  173. Flink TaskManager 内存模型是怎样的
  174. Flink TaskManager Flink本身使用的内存是如何分布的
  175. Flink TaskManager JVM 使用的内存是如何分布的
  176. Flink 中各个内存区块大小是在什么地方计算
  177. Flink 中各个内存区块大小是如何计算的
  178. Flink 内存结构是如何划分的
  179. Flink 中内存段是什么
  180. Flink 中内存页是什么
  181. Flink 中内存段的关键属性有哪些
  182. 字节顺序 Little Endian 和 Big Endian 有什么区别
  183. Flink 内存页是如何使用的
  184. Flink 中流任务和批任务内存申请是如何进行的
  185. Flink 中内存什么时候会释放
  186. Flink 中内存是如何释放的
  187. Flink 中调度器是什么
  188. Flink 中调度器有哪些能力
  189. Flink 中有哪些调度器
  190. Flink 作业有哪些生命周期状态

《零基础入门:从0到1学会Apache Flink》下载地址:https://developer.aliyun.com/topic/download?id=35

展开
收起
一人吃饱,全家不饿 2021-01-08 15:32:13 11309 1
2 条回答
写回答
取消 提交回答

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

相关产品

  • 实时计算 Flink版
  • 相关电子书

    更多
    Flink CDC Meetup PPT - 龚中强 立即下载
    Flink CDC Meetup PPT - 王赫 立即下载
    Flink CDC Meetup PPT - 覃立辉 立即下载

    相关镜像