死磕flink(八)

本文涉及的产品
实时计算 Flink 版,5000CU*H 3个月
简介: 死磕flink(八)

基于上一篇flink文章,没写完,也是倒腾了挺长时间才出来单词统计的效果。

首先,要完成一个例子 :提交一个简单的 WordCount 作业 在docker容器中。

步骤①、:首先在宿主机中,创建input文件,并copy到jobManager容器中:

步骤②:在jobManager容器中,执行单词统计的命令:

查看:在taskManager容器中,查看output.txt文件:

相关实践学习
基于Hologres轻松玩转一站式实时仓库
本场景介绍如何利用阿里云MaxCompute、实时计算Flink和交互式分析服务Hologres开发离线、实时数据融合分析的数据大屏应用。
Linux入门到精通
本套课程是从入门开始的Linux学习课程,适合初学者阅读。由浅入深案例丰富,通俗易懂。主要涉及基础的系统操作以及工作中常用的各种服务软件的应用、部署和优化。即使是零基础的学员,只要能够坚持把所有章节都学完,也一定会受益匪浅。
相关文章
|
4月前
|
消息中间件 API 数据处理
Flink常见面试问题(附答案)
Apache Flink是开源的流批处理框架,提供低延迟、高吞吐的数据处理。与Hadoop不同,Flink专注于实时数据流。其核心特性包括事件时间和处理时间的概念,事件时间通过水印处理乱序事件。Flink通过检查点实现容错,支持滚动、滑动和会话窗口进行流数据处理。状态后端用于管理应用程序状态,水印用于处理延迟数据。Flink与Kafka集成能保证事件顺序,支持多种连接器如Kafka、JDBC等。其处理延迟数据、乱序事件的能力,以及Exactly-Once语义,使其在大规模数据处理中具有优势。Flink还支持表格API和DataStream API,以及多种容错和性能优化策略。
242 2
Flink常见面试问题(附答案)
|
2天前
|
消息中间件 存储 算法
死磕-kafka(二)
死磕-kafka(二)
|
2天前
|
消息中间件 存储 分布式计算
死磕-kafka(三)
死磕-kafka(三)
|
2天前
|
消息中间件 Kafka 调度
死磕-kafka(一)
死磕-kafka(一)
|
2天前
|
分布式计算 大数据 数据处理
死磕Flink(一)
死磕Flink(一)
|
2天前
|
资源调度 流计算 Docker
死磕flink(七)
死磕flink(七)
|
2天前
|
Linux 流计算
死磕flink(四)
死磕flink(四)
|
2天前
|
SQL 资源调度 Kubernetes
死磕flink(五)
死磕flink(五)
|
2天前
|
SQL 算法 API
死磕flink(三)
死磕flink(三)
|
2天前
|
存储 分布式计算 大数据
死磕Flink(二)
死磕Flink(二)