Python Table API 的 WordCount是什么?
首先,我们需要去初始化环境,比如第 6 行,我们先拿到了一个 ExecutionEnvironment,然后第 7 行,去创建一个 TableEnvironment。
创建 TableEnvironment 之后,需要去定义 source 跟 sink ,这里 source 跟 sink 都是指定了输入和输出的文件路径,还指定了文件中 Table 对应的一些字段,以及字段对应的数据类型。而且可以定义输出分隔符。
定义好 source 跟 sink 之后,再来看一下如何编写计算逻辑。可以用 from_path 算子来读取 source 表,读取完之后,就可以进行 group by 的一些聚合,做 group by 跟 wordcount。
做完之后,可以把结果表用 insert_into 进行输出。最后调用 Environment 的 execute 来提交作业。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。