Apache

首页 标签 Apache
# Apache #
关注
28775内容
Apache Flink 漫谈系列(09) - JOIN 算子
聊什么 在《Apache Flink 漫谈系列 - SQL概览》中我们介绍了JOIN算子的语义和基本的使用方式,介绍过程中大家发现Apache Flink在语法语义上是遵循ANSI-SQL标准的,那么再深思一下传统数据库为啥需要有JOIN算子呢?在实现原理上面Apache Flink内部实现和传统.
后端必备——数据通信知识(RPC、消息队列)一站式总结
RPC(Remote Procedure Call)—远程过程调用 ,它是一种通过网络从远程计算机程序上请求服务,而不需要了解底层网络技术的协议。RPC协议假定某些传输协议的存在,如TCP或UDP,为通信程序之间携带信息数据。
Apache Flink 漫谈系列(06) - 流表对偶(duality)性
实际问题 很多大数据计算产品,都对用户提供了SQL API,比如Hive, Spark, Flink等,那么SQL作为传统关系数据库的查询语言,是应用在批查询场景的。Hive和Spark本质上都是Batch的计算模式(在《Apache Flink 漫谈系列 - 概述》我们介绍过Spark是Micr.
Hive中文件存储格式及大小比较测试
file_format: : SEQUENCEFILE | TEXTFILE -- (Default, depending on hive.default.fileformat configuration) | RCFILE -- (Note: Available in Hive 0.
Spark修炼之道(进阶篇)——Spark入门到精通:第十三节 Spark Streaming—— Spark SQL、DataFrame与Spark Streaming
主要内容 Spark SQL、DataFrame与Spark Streaming 1. Spark SQL、DataFrame与Spark Streaming 源码直接参照:https://github.com/apache/spark/blob/master/examples/src/main/scala/org/apache/spark/examples/stre
maven常见问题汇总
child module ….pom.xml does not exist a.注意module的名称是否正确,有时候命名问题会导致找不到项目的 b.注意一开始项目命名的规则问题注意一开始项目命名的规则问题         使用maven-compiler-plugin 时 POM...
LocalFlinkMiniCluster启动DataStream任务的流程
LocalFlinkMiniCluster 集群的actor 模型 --- - 相关的主要类图如下: ![image-20190415180352502.png](https://ata2-img.cn-hangzhou.oss-pub.aliyun-inc.com/3763cc8b905776d9c23cc98318fc7a3c.png) - AkkaRpcA
免费试用