暂无个人介绍
kafka消息丢失的场景分析
kafka如何最大限度的保证数据不丢失
1) 开启配置:set hive.optimize.bucketmapjoin = true; 2) 一个表的bucket数是另一个表bucket数的==整数倍== 3) bucket列 == join列 4) 满足map join条件
HADOOP集群具体来说包含两个集群:HDFS集群和YARN集群,两者逻辑上分离,但物理上常在一起。
Yarn的作业流程是每个大数据领域的工作者都应该熟记于心的内容,今天我就来整理一下执行流程,记得点赞加收藏哦。
【弹出USB大容量存储设备时出问题】两步搞定
Hadoop是Apache旗下的一个用java语言实现开源软件框架,是一个开发和运行处理大规模数据的软件平台。允许使用简单的编程模型在大量计算机集群上对大型数据集进行分布式处理。
zookeeper的选举机制其实就是zab(原子广播)的恢复机制 选举有两种, 一种是basic paxos算法,一种是fast paxos算法 默认的半数选举机制是fast paxos算法,当有一半以上的节点选举时, 这个节点就是leader.
HDFS的入门,一片就够了,有实操,有理论
数字孪生是充分利用物理模型、传感器更新、运行历史等数据,集成多学科、多物理量、多尺度、多概率的仿真过程,在虚拟空间中完成映射,从而反映相对应的实体装备的全生命周期过程。数字孪生是一种超越现实的概念,可以被视为一个或多个重要的、彼此依赖的装备系统的数字映射系统。
Hello Word你真的理解了么?今天教我的表弟,有些感悟