暂时未有相关云产品技术能力~
暂无个人介绍
Spark性能调优-RDD算子调优
Spark性能调优-RDD算子调优
精选大数据面试真题JVM专项-附答案详细解析
精选大数据面试真题JVM专项-附答案详细解析
精选大数据面试真题10道(混合型)-附答案详细解析
精选大数据面试真题10道(混合型)-附答案详细解析
不懂hive中的explain,说明hive还没入门,学会explain,能够给我们工作中使用hive带来极大的便利!
不懂hive中的explain,说明hive还没入门,学会explain,能够给我们工作中使用hive带来极大的便利!
Hadoop 核心 - HDFS 分布式文件系统详解
Hadoop 核心 - HDFS 分布式文件系统详解
Hadoop 核心 - HDFS 分布式文件系统详解
Hadoop 核心 - HDFS 分布式文件系统详解
Hadoop 核心 - HDFS 分布式文件系统详解
Flink 端到端精准一次处理语义 Exactly-once
Spark底层原理详细解析
Spark底层原理详细解析
Flink可靠性的基石-checkpoint机制详细解析
Flink可靠性的基石-checkpoint机制详细解析
Flink 中极其重要的 Time 与 Window 详细解析
Flink 中极其重要的 Time 与 Window 详细解析
Flink 中极其重要的 Time 与 Window 详细解析
hive窗口函数/分析函数详细剖析
hive窗口函数/分析函数
hive窗口函数/分析函数
Kafka底层原理剖析
Kafka底层原理剖析
Kafka底层原理剖析
今天给大家推荐一本大数据领域中必读的一本书,名字叫《大数据日知录-架构与算法》
在面试的时候,发现很多面试官特别爱问Kafka相关的问题,这也不难理解,谁让Kafka是大数据领域中消息队列的唯一王者,单机十万级别的吞吐量,毫秒级别的延迟,这种天生的分布式消息队列,谁能不爱?
在进行数仓搭建和数据分析时最常用的就是 sql,其语法简洁明了,易于理解,目前大数据领域的几大主流框架全部都支持sql语法,包括 hive,spark,flink等,所以sql在大数据领域有着不可替代的作用,需要我们重点掌握。
数仓建模首推书籍《数据仓库工具箱:维度建模权威指南》,此书是基于作者 60 多年的实际业务环境而总结的经验及教训,为读者提供正式的维度设计和开发技术。面向数仓和BI设计人员,书中涉及到的内容非常广泛,围绕一系列的商业场景或案例研究进行组织。
小文件产生原因、小文件过多产生的影响以及怎么解决小文件过多问题
详解Hadoop3.x新特性功能-HDFS纠删码
String、StringBUffer和StringBuilder的区别与使用