暂时未有相关云产品技术能力~
暂无个人介绍
数据重复插入问题及解决方案
从数据库中提取大量数据到 HashMap 集合中,优化方案有以下几点:
从数据库中将大量数据导入到 HashMap 中需要注意以下几点:
hive 小文件问题及解决方法【重要】
分区表和分桶表(高频重点)
行式存储和列式存储的区别
Hive 支持的文件存储格式(重点)
rank()、dense-rank()、row-number()的区别
UDF,UDAF,UDTF 概念及常用函数
自定义 UDF、UDTF【重点】
Hive 常用函数
Hive 常用的窗口函数【高频重点】
Hive 中 4 个 By 的区别
Hive 内部表(管理表)和外部表的区别【重点】
Hive 和数据库的区别
Hive 架构、执行原理【重要】
synchronize 三大作用、三大用法
项目中使用多线程的场景,多线程的优缺点
常用的线程池有哪些?
Java 同步线程有哪些方式?
什么是 CAS? CAS 有哪些缺点?ABA 问题是什么?
synchronized 锁与 ReentrantLock 锁的区别
什么是线程安全?如何保证线程安全?Java 中保证线程安全的方法有哪些?【重要】
共享锁(读锁)和排他锁(写锁)
线程发生阻塞,怎么唤醒线程?
Thread 类中的 yield()方法有什么作用?
为什么 wait, notify 和 notifyAll 这些方法不在 thread 类里面?
notify () 和 notifyAll () 的区别
volatile 的作用是什么?能保证原子性吗?能保证有序性吗?
什么是死锁?产生死锁的原因?产生死锁的四个必要条件?死锁的避免与预防?
数据结构各结构特点(数组、链表、栈、队列、树)(下)
数据结构各结构特点(数组、链表、栈、队列、树)
抽象类和普通类的区别
Java 序列化中如果有些字段不想进行序列化,怎么办?
Hadoop 性能优化经验
几种压缩方式及各自优缺点【重点】
Yarn 的工作原理、流程【重要】
Yarn 的默认调度器、调度器分类、以及他们之间的区别
fsimage 和 edit 的区别
在通过客户端向 hdfs 中写数据的时候,如果某一台机器宕机了,会怎么处理
分别举例什么情况要使用 combiner,什么情况不使用?
MapReduce 优化经验
MapTask 、ReduceTask 数量的决定因素
HDFS 小文件问题及处理方法【重要】
MapReduce 的原理、流程【重要】
MapReduce 的 shuffle 阶段【重要】
一个 datanode 宕机,恢复流程
hadoop 的 namenode 宕机,怎么解决?
简述 HDFS 的系统架构,以及如何保证数据安全
HDFS 的安全模式