面试-百度大数据部门RD

简介: 经过面试,顺利拿到了百度RD offer,大数据部门。 一面是下午在老校区篮球场打球接到的电话,聊了一点儿,由于有点儿吵,约在了第二天的早上八点,百度RD时间观念超强,一早就是八点整,不差一秒,接到电话后,开始就是问简历上的专业技能几个,重要问了我java、jvm、hadoop等一些问题,着重问了hadoop的底层原理和项目。

经过面试,顺利拿到了百度RD offer,大数据部门。
一面是下午在老校区篮球场打球接到的电话,聊了一点儿,由于有点儿吵,约在了第二天的早上八点,百度RD时间观念超强,一早就是八点整,不差一秒,接到电话后,开始就是问简历上的专业技能几个,重要问了我java、jvm、hadoop等一些问题,着重问了hadoop的底层原理和项目。
发现一般面试都是问你说下你简历上最熟悉自豪的一个项目,那么你就得特备别熟悉,特别是技术原理和细节知识,最好细化到代码层面。因为我面的是大数据方向,我着重说的是hadoop方面的数据处理。细节就不说了,说下问题吧,主要是hadoop的计算框架中的map端和reduce端的理解,还有就是shuffle处理的细节问题,以及搭建好的集群配置下的调优处理,然后就是算法了,二次排序详细过程以及细节问题。不过没有问我基于经典算法的大数据问题,比如大数据问题经典算法(july博客有详解,好像都不问这些了)、bitmap的使用和布隆过滤器的设计等等。
jvm相关问题和java基础等,还有spark的细节问题,下次再写,笔记本快没电了!

相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
目录
相关文章
|
SQL 前端开发 程序员
【面试题】前端开发中如何高效渲染大数据量?
【面试题】前端开发中如何高效渲染大数据量?
365 0
|
算法 前端开发 Java
数据结构与算法学习四:单链表面试题,新浪、腾讯【有难度】、百度面试题
这篇文章总结了单链表的常见面试题,并提供了详细的问题分析、思路分析以及Java代码实现,包括求单链表中有效节点的个数、查找单链表中的倒数第k个节点、单链表的反转以及从尾到头打印单链表等题目。
196 1
数据结构与算法学习四:单链表面试题,新浪、腾讯【有难度】、百度面试题
|
分布式计算 并行计算 大数据
【数据挖掘】百度2015大数据云计算研发笔试卷
百度2015年大数据云计算研发笔试卷的题目总结,涵盖了Hadoop、Spark、MPI计算框架特点、TCP连接建立过程、数组最大和问题、二分查找实现以及灯泡开关问题,提供了部分题目的解析和伪代码。
228 1
|
分布式计算 监控 大数据
《吊打面试官》- 大数据工程师50道中大厂面试真题保姆级详解
《吊打面试官》- 大数据工程师50道中大厂面试真题保姆级详解
403 1
《吊打面试官》- 大数据工程师50道中大厂面试真题保姆级详解
|
SQL 大数据
常见大数据面试SQL-每年总成绩都有所提升的学生
一张学生成绩表(student_scores),有year-学年,subject-课程,student-学生,score-分数这四个字段,请完成如下问题: 问题1:每年每门学科排名第一的学生 问题2:每年总成绩都有所提升的学生
|
缓存 运维 NoSQL
面试分享:Redis在大数据环境下的缓存策略与实践
【4月更文挑战第10天】探索Redis在大数据缓存的关键作用,本文分享面试经验及必备知识点。聚焦Redis数据结构(String、List、Set、Hash、Sorted Set)及其适用场景,缓存策略(LRU、LFU、TTL)与过期机制,集群和数据分片,以及性能优化和运维技巧。通过代码示例深入理解,助你面试成功,构建高效缓存服务。
515 4
|
SQL 分布式计算 算法
程序员必备的面试技巧——大数据工程师面试必备技能
程序员必备的面试技巧——大数据工程师面试必备技能
|
消息中间件 分布式计算 Kafka
50道大数据精选面试题
50道大数据精选面试题
|
存储 缓存 安全
兄弟面试了百度,面试题分享一波
兄弟面试了百度,面试题分享一波
186 0
|
存储 算法 Java
大厂面试高频:什么是自旋锁?Java 实现自旋锁的原理?
本文详解自旋锁的概念、优缺点、使用场景及Java实现。关注【mikechen的互联网架构】,10年+BAT架构经验倾囊相授。
大厂面试高频:什么是自旋锁?Java 实现自旋锁的原理?