坐标:深圳
面试公司:腾讯 Python 一面
没有问项目也没有问之前的工作经历,估计看一下简历就了解个大概了,就是一顿面问题,语速也是很快,不过问题问得非常清楚,如果你解释的不对,他会做补充。总体感受不错,总结一下面试题吧。
面试内容
1,平时都用哪些语言?
答:平时用 C++ 多一点,Python 也了解,但不是很深入,基本上都是直接调的函数和相应的库,并没有研究它底部到底是怎么实现的,意思就是没看过
Python 源码,你就问我 C++ 吧。(果然他开始问 C++,所以他这样问肯定是想问你最擅长的语言)
2,你有用过 STL , boost 这些库吗?
答:用过 STL,最近在看侯X老师的 STL 源码剖析。
3,STL 都有哪几个组成部分?
答:容器,适配器,迭代器,算法,然后就知道还有一个,现在想想肯定是由于当时有点紧张,就没答出来,还是看过源码的人呢,这都答不出来,丢人,他还给提示说加括号那个,我竟然说是运算符重载,(我以为是()重载,这和 STL 有什么关系,这都能说出来。。。),他最后说还有仿函数,心想这个和括号有什么关系,后来想想确实是有关系,一般用到仿函数的时候都会在后面加个括号,表示这是一个匿名对象,这样进行使用,看来应了那句话:了解不行,知道也不行,必须形成条件反射才行。
4,问我 STL 你都有用过哪些容器?
答:很随意地说用过 array,vector(这个用的比较多),set,map,hash_map,hash_set,然后他似乎听得出来了,然后就问我 STL 里面就直接叫 hash_map 吗?哈哈,此刻确定他在听我讲话,然后立即改口说,不是,叫 unordered_map,unordered_set。
5,set 底层是怎么实现的 ?
答:用红黑树来实现的,我以为他会问我具体的红黑树知识,比如插入,删除,调整,结果啥都没问,就直接过了。吓了一身汗。。。
6,unordered_map 的底部是怎么实现的?
答:用 hash_table 来实现的 。
7,查找的时间复杂度是多少?
答:定位一个槽 是 O(1),如果定位一个元素,用外部拉链法的话,平均查找长度是链表的长度的一半,时间复杂度为 O(n)。
8,估计是听到外部拉链法,就直接问有没有其他的处理冲突的方式?
答:二次寻址法,双散列法
9,如果我要实现一个hash_map,键为 字符串(string),那该如何设计?
答:我说:直接把对应的键值对存到每个槽对应链表节点中就行了,他说:我不是这个意思,就是你定位槽的时候不是需要取模运算吗,那 string 怎么取模呢?我说:需要把这个字符串转换为对应的Hash Code,然后说 STL 中是这样实现的,就是直接用 i * 5 + j 这个公式直接求该字符串的 hashCode 值【注:看源码还是有用的】。
10,他说用 C++ 内存泄漏这个问题还挺麻烦的,如果你的程序发生了内存泄漏,你怎么才能检测到是在哪发生了内存泄漏了呢?
答:可以用内存泄漏的分析工具来分析,他问:比如哪些工具?答:其实我是忘记了,记得嵌入式 Linux 课有一个实验让用 这个工具,而且也看到过相应的博客,所以 Val ...g...,我说忘记怎么读了,他知道我了解这个工具,就直接告诉我了,叫 Valgrind。当然还有其它很多,答什么都可以的。他问:还有什么其它办法嘛?确实想不起来了,他作罢。
11,然后好像没什么可问的了,就直接跳转到操作系统了,然后问你会 linux 系统的使用吗?
答:会一些基本命令,他问:比如都会哪些命令?答:ls ,cp,mv,cd 等等这些基本命令,他也就没再问下去了。
12,现在说 系统是 64 位 还是 32 位是什么意思?
答:是说 cpu 每次可以处理的数据位数,应该没啥毛病啊,莫不是 地址线是 64 条 ,还是数据线是 64 条???应该是回答的不好,他也就直接就没再问了。
13,问 32 位系统下一个进程可分配的最大内存空间是多少?
答:这道题直接回答不上来,我记得内存最大的是 4G,其中内核地址是最高的 1G 空间,其它的 3G 都是用户态空间,这一个进程能分配多大还真是不知道,莫不是可以全用???然后觉得操作系统部分的内容掌握得不太好。。主要是整天用 windows ,要是用 Linux 应该知道吧。。
然后转到计算机网络部分
14,你知道 UDP 和 TCP 有哪些不同嘛?
答:最主要的不同就是 TCP 是可靠传输,UDP 是不可靠传输,TCP需要建立连接,UDP 不需要,TCP 有拥塞控制,UDP 没有。
15,因为话多,因为多说了一句:TCP 用来保证可靠传输的方法 UDP 都没有,因为 UDP 是不可靠传输,然后他就问,都有哪些手段保证 TCP 可靠传输?
答:滑动窗口进行流量控制,超时重传,ack 确认等。然后他就没再问了。
转到数据库部分
16,你有用过哪些数据库?
答:Mysql 用的比较多一些。
17,如果我有一个表比较大,我现在执行了一个 select 语句,发现运行得特别慢,我该怎么解决?
答:这主要看这张表具体有多大,如果很大,有几亿行的话,那么就需要考虑分表的问题,如果不是很大,不至于分表,那么可以考虑是不是需要建索引,他问:还有别的办法吗?答:也许是你的select 语句写的不合适,他问:我没听懂,什么是不合适?答:也可能是索引已经建好了,可是你的 select 语句没用到索引,或者是没有索引。
问:如何知道自己的 sql 语句有没有索引?
答:在自己的 sql 语句前面加 explain 就可以看到 sql 语句的具体执行过程。
18,你平时都是怎么调试程序的?
答:我主要是用 VS 写代码,所以用断点调试用的比较多,也会用到 print 进行打印信息来调试。他问:如果用 print 的话,那信息走得太快了,一闪而过怎么办?我说可以加断点或者加延迟函数可以看到,现在想一下,VS 里面最后不是一般加 system("pause"),就可以停住了嘛,dev++ 什么也不用加就自己停住了啊,怎么会看不到 打印出来的信息呢???不知道他想问啥。。
19,我写了一个程序,发现 cup 的负载量达到了 100%,我程序中可能出现了一个死循环,我该怎么找到这个死循环出现的地方呢?
答:可以用二分查找的,定位出现死循环的地方,或者通过加断点的方式来进行查找死循环。他问:那找找也很慢啊,还有其他的方式嘛?我实在想不到了,他就此作罢。
20,现在我有 10000 个数,我想找到最大的 100个,怎么找呢?(实用算法课 PPT 上的原例)
答:可以用堆来做,问:怎么做?答:先建立一个100个元素的小根堆,然后遍历后面剩余的元素,如果比堆顶的元素小,则直接跳过,如果比堆顶的元素大,则和当前堆顶元素进行交换,然后调整堆,最后剩余的堆中的元素就是前100大的元素。
21,(坑人的来了)问你这个时间复杂度是多少?
答:建队时间是 O(Nlog2N)[注:STL 中做了优化,可以达到在线性时间内完成建堆],然后对后面的元素进行遍历,然后不断调整堆,需要O(Nlog2N) 的时间复杂度。这不是原理嘛,但是他说那和快排的时间复杂度是一样的话,为什么不用快排呢?然后我就卡在这了。。。我答:可能是时间复杂度的常数项不一样。他说:遍历后面的N个元素是少不了的,O(N) 是少不了的,那个 O(log2N) 怎么来的,我说每次调整堆都需要 O(log2N) 的时间复杂度啊,但是如果比堆顶元素小的话,直接跳过,就不用调整了。但是快排需要对所有元素进行排序。他说:时间复杂度就得考虑最坏情况下,最后实在不知道问题出在哪了???就此作罢,他说:你时间复杂度回答的不对。(回答不对直接告诉你,这个还挺人性化的)
22,然后就问你家是哪的?愿意来深圳不?
答:你说该怎么回答,肯定是愿意啦。
23,然后问我有什么问题?
答:随便问了,比如主要做什么工作?接触什么知识,做的工作能不能直接感受到?等等。。