一、单选
1、关于正态分布,下列说法错误的是 (C)
A、正态分布具有集中性和对称性
B、正态分布的均值和方差能够决定正态分布的位置和形态
C、正态分布的偏度为0,峰度为1
D、标准正态分布的均值为0,方差为1
正态分布:偏度=0,峰度=0
偏度(Skewness):衡量随机变量概率分布的不对称性;若偏度大于0,则分布右偏,即分布有一条长尾在右;若偏度小于0,则分布为左偏,即分布有一条长尾在左;同时偏度的绝对值越大,说明分布的偏移程度越严重。
峰度(Kurtosis):研究数据分布陡峭或平滑的统计量;若峰度>0,分布的峰态陡峭(高尖);若峰度<0,分布的峰态平缓(矮胖);均匀分布的峰度为-1.2(平缓),指数分布的峰度为6(陡峭)。
2、从sd卡加载一张图片为bitmap并显示到屏幕上的一个view,该view占用的内存主要和什么因素有关 (D)
A、图片文件大小及压缩格式
B、图片原始分辨率
C、view的尺寸
D、bitmap分辨率和颜色位数
位图(Bitmap),又称栅格图(英语:Raster graphics)或点阵图,是使用像素阵列(Pixel-array/Dot-matrix点阵)来表示的图像。
3、S市A,B共有两个区,人口比例为3:5,据历史统计A的犯罪率为0.01%,B区为0.015%,现有一起新案件发生在S市,那么案件发生在A区的可能性有多大?(C)
A、37.5%
B、32.5%
C、28.6%
D、26.1%
【条件概率】
在A区犯案概率:P(C|A)=0.01%
在B区犯案概率:P(C|B)=0.015%
【先验概率】
在A区概率:P(A)=3/8
在B区概率:P(B)=5/8
【全概率】
犯案概率:P©=(3/8 * 0.01%+5/8 * 0.015%)
【后验概率】
则犯案且在A区的概率:P(A|C)=[ P(C|A) * P(A) ] / P© =[ P(C|A) * P(A) ] / [ P(C|A) P(A)+ P(C|B) P(B) ]
[ 0.01% * (3/8) ] /(3/8 * 0.01% + 5/8 * 0.015%) ≈28.6%
含有%的概率题,可以实例化是最好的方式。故而,A区3000人,B区5000人,A区30个罪犯,B区75个罪犯。那么显然30/(30+75)=0.2857,就是C。
4、一个包里有5个黑球,10个红球和17个白球。每次可以从中取两个球出来,放置在外面。那么至少取________次以后,一定出现过取出一对颜色一样的球。( A )
A、16
B、9
C、4
D、1
题目要求是一定出现,考虑最坏情况,因此前面取球都是取出不一样的两个球
(黑,白)5次
(红,白)10次
(白,白)最后剩余两个白球
5、执行以下代码,a的值为(A)
#define SUM(x,y) x+y int a=3; int b=2; a+=a*SUM(a,b)*b; a的值为
A、16
B、30
C、33
D、39
define是字符串替换,不是函数;将x+y转换成字符串的形式来进行连接前后两个式子。所以就是一个连接的作用
a+=a * a + b * b ; (3 += 3 * 3+2 * 2) ==> 16
6、下面关于ID3算法中说法错误的是 ( D )
A、ID3算法要求特征必须离散化
B、信息增益可以用熵,而不是GINI系数来计算
C、选取信息增益最大的特征,作为树的根节点
D、ID3算法是一个二叉树模型
1、 特征选择准则:信息增益
2、 特征必须离散化,不能处理连续值
3、不能处理缺失值
4、偏向于选择取值多的属性
5、是一个多叉树模型,只用于分类
7、每台物理计算机可以虚拟出 20 台虚拟机,假设一台虚拟机发生故障当且仅当它所宿主的物理机发生故障。通过 5 台物理机虚拟出100 台虚拟机,那么关于这 100 台虚拟机的故障的说法正确的是:( C )
A、单台虚拟机的故障率高于单台物理机的故障率
B、这 100 台虚拟机发生故障是彼此独立的
C、这100台虚拟机单位时间内出现故障的个数高于100台物理机单位时间内出现故障的个数
D、无法判断这 100 台虚拟机和 100 台物理机哪个更可靠
E、如果随机选出 5 台虚拟机组成集群, 那么这个集群的可靠性和 5 台物理机的可靠性相同
F、可能有一段时间只有 1 台虚拟机发生故障
由于一台虚拟机发生故障当且仅当它所宿主的物理机发生故障,所以,单台虚拟机的故障率等于单台物理机的故障率
由于一台物理机的故障会导致这台物理机虚拟出来的20台虚拟机的故障,所以,基于5台物理机搭建的100台虚拟机故障率肯定高于100台物理机
8、如果某系统12*5=61成立,则系统采用的是 ( C )进制
A、7
B、8
C、9
D、10
设为n进制,(n+2) * 5=6 * n + 1。所以得 n = 9
9、20个阿里巴巴B2B技术部的员工被安排为4排,每排5个人,我们任意选其中4人送给他们一人一本《effective c++》,那么我们选出的4人都在不同排的概率为:( C)
在20个人中任意选择4个人一共有C4 20种方案,由于要求选出的4人都不在一排就每排选择一个一共有4个C51
10、在黑盒测试方法中,设计测试用例的主要根据是 ( B )
A、程序内部逻辑
B、程序外部功能
C、程序数据结构
D、程序流程图
黑盒测试是对软件已经实现的功能是否满足需求进行测试和验证,黑盒测试完全不考虑程序内部的逻辑结构和内部特性,只根据程序的需求和功能规格说明,检查程序的功能是否符合它的功能说明。
白盒测试又称结构测试、透明盒测试、逻辑驱动测试或基于代码的测试。白盒测试是一种测试用例设计方法,盒子指的是被测试的软件,白盒指的是盒子是可视的,你清楚盒子内部的东西以及里面是如何运作的。"白盒"法全面了解程序内部逻辑结构、对所有逻辑路径进行测试。"白盒"法是穷举路径测试。在使用这一方案时,测试者必须检查程序的内部结构,从检查程序的逻辑着手,得出测试数据。贯穿程序的独立路径数是天文数字。
11、计算一个任意三角形的面积,S=√(p(p-a)(p-b)(p-c)) , p=(a+b+c)/2,以下等价类测试用例中,不属于无效等价类的是 ( A )
A、a=5,b=3,c=6
B、a=2,b=3,c=5
C、a=7,b=3,c=3
D、a=2,b=6,c=3
三角形成立规则:两边之和大于第三边(两个较短边之和大于最长的第三边),两边之差小于第三边(两个较长边之差小于最短边)。
12、若用φ(n)表示欧拉函数,请问:φ(56)的欧拉函数之积为 ( A )
A、24
B、10
C、15
D、11
欧拉函数ψ(x)指的是小于x的正整数中,与x互质的数的数目,注意1既不是合数也不是质数,故与任何数不互质,且ψ(1) =1
其中p1, p2……pn为 x 的所有质因数,x 是不为0的整数。注意:每种质因数只有一个。
56=2 * 2 * 2 * 7 , φ(56)=56 * (1-1/2) * (1-1/7) = 24
13、已知
为某二元函数的全微分,则a和b的值为==( D )==
A、-2,2
B、3,-3
C、-3,3
D、2,-2
格林公式
原式记为:Pdx + Qdy,某二元函数记为f(x,y),因为原式为全微分,所以P是f(x,y)对x的偏导,Q是f(x,y)对y的偏导。由求偏导与次序无关定理(即:f’‘xy = f’'yx),所以P对y的导数等于Q对x的导数,然后对应系数相等即可。
简单记为:P对y的导数等于Q对x的导数
14、以下表的设计,最合理的是 ( A )
A、学生{id,name,age} ,学科{id,name} 分数{学生 id,学科 id,分数}
B、学生{id,name,age} ,分数{学生 id, 学科id, 学科 name , 分数}
C、分数{学生id, 学生 name,学生age, 学科id,学科名称, 分数, }
D、学科{id,name},分数{学生id,学生姓名,学生age,学科 id,分数}
最主要从数据库的第一范式、第二范式、第三范式考虑:
**第一范式(确保每列保持原子性)**即每列不再需要拆分
第二范式(确保表中的每列都和主键相关)
第三范式(确保每列都和主键列直接相关,而不是间接相关)
15、一个栈的入栈序列为ABCDE,则栈的不可能的输出序列为 ( D )
A、DCBEA
B、ACBED
C、DCEBA
D、DEBCA
合法的出栈序列条件:对于每个已出栈数之后的且小于此数的数都必须按降序排列。
D选项应为DECBA。
16、对于以下代码,正确的是 ( D )
char* p=new char[100];
1
A、p和new出来的内存都在栈上
B、p和new出来的内存都在堆上
C、p在堆上,new出来的在栈上
D、p在栈上,new出来的在堆上
p是一个指针,所以存储在栈上,p中存储的是新建的动态内存的地址,新建的动态内存在堆上。
new 出来的对象放在堆中,局部变量放在栈中。
17、编译程序是一种 (A )
A、翻译程序
B、目标程序
C、汇编程序
D、解释程序
翻译程序:指将用某种语言编写的程序转换成另一种语言形式的程序的程序,如编译程序和汇编程序等。
目标程序:计算机能够直接运行的程序(机器码)
汇编程序:把汇编语言书写的程序翻译成与之等价的机器语言程序的翻译程序。
解释程序:直接执行源程序或源程序的内部形式(中间代码),解释程序并不产生目标程序,这是它和编译程序的主要区别。
18、已知中国人的血型分布约为A型:30%,B型:20%,O型:40%,AB型:10%,则任选一批中国人作为用户调研对象,希望他们中至少有一个是B型血的可能性不低于90%,那么最少需要选多少人? ( C )
A、7
B、9
C、11
D、13
一个人不是B型的概率是 1- 0.2 = 0.8
n个人全不是b型的概率是 0.8n, 所以n个人至少有一个是b型的概率是 1- 0.8 n > 0.9
就需要 0.8 n < 0.1 , n>=10.3,故应选11
n的最小值是11
19、1台机器对200个单词进行排序花了200秒(使用冒泡排序),那么花费800秒,大概可以对多少个单词进行排序 ( A )
A、400
B、500
C、600
D、800
冒泡时间复杂度:n2
200–>800 ; n2 -->4n2 =(2n)2
所以单词是原来的2倍,原来是200个,所以是400个,选A。
20、现有4个同时到达的作业J1,J2,J3和J4,它们的执行时间分别是1小时,3小时,5小时,7小时,系统按单道方式运行且采用短作业优先算法,则平均周转时间是 ( D ) 小时
A、4
B、5
C、6
D、7.5
谁短谁先执行
因为是同时到达即提交时间一样
平均等待时间:将所有作业的运行时间加起来除以总的作业数 (1+3+5+7)/4=4
平均周转时间:将所有作业运行的时间和等待的时间全部加起来除以作业数,这四个作业的等待时间分别是:0,1,4,9
(1+3+5+7+0+1+4+9)/4=7.5
执行次序 | 提交时间 | 执行时间 | 开始时间 | 完成时间 | 周转时间 |
J1 | 0 | 1 | 0 | 1 | 1 |
J2 | 0 | 3 | 1 | 4 | 4 |
J3 | 0 | 5 | 4 | 9 | 9 |
J4 | 0 | 7 | 9 | 16 | 1 |
平均时间为:(1+4+9+16)/4=30/4=7.5
21、卡方分布的方差为2倍的自由度为 ( C )
A、n
B、1
C、2n
D、4n
卡方分布:若 n 个相互独立的随机变量ξ ₁ 、ξ ₂ 、……、ξ n ,均服从标准正态分布(也称独立同分布于标准正态分布),则这 n 个服从标准正态分布的随机变量的平方和构成一新的随机变量,其分布规律称为卡方分布( chi-square distribution )。
分布的均值为自由度 n ,记为 E(χ2) = n
分布的方差为 2 倍的自由度 (2n) ,记为 D(χ2) = 2n
22、在一次大选中候选人A和B进行竞选。候选人A的抽样支持率为60%,95%的置信区间为(50% - 70%),请问在最终大选中候选人A落选的概率与下列哪个最为接近 ( D )
A、40%
B、60%
C、5%
D、2.5%
p(50%<x<70%)=95%
p(x<50%或x>70%)=5%
p(x<50%)=p(x>70%)=2.5%
落选即支持率小于50%,因此为p(x<50%)=2.5%