单选题
1、将原始数据进行集成、变换、维度规约、数值规约是在( C )过程中的任务。
A.频繁模式挖掘
B. 分类和预测
C.数据预处理
D.数据流挖掘
2、以下哪个选项可以创建一个 3x3的单位矩阵? ( C )
A. np.range(3,3)
B. np.zeros(3)
C.np.eye(3)
D.np.eye(3,2)
3、对于一个图像识别问题(在一张照片里找出一只猫),下列可以更好地解决这个问题的神经网络是( D )。
A.循环神经网络
B.感知机
C. 多层感知机
D.卷积神经网络
4、以以关于ndarray(数组)的属性说明错误的是( C )。
A.ndim表示数组的维数
B. shape表示数组的尺寸
C.size表示数组的尺寸
D.dtype表示数组中元素的类型
5、下列能把列表中全部“3 "删除的代码是( C )。
Ist= [2,3,3,4,6,1,3,5,3,2,4]
A. Ist.remove(3)
B. for i in Ist:
ifi== 3:
lst.remove(i)
C. Ist= [iforiinlstifi!= 3]
D. list(set(st))
6、下列Python语句的运行结果是( B )。
for iin range(2,5):
print(i,end=",")
A.1,2,3,
B. 2,3,4,
C.1,2,3,4,
D. 1,2,3,4,5,
7、下列不属于朴素贝叶斯算法优点的是( C )。
A.算法比较简单
B.对小规模的数据表现很好,能够处理多分类任务,适合增量式训练
C.对输入数据的表达形 式很敏感
D.朴素贝叶斯模型发源于古典数学理论,有稳定的分类效率
8、以下代码输出结果为( C )。
def f():
pass
print(type(f())
A. <class 'function'>
B. <class 'tuple'>
C. <class 'NoneType'>
D. <class 'str'>
9、下列说法中,对Python中的for语句描述错误的是( B )。
A. Python中for语句只有一 种写法: for..in..
B. for语句可以用break终 止当前循环,重新进入循环的下一次迭代
C. continue语句可以跳过循环的当前一步
D. for语句可以有else部分
10、在Python中,SyntaxError错误表示( C )。
A.可疑的语法警告
传入无效的参数
C.语法错误
D.缩进错误
11、以下哪个选项可以创建一个范围在(0,1)之间, 长度为12的等差数列? ( A )
A. np.linspace(0,1,12)
B. np.random(0,1,12)
C. np.linspace(0,12,1)
D. np.randint(0,12,1)
12、(1,2,3,5,7,11,13)的数据类型是( B )。
A.list
B.tuple
C. set
D.dict
13、下列需导入相应库才能使用的代码是( D )。
A. print('hello world')
B. abs(-1)
C. print(1)
D.print(math.pi)
14、Python中,如何输出列表中的第二个元素? ( C )
A.print(example[2])
B.echo(example[2])
C.print(example[1])
D.print(example(1))
15、下列不属于回归模型评价指标的是( B )。
A.平均绝对误差
B.精确度
C.均方误差
D.中值绝对误差
多选题
16、下列属于数据预处理步骤的是( ABCD )。
A.数据清洗
B.数据集成
C.数据规约
D.数据变换
17、NumPy提供两种基本对象是( BC )。
A.array
B.ndarray
C.ufunc
D.matrix
18、数据探索是指针对目标可变、持续、多角度的搜索或分析任务,下列属于数据探索搜索过程特点的是( ABD )。
A.有选择
B. 有策略
C. 有目标
D. 反复进行的
19、数据挖掘的预测建模任务包括( AB )。
A.分类
B. 回归
C. 聚类
D.关联规则挖掘
20、字典a = {k1':'v1','k2':'v2';k3':'v3'}, 以下哪个语句执行后,a的值为{k1': 'Vv1', 'k2':'v2'} ( ABD )。
A. a.popitem()
B. del a['k3']
C. a.clear('k3')
D. a.pop("k3')
21、下列关于列表操作方法说法正确的是( ABCD )。
A. list.pop(): 移除列表中的一个元素(默认最后一个元素) , 并且返回该元素的值
B. list.remove(): 移除列表中某个值的第一个匹配项
C. list.reverse(): 反向列表中的元素
D. list.sort(): 对原列表进行排序
22、循环神经网络RNN是( B )和( D )两种人工神经网络的总称。
A.长度递归神经网络
B.时间递归神经网络
C.偏差递归神经网络
D.结构递归神经网络
23、一个好的学习训练模型应该是( ABCD )。
A.模型应该简单(防止过拟合) .
B.在训练时最小化错误率(提高在训练集上的准确率)
C.可以利用已知的数据特性,例如稀疏、低秩等
D.将模型函数正则化
24、下列关于Python标准库对象导入方式正确的是( BD )。
A.import math.sin
B.from math import sin
C.import math.*
D.from math import *
25、下列说法正确的是( BCD )。
A.对回归问题和分类问题最常 用的评价指标是准确率和召回率
B.分类规则的挖掘方法有决策树法、 贝叶斯法、人工神经网络法、粗糙集法和遗传算法等
C.传统的机器学习 算法有线性回归模型、Logistics回归模型、 KNN算法、 决策树、随机森林、支持向量机、人工神经网络、EM算法、概率图模型等
D.分类模型的误差可分 为训练误差和泛化误差
26、下列( ACD )是有序的。
A.列表
B.集合
C.元组
D.字符串
27、下列属于Web内容挖掘实现技术的是( ABCD )。
A.文本总结
B.文本分类
C.文本聚类
D.关联规则
28、线性模型的基本形式有( ABCD )。
A.线性回归
B.对数几率回归 (二分类问题)
C.线性判别分析( Fisher判别分析)
D.多分类学习
29、Python中,算术运算符包括( ABCD )。
A.//
B.**
C.%
D./
30、Python语言中用来管理程序执行期间发生的错误的对象是异常对象,可用( BD )代码块处理。
A. try-except-if
B. try-except
C. try-except-if-else
D. try-except-else
31、循环神经网络常用的激活函数有( AC )。
A.Sigmoid函数
B.ReLU函数
C.Tanh函数
D.ELU函数
32、下面描述属于广播机制的是( ABCD )。
A.让所有输入数组都向其 中shape最长的数组看齐,shape中不足的部分都通过在前面加1补齐
B. 输出数组的shape是输入数组shape的各个轴上的最大值
C. 如果输入数组的某个轴和输出数组的对应轴的长度相同或者其长度为1时,这个数组能够用来计算,否则出错
D.当输入数组的某 个轴的长度为1时,沿着此轴运算时都用此轴上的第一组值
33、下列表达式的值为True的是( CD )。
A.5+5j > 2-3j
B.3>2>2
C. (3,2)> (2,4)
D.'abc' > 'ab0'
34、人工神经网络比感知器模型更复杂,这些额外的复杂性来源于( BD )。
A.输入层和输出层之间仅包含一个中间层
B. 输入层和输出层之间可能包含多个中间层
C.激活函数允许隐 藏结点和输出结点的输出值与输入参数呈现线性关系
D.激活函数允许隐藏结点和输出结点的输出值 与输入参数呈现非线性关系
35、关于Python函数中的变量,以下说法正确的是( ABC )。
A.任何在函数中赋值的变量 默认都是被分配到局部命名空间(local namespace)中
B.函数可以访问两种不同作用域中的变量: 全局(global) 和局部(local)
C.局部命名 空间是在运行阶段函数被调用时动态创建出来的,函数调用结束动态的销毁的
D. 在函数执行完毕之后,局部命名空间无一例外都会被销毁
36、Python可抓取的数据包括( ABC )。
A.网页
B.图片
C.视频
D. 以上都不可以
37、下列关于Python说法正确的是( BCD )。
A. Python的语法类似PHP
B. Python可用于Web开发
C. Python是跨平台的
D. Python可用于数据抓取 (爬虫)
38、函数的写法包括的内容有( ABCD )。
A.函数名称
B.参数
C.执行语句
D.返回值
39、( AD )类型的数据集不适合用深度学习。
A.数据集太小
B.数据集有局部相关性
C.数据集太大
D.数据集没有局部相关性
40、在Python中,复合赋值运算符包括( ABCD )。
A.除法赋值运算符
B.乘法赋值运算符
C.取模赋值运算符
D.取整除赋值运算符
41、聚类分析是指将物理或抽象对象的集合分组成为由类似的对象组成的多个类的分析过程。
●正确
错误
42、Python变量大小写不敏感。
正确
●错误
43、极差、四分位数、百分位数、四分位数极差和分位数概括可以用盒图显示,但是它对于识别离群点是没用的。
正确
●错误
44、调用range()函数返回的是生成器。
正确
●错误
45、在聚类分析中,簇内的相似性越大,簇间的差别越大,聚类的效果就越差。
正确
●错误
46、Python中使用elif,而不是else if。
●正确
错误
47、欠拟合是指对训练样本的一般性质尚未学好。
●正确
错误
48卷积神经网络是一种专门用来处理具 有类似网格结构的数据的神经网络。
●正确
错误
49、集合具有互异性,定义集合时不允许出现相同的元素。
●正确
错误
50、神经网络中最基本的成分是神经元模型。
●正确
错误