【数据挖掘】2022年深信服科技机器学习工程师笔试

简介: 总结了深信服科技机器学习工程师笔试中的几道题目及其解答,涉及数据结构、机器学习评估指标和过拟合缓解方法等内容。

企业:深信服科技 机器学习工程师

1 不定项选择题

1、 均衡二叉树,概念是n-1层的数是满二叉树,当有400个节点,树的高度为多少?

答案:9

n-1是完全二叉树,则高度为n-1的完全二叉树结点数为$2^8-1$,高度为n的完全二叉树结点数为$2^9-1 =525 $,则400个节点,是高度为9的均衡二叉树

2、如果一个二分类模型的召回率为99% ,误报率时为1%,正负样本比例时1:100,那么该模型的精确率大概是多少

答案:50%

因为正负样本比例为1:100,则假设正样本数量为100,负样本数量为10000
因为召回率为99%
$$召回率 = \frac{TP}{TP+FN}=99\%$$
当正样本数量为100时,则TP=99,FN =1。
又因为误报率为1%,根据公式
$$误报率 = \frac{FP}{FP+TN} = 1\%$$
假设TN=10000,则FP约等于101
所以精准率
$$精准率 = \frac{TP}{TP+FP} = \frac{99}{99+101} \approx 50\%$$

3、降低过拟合的方法(A、B、D)

A.正则化
B. 增加样本数量
C. 增加模型参数
D. 删除稀疏的特征

4、由3个a,4个b和2个c构成的所有字符串中,包含子串’abc’的共有( )个.

答案:390
解析:
明确要的结果是只包含一个“abc”的,所有组合中可能出现0、1、2个abc.将abc作为一个整体就可以去掉0个abc的情况了。
1.包含1~2个abc的组合数:全排列(2个a,3个b,1个C,1个abc),7!/(2!3!1!1!)=420
2.包含2个abc的组合数:全排列(1个a,2个b,21个abc ) ,5!/(1!2!2!)=30
故只含一个abc的组合数是420-30=390

5、一堆石子由10个,两个人A、B轮流从中取石子,规定每次至少取一个,最多取三个,取走最后石子的人获胜,在A先手的情况下必胜的是

答案:A
解析
只有一堆n个物品,两个人轮流从中取物,规定每次最少取一个,最多取m个,取走最后石子的人获胜?
举一个最简单的例子就是,当n=m+1时,此时不管先手取多少,后手都能把剩下的取完,拓展到n等于m+1的倍数时,不管先手取多少,后手都可以取(m+1减去先手取的个数)个,最后先手一定会面临n=m+1的情况,此时先手必败,否则先手必胜。
可以手推一下验证程序的正确性,如n=3,m=1,A 先拿,最后拿的也是A,程序验证也是这样的结果。

#include<stdio.h>
int main()
{
    int n=10,m=3;

    if(n%(m+1)==0)  
        printf("先手必败\n");
    else 
        printf("先手必胜\n");

}

2 填空题

1、120名儿童到游乐场去玩,他们可以其旋转木马,坐滑行铁道,成宇宙飞船,已知其中20人三种多玩过,60人至少玩过其中的两种,若每次乘坐一次的费用是5块,游乐场共收入1000,可知多少名儿童没有玩过其中一种

答案:0

解析:

只玩过两种的人:60-20=40

还剩的费用:1000-20×3×5-40×2×5=300元

只玩过一种的人:300/5=60人

什么都没玩过的:120-60-60=0人

2、从1到10000中取出奇数位置的数,再从剩下的数中去除奇数位置的数,反复去除直到所有数都去掉,最后一个被去除的数是

答案:8191

#include <iostream>
using namespace std;
#include<iostream>
#include<cmath>
using namespace std;
int main()
{
    int n=10000;

    int k = 1;

    while (pow(2, k) <= n + 1) {
        k++;
    }
    cout << pow(2, k - 1) - 1 << endl;

}

3、已知一个有限长度正整数序列a[1],a[2]…,满足两个条件,

a[i+2]>a[i],对于i>=1;

a[i-2]>a[i],对于i>3,则序列最小长度为

答案:?

4、结点数为2020的二叉树,叶节点数最少是多少

答案:1

只有单边的二叉树结构

5、稳定的排序算法有哪些?不稳定的有哪些?

稳定的排序算法有以下4种:1、冒泡排序;2、插入排序;3、归并排序;4、基数排序

不稳定的排序算法有4种:选择排序、快速排序、堆排序、希尔排序

6、不是基于比较排序算法?

基数排序是一种非比较型整数排序算法,其原理是将整数按位数切割成不同的数字,然后按每个位数分别比较。

3 编程题

1、设定一种五进制数值表示方式,它的每一数位可能是字幕o,y,e、a、s其中一个,分别嗲表数字0,1,2,3,4.例如五进制数ya对应的十进制为8,五进制数为ysoae对应的十进制为1142,现在给定一个五进制数,输出它的十进制数,或给定一个十进制数,输出它的五进制数

输入
4
ya
83
ysoae
3958

输出
8
aya
1142
yyyaya

def tansfer_10_to_5(n):
    a = [0,1,2,3,4,5,6,7,8,9,'A','B','C','D','E','F']
    b = []
    while True:
        s = n//5
        y = n%5
        b = b+[y]
        if s==0:
            break
        n = s
    b.reverse()
    dic= {0:'o',1:'y',2:'e',3:'a',4:'s'}
    d  = [dic[i] for i in b]
    return ''.join(d)
def tansfer_5_to_10(n):
    return int(str(n),5)
for i in range(N):
    ss = str(input())

    if ss.isdigit():
        print(tansfer_10_to_5(int(ss)))
    else:
        dic = {'o':'0','y':'1','e':'2','a':'3','s':'4'}
        s = ''.join([dic[i] for i in str(ss)])
        print(tansfer_5_to_10(int(s)))

2、 员工旅游,部门中每个人都有一个方便旅游的时间段,如果某个员工方柏霓的时间段内旅游,则这个员工觉得方便,反之

第一行为一个正整数T,表示测试组数,T<=100

每组测试数据的第一行是一个正整数N,表示有多少名员工,

接下来是N行,每行表示一个员工的方便时间段,用两个正整数A,B表示,A<=B <=1000000,例如A为5,B为8,表示该员工再5,6,7,8这四个时间点旅游都是方便的。

输出每组测试数据输出一行,为一个整数,表示最多可以让多少人觉得方便
输入:

3
2
2 5
8 9
3
4 10
7 12
10 10
10
2 8
9 10
4 7
2 5
5 7
3 6
1 4
6 9
7 8
4 6

输出
1
3
6

目录
相关文章
|
4月前
|
机器学习/深度学习 存储 人工智能
【数据挖掘】2022年2023届秋招知能科技公司机器学习算法工程师 笔试题
本文是关于2022-2023年知能科技公司机器学习算法工程师岗位的秋招笔试题,包括简答题和编程题,简答题涉及神经网络防止过拟合的方法、ReLU激活函数的使用原因以及条件概率计算,编程题包括路径行走时间计算和两车相向而行相遇时间问题。
79 2
【数据挖掘】2022年2023届秋招知能科技公司机器学习算法工程师 笔试题
|
4月前
|
SQL 存储 算法
【数据挖掘】恒生金融有限公司2023届秋招数据ETL工程师笔试题解析
恒生科技2022年9月24号数据ETL工程师岗位的笔试题目及答案汇总,包括了SQL选择题、SQL编程题和业务应用SQL编程题,涵盖了数据库基础知识、SQL语句编写以及数据仓库概念等多个方面。
67 2
【数据挖掘】恒生金融有限公司2023届秋招数据ETL工程师笔试题解析
|
4月前
|
机器学习/深度学习 人工智能 算法
【数据挖掘】2022年2023届秋招奇虎360机器学习算法工程师 笔试题
本文提供了奇虎360公司2022年秋招机器学习算法工程师岗位的笔试题内容,包括选择题和编程题,涉及概率统计、数据结构、机器学习、计算机组成原理等多个领域。
102 5
|
4月前
|
机器学习/深度学习 算法 数据挖掘
【数据挖掘】2022年2023届秋招宏瓴科技公司机器学习算法工程师 笔试题
关于宏瓴科技有限公司2022-2023年秋招机器学习算法工程师岗位的笔试题目及作者个人对部分题目的解答尝试,涉及贝叶斯误差和贝叶斯最优分类器的概念、贝叶斯误差的重要性和估算方法,以及如何有效利用训练集和测试集进行深度学习模型训练的数据集划分策略。
62 4
|
4月前
|
数据可视化 数据挖掘 数据库连接
【数据挖掘】2022年2023届秋招爱玩特智能量化研究员岗 笔试题
本文提供了2022年爱玩特智能量化研究员岗位的笔试题目及Python代码实现,涉及数据库连接、数据可视化、投资回报率计算、累计回报率、描述性统计分析以及简单线性回归等任务。
44 2
|
4月前
|
算法 数据挖掘 索引
【数据挖掘】2022年2023届秋招Kanaries雾角科技算法岗 笔试题
本文介绍了2022年Kanaries雾角科技算法岗位的笔试题目,涵盖了LeetCode和牛客网的题目,包括字符串处理、几何问题、矩阵操作、数组搜索、二叉树遍历、幂运算及概率计算等多种算法题目,并提供了部分题目的Python代码实现。
62 1
|
4月前
|
机器学习/深度学习 自然语言处理 算法
【数据挖掘】百度机器学习-数据挖掘-自然语言处理工程师 2023届校招笔试详解
百度2023届校招机器学习/数据挖掘/自然语言处理工程师笔试的题目详解
90 1
|
25天前
|
机器学习/深度学习 算法 数据挖掘
K-means聚类算法是机器学习中常用的一种聚类方法,通过将数据集划分为K个簇来简化数据结构
K-means聚类算法是机器学习中常用的一种聚类方法,通过将数据集划分为K个簇来简化数据结构。本文介绍了K-means算法的基本原理,包括初始化、数据点分配与簇中心更新等步骤,以及如何在Python中实现该算法,最后讨论了其优缺点及应用场景。
77 4
|
4天前
|
算法
PAI下面的gbdt、xgboost、ps-smart 算法如何优化?
设置gbdt 、xgboost等算法的样本和特征的采样率
19 2
|
22天前
|
机器学习/深度学习 算法 数据挖掘
C语言在机器学习中的应用及其重要性。C语言以其高效性、灵活性和可移植性,适合开发高性能的机器学习算法,尤其在底层算法实现、嵌入式系统和高性能计算中表现突出
本文探讨了C语言在机器学习中的应用及其重要性。C语言以其高效性、灵活性和可移植性,适合开发高性能的机器学习算法,尤其在底层算法实现、嵌入式系统和高性能计算中表现突出。文章还介绍了C语言在知名机器学习库中的作用,以及与Python等语言结合使用的案例,展望了其未来发展的挑战与机遇。
39 1

热门文章

最新文章

下一篇
DataWorks