机器学习、基础算法、python常见面试题必知必答系列大全:(面试问题持续更新)

简介: 机器学习、基础算法、python常见面试题必知必答系列大全:(面试问题持续更新)

1. 基础算法 常见面试篇


1.1 过拟合和欠拟合 常见面试篇

  • 一、过拟合和欠拟合 是什么?
  • 二、过拟合 / 高方差(overfiting / high variance)篇
    • 2.1 过拟合是什么及检验方法?
    • 2.2 导致过拟合的原因是什么?
    • 2.3 过拟合的解决方法是什么?
  • 三、欠拟合 / 高偏差(underfiting / high bias)篇
    • 3.1 欠拟合是什么及检验方法?
    • 3.2 导致欠拟合的原因是什么?
    • 3.3 过拟合的解决方法是什么?

1.2 BatchNorm vs LayerNorm 常见面试篇

  • 一、动机篇
    • 1.1 独立同分布(independent and identically distributed)与白化
    • 1.2 ( Internal Covariate Shift,ICS)
    • 1.3 ICS 问题带来的后果是什么?
  • 二、Normalization 篇
    • 2.1 Normalization 的通用框架与基本思想
  • 三、Batch Normalization 篇
    • 3.1 Batch Normalization(纵向规范化)是什么?
    • 3.2 Batch Normalization(纵向规范化)存在什么问题?
    • 3.3 Batch Normalization(纵向规范化)适用的场景是什么?
    • 3.4 BatchNorm 存在什么问题?
  • 四、Layer Normalization(横向规范化) 篇
    • 4.1 Layer Normalization(横向规范化)是什么?
    • 4.2 Layer Normalization(横向规范化)有什么用?
  • 五、BN vs LN 篇
  • 六、主流 Normalization 方法为什么有效?

1.3 激活函数 常见面试篇

  • 一、动机篇
    • 1.1 为什么要有激活函数?
  • 二、激活函数介绍篇
    • 2.1 sigmoid 函数篇
      • 2.1.1 什么是 sigmoid 函数?
      • 2.1.2 为什么选 sigmoid 函数 作为激活函数?
      • 2.1.3 sigmoid 函数 有什么缺点?
    • 2.2 tanh 函数篇
      • 2.2.1 什么是 tanh 函数?
      • 2.2.2 为什么选 tanh 函数 作为激活函数?
      • 2.2.3 tanh 函数 有什么缺点?
    • 2.3 relu 函数篇
      • 2.3.1 什么是 relu 函数?
      • 2.3.2 为什么选 relu 函数 作为激活函数?
      • 2.3.3 relu 函数 有什么缺点?
  • 三、激活函数选择篇

1.4 正则化常见面试篇

  • 一、L0,L1,L2 正则化 篇
    • 1.1 正则化 是什么?
    • 1.2 什么是 L0 正则化 ?
    • 1.3 什么是 L1 (稀疏规则算子 Lasso regularization)正则化 ?
    • 1.4 什么是 L2 正则化(岭回归 Ridge Regression 或者 权重衰减 Weight Decay)正则化 ?
  • 二、对比篇
    • 2.1 什么是结构风险最小化?
    • 2.2 从结构风险最小化的角度理解 L1 和 L2 正则化
    • 2.3 L1 vs L2
  • 三、dropout 篇
    • 3.1 什么是 dropout?
    • 3.2 dropout 在训练和测试过程中如何操作?
    • 3.3 dropout 如何防止过拟合?

1.5 优化算法及函数 常见面试篇

  • 一、动机篇
    • 1.1 为什么需要 优化函数?
    • 1.2 优化函数的基本框架是什么?
  • 二、优化函数介绍篇
    • 2.1 梯度下降法是什么?
    • 2.2 随机梯度下降法是什么?
    • 2.3 Momentum 是什么?
    • 2.4 SGD with Nesterov Acceleration 是什么?
    • 2.5 Adagrad 是什么?
    • 2.6 RMSProp/AdaDelta 是什么?
    • 2.7 Adam 是什么?
    • 2.8 Nadam 是什么?
  • 三、优化函数学霸笔记篇

1.6 归一化 常见面试篇

  • 一、动机篇
    • 1.1 为什么要归一化?
  • 二、介绍篇
    • 2.1 归一化 有 哪些方法?
    • 2.2 归一化 各方法 特点?
    • 2.3 归一化 的 意义?
  • 三、应用篇
    • 3.1 哪些机器学习算法 需要做 归一化?
    • 3.2 哪些机器学习算法 不需要做 归一化?

1.8 [判别式(discriminative)模型 vs. 生成式 (generative) 模型 常见面试篇]

  • 一、判别式模型篇
    • 1.1 什么是判别式模型?
    • 1.2 判别式模型是思路是什么?
    • 1.3 判别式模型的优点是什么?
  • 二、生成式模型篇
    • 2.1 什么是生成式模型?
    • 2.2 生成式模型是思路是什么?
    • 2.3 生成式模型的优点是什么?
    • 2.4 生成式模型的缺点是什么?

2. 机器学习算法篇 常见面试篇

2.1 逻辑回归 常见面试篇

  • 一、介绍篇
    • 1.1 什么是逻辑回归
    • 1.2 逻辑回归的优势
  • 二、推导篇
    • 2.1 逻辑回归推导
    • 2.2 求解优化

2.2 支持向量机 常见面试篇

  • 一、原理篇
    • 1.1 什么是 SVM?
      • Q.A
    • 1.2 SVM 怎么发展的?
    • 1.3 SVM 存在什么问题?
      • Q.A
  • 二、算法篇
    • 2.1 什么是块算法?
    • 2.2 什么是分解算法?
    • 2.3 什么是序列最小优化算法?
    • 2.4 什么是增量算法?
      • Q.A
  • 三、其他 SVM 篇
    • 3.1 什么是最小二次支持向量机?
    • 3.2 什么是模糊支持向量机?
    • 3.3 什么是粒度支持向量机?
    • 3.4 什么是多类训练算法?
    • 3.5 什么是孪生支持向量机?
    • 3.6 什么是排序支持向量机?
      • Q.A
  • 四、应用篇
    • 4.1 模式识别
    • 4.2 网页分类
    • 4.3 系统建模与系统辨识
    • 4.4 其他
  • 五、对比篇
  • 六、拓展篇

2.3 集成学习 常见面试篇

  • 一、动机
  • 二、集成学习介绍篇
    • 2.1 介绍篇
      • 2.1.1 集成学习的基本思想是什么?
      • 2.1.2 集成学习为什么有效?
  • 三、 Boosting 篇
    • 3.1 用一句话概括 Boosting?
    • 3.2 Boosting 的特点是什么?
    • 3.3 Boosting 的基本思想是什么?
    • 3.4 Boosting 的特点是什么?
    • 3.5 GBDT 是什么?
    • 3.6 Xgboost 是什么?
  • 四、Bagging 篇
    • 4.1 用一句话概括 Bagging?
    • 4.2 Bagging 的特点是什么?
    • 4.3 Bagging 的基本思想是什么?
    • 4.4 Bagging 的基分类器如何选择?
    • 4.5 Bagging 的优点 是什么?
    • 4.6 Bagging 的特点是什么?
    • 4.7 随机森林 是什么?
  • 五、 Stacking 篇
    • 5.1 用一句话概括 Stacking ?
    • 5.2 Stacking 的特点是什么?
    • 5.3 Stacking 的基本思路是什么?
  • 六、常见问题篇
    • 6.1 为什么使用决策树作为基学习器?
    • 6.2 为什么不稳定的学习器更适合作为基学习器?
    • 6.3 哪些模型适合作为基学习器?
    • 6.4 Bagging 方法中能使用线性分类器作为基学习器吗? Boosting 呢?
    • 6.5 Boosting/Bagging 与 偏差 / 方差 的关系?
  • 七、对比篇
    • 7.1 LR vs GBDT?

3. 关于 Python

  • 【关于 Python 】
    • 一、什么是 args 和 *kwargs?
      • 1.1 为什么会有 args 和 *kwargs?
      • 1.2 args 和 *kwargs 的用途是什么?
      • 1.3 *args 是什么?
      • 1.4 **kwargs 是什么?
      • 1.5 args 与 *kwargs 的区别是什么?
    • 二、什么是装饰器?
      • 2.1 装饰器是什么?
      • 2.2 装饰器怎么用?
    • 三、Python 垃圾回收(GC)
      • 3.1 垃圾回收算法有哪些?
      • 3.2 引用计数(主要)是什么?
      • 3.3 标记 - 清除是什么?
      • 3.4 分代回收是什么?
    • 四、python 的 sorted 函数对字典按 key 排序和按 value 排序
      • 4.1 python 的 sorted 函数是什么?
      • 4.2 python 的 sorted 函数举例说明?
    • 五、直接赋值、浅拷贝和深度拷贝
      • 5.1 概念介绍
      • 5.2 介绍
      • 5.3 变量定义流程
      • 5.3 赋值
      • 5.4 浅拷贝
      • 5.5 深度拷贝
      • 5.6 核心:不可变对象类型 and 可变对象类型
        • 5.6.1 不可变对象类型
        • 5.6.2 可变对象类型
    • 六、进程、线程、协程
      • 6.1 进程
        • 6.1.1 什么是进程?
        • 6.1.2 进程间如何通信?
      • 6.2 线程
        • 6.2.1 什么是线程?
        • 6.2.2 线程间如何通信?
      • 6.3 进程 vs 线程
        • 6.3.1 区别
        • 6.3.2 应用场景
      • 6.4 协程
        • 6.4.1 什么是协程?
        • 6.4.2 协程的优点?
    • 七、全局解释器锁
      • 7.1 什么是全局解释器锁?
      • 7.2 GIL 有什么作用?
      • 7.3 GIL 有什么影响?
      • 7.4 如何避免 GIL 带来的影响?

4. 关于 Tensorflow

  • 【关于 Tensorflow 损失函数】
    • 一、动机
    • 二、什么是损失函数?
    • 三、目标函数、损失函数、代价函数之间的关系与区别?
    • 四、损失函数的类别
      • 4.1 回归模型的损失函数
        • (1)L1 正则损失函数(即绝对值损失函数)
        • (2)L2 正则损失函数(即欧拉损失函数)
        • (3)均方误差(MSE, mean squared error)
        • (4)Pseudo-Huber 损失函数
      • 4.2 分类模型的损失函数
        • (1)Hinge 损失函数
        • (2)两类交叉熵(Cross-entropy)损失函数
        • (3)Sigmoid 交叉熵损失函数
        • (4)加权交叉熵损失函数
        • (5)Softmax 交叉熵损失函数
        • (6) SparseCategoricalCrossentropy vs sparse_categorical_crossentropy
目录
打赏
0
0
1
0
2088
分享
相关文章
解锁文件共享软件背后基于 Python 的二叉搜索树算法密码
文件共享软件在数字化时代扮演着连接全球用户、促进知识与数据交流的重要角色。二叉搜索树作为一种高效的数据结构,通过有序存储和快速检索文件,极大提升了文件共享平台的性能。它依据文件名或时间戳等关键属性排序,支持高效插入、删除和查找操作,显著优化用户体验。本文还展示了用Python实现的简单二叉搜索树代码,帮助理解其工作原理,并展望了该算法在分布式计算和机器学习领域的未来应用前景。
深度洞察内网监控电脑:基于Python的流量分析算法
在当今数字化环境中,内网监控电脑作为“守城卫士”,通过流量分析算法确保内网安全、稳定运行。基于Python的流量分析算法,利用`scapy`等工具捕获和解析数据包,提取关键信息,区分正常与异常流量。结合机器学习和可视化技术,进一步提升内网监控的精准性和效率,助力企业防范潜在威胁,保障业务顺畅。本文深入探讨了Python在内网监控中的应用,展示了其实战代码及未来发展方向。
从集思录可转债数据探秘:Python与C++实现的移动平均算法应用
本文探讨了如何利用移动平均算法分析集思录提供的可转债数据,帮助投资者把握价格趋势。通过Python和C++两种编程语言实现简单移动平均(SMA),展示了数据处理的具体方法。Python代码借助`pandas`库轻松计算5日SMA,而C++代码则通过高效的数据处理展示了SMA的计算过程。集思录平台提供了详尽且及时的可转债数据,助力投资者结合算法与社区讨论,做出更明智的投资决策。掌握这些工具和技术,有助于在复杂多变的金融市场中挖掘更多价值。
37 12
基于机器学习的人脸识别算法matlab仿真,对比GRNN,PNN,DNN以及BP四种网络
本项目展示了人脸识别算法的运行效果(无水印),基于MATLAB2022A开发。核心程序包含详细中文注释及操作视频。理论部分介绍了广义回归神经网络(GRNN)、概率神经网络(PNN)、深度神经网络(DNN)和反向传播(BP)神经网络在人脸识别中的应用,涵盖各算法的结构特点与性能比较。
基于 Python 的布隆过滤器算法在内网行为管理中的应用探究
在复杂多变的网络环境中,内网行为管理至关重要。本文介绍布隆过滤器(Bloom Filter),一种高效的空间节省型概率数据结构,用于判断元素是否存在于集合中。通过多个哈希函数映射到位数组,实现快速访问控制。Python代码示例展示了如何构建和使用布隆过滤器,有效提升企业内网安全性和资源管理效率。
37 9
|
14天前
|
内网桌面监控软件深度解析:基于 Python 实现的 K-Means 算法研究
内网桌面监控软件通过实时监测员工操作,保障企业信息安全并提升效率。本文深入探讨K-Means聚类算法在该软件中的应用,解析其原理与实现。K-Means通过迭代更新簇中心,将数据划分为K个簇类,适用于行为分析、异常检测、资源优化及安全威胁识别等场景。文中提供了Python代码示例,展示如何实现K-Means算法,并模拟内网监控数据进行聚类分析。
33 10
控制局域网上网软件之 Python 字典树算法解析
控制局域网上网软件在现代网络管理中至关重要,用于控制设备的上网行为和访问权限。本文聚焦于字典树(Trie Tree)算法的应用,详细阐述其原理、优势及实现。通过字典树,软件能高效进行关键词匹配和过滤,提升系统性能。文中还提供了Python代码示例,展示了字典树在网址过滤和关键词屏蔽中的具体应用,为局域网的安全和管理提供有力支持。
55 17
解锁文档管理系统高效检索奥秘:Python 哈希表算法探究
在数字化时代,文档管理系统犹如知识宝库,支撑各行各业高效运转。哈希表作为核心数据结构,通过哈希函数将数据映射为固定长度的哈希值,实现快速查找与定位。本文聚焦哈希表在文档管理中的应用,以Python代码示例展示其高效检索特性,并探讨哈希冲突解决策略,助力构建智能化文档管理系统。
探究办公室电脑怎么共享文件的 Python 算法
在数字化办公环境中,高效文件共享是提升工作效率的关键。本文聚焦于使用Python实现办公室电脑文件共享的算法,涵盖需求分析、基础实现及优化拓展。通过socket编程和文件流操作,实现文件传输,并探讨多线程、权限管理和文件索引等优化措施,确保文件共享的安全性和便捷性,助力现代办公协同。
解锁机器学习的新维度:元学习的算法与应用探秘
元学习作为一个重要的研究领域,正逐渐在多个应用领域展现其潜力。通过理解和应用元学习的基本算法,研究者可以更好地解决在样本不足或任务快速变化的情况下的学习问题。随着研究的深入,元学习有望在人工智能的未来发展中发挥更大的作用。

热门文章

最新文章