Interview:机器学习算法工程师求职九大必备技能之【数学基础、工程能力、特征工程、模型评估、优化算法、机器学习基本概念、经典机器学习模型、深度学习模型、业务与应用】(建议收藏,持续更新)

简介: Interview:机器学习算法工程师求职九大必备技能之【数学基础、工程能力、特征工程、模型评估、优化算法、机器学习基本概念、经典机器学习模型、深度学习模型、业务与应用】(建议收藏,持续更新)


目录

一、数学基础

1.1、概率论

1.2、线性代数

1.3、微积分

1.4、凸优化

1.5、信息论

二、工程能力

2.1、数据结构与算法

(1)、树与相关算法

(2)、图与相关算法

(3)、哈希表

(4)、矩阵运算与优化

2.2、大数据处理

(1)、MapReduce

(2)、Spark

(3)、HiveQL

(4)、Storm

2.3、机器学习平台

(1)、TensorFlow

(2)、Torch

(3)、Theano

2.4、并行计算

2.5、数据库和数据仓库

2.6、系统服务架构

三、特征工程

3.1、特征离散化与归一化

3.2、特征组合

3.3、特征选择

3.4、词嵌入表示

四、模型评估

4.1、评价指标

4.2、A/B测试

4.3、过拟合与欠拟合

4.4、超参数选择

五、优化算法

5.1、损失函数

5.2、正则化

5.3、EM算法

5.4、梯度下降/随机梯度下降

5.5、反向传播

5.6、梯度验证

5.7、Momentum

5.8、AdaGrad

5.9、Adam

六、机器学习基本概念和分类

6.1、基本概念

(1)、假设空间

(2)、训练/测试数据

(3)、标注

(4)、损失函数

6.2、按数据分类

(1)、分类

(2)、回归

(3)、序列标注

6.3、按监督分类

(1)、监督学习

(2)、非监督学习

(3)、强化学习

6.4、按模型分类

(1)、生成式模型

(2)、判别式模型

七、经典机器学习模型

7.1、监督学习

(1)、经典算法

(2)、概率图模型

7.2、非监督学习

(1)、层次聚类

(2)、k均值聚类

(3)、高斯混合模型

(4)、主题模型

7.3、集成学习

(1)、Bagging

(2)、Boosting

(3)、GBDT

(4)、随机森林

7.4、降维算法

7.5、采样

7.6、强化学习

八、深度学习模型

8.1、前向神经网络

(1)、多层感知机

(2)、卷积神经网络

(3)、深度残差网络

(4)、自组织映射神经网络

(5)、受限玻尔兹曼机

8.2、循环神经网络

(1)、循环神经网络

(2)、长短期记忆模型

(3)、注意力机制

(4)、Seq2Seq

8.3、深度学习优化技巧

(1)、批量归一化

(2)、Dropout

(3)、激活函数

8.4、强化学习

8.5、生成式对抗网络

九、业务与应用

9.1、计算机视觉

9.2、自然语言处理

9.3、推荐系统

9.4、计算广告

9.5、智能游戏


相关文章

AI:几张图理清人工智能与机器学习、知识发现、数据挖掘、统计学、模式识别、神经计算学、数据库之间的暧昧关系

一、数学基础

相关文章

ML与math:机器学习与高等数学基础概念、代码实现、案例应用之详细攻略——基础篇

ML与math:机器学习与高等数学基础概念、代码实现、案例应用之详细攻略——进阶篇

DL之simpleNet:利用自定义的simpleNet(设好权重)对新样本进行预测、评估、输出梯度值

1.1、概率论

  • 常用概率分布
  • 大数定理和中心极限定理
  • 假设检验
  • 贝叶斯理论

1.2、线性代数

1.3、微积分

1.4、凸优化

1.5、信息论

二、工程能力

2.1、数据结构与算法

相关文章

Algorithm:【Algorithm算法进阶之路】之数据结构二十多种算法演示

Algorithm:【Algorithm算法进阶之路】之十大经典排序算法

Algorithm:【Algorithm算法进阶之路】之数据结构基础知识

Algorithm:【Algorithm算法进阶之路】之数据结构相关习题(数组、字符串、链表、栈、队列、树、图、哈希)

Algorithm:【Algorithm算法进阶之路】之算法中的数学编程(时间速度、进制转换、排列组合、条件概率、斐波那契数列)相关习题

Algorithm:【Algorithm算法进阶之路】之算法(查找、排序、递归、复杂度、高级算法)相关习题

Algorithm:【Algorithm算法进阶之路】之机器学习相关习题

Algorithm:【Algorithm算法进阶之路】之Python语言相关习题

(1)、树与相关算法

(2)、图与相关算法

(3)、哈希

(4)、矩阵运算与优化

2.2、大数据处理

相关文章

BigData:大数据开发的简介、核心知识(linux基础+Java/Python编程语言+Hadoop{HDFS、HBase、Hive}+Docker)、经典场景应用之详细攻略

Job:人工智能&大数据的相关职位——【数据分析师】的简介、技能、待遇、进阶的详细攻略

(1)、MapReduce

(2)、Spark

(3)、HiveQL

(4)、Storm

2.3、机器学习平台

相关文章

DL框架:主流深度学习框架(TensorFlow/Pytorch/Caffe/Keras/CNTK/MXNet/Theano/PaddlePaddle)简介、多个方向比较、案例应用之详细攻略

DL框架之MXNet :深度学习框架之MXNet 的简介、安装、使用方法、应用案例之详细攻略

DL框架之Caffe:深度学习框架之Caffe的简介、安装、使用方法详细攻略

DL之paddlepaddle:百度深度学习框架paddlepaddle飞桨的简介、安装、使用方法之详细攻略

DL:深度学习框架Pytorch、 Tensorflow各种角度对比

DL框架之Tensorflow:深度学习框架Tensorflow的简介、安装、使用方法之详细攻略

DL框架之TensorFlow:深度学习框架TensorFlow Core(低级别TensorFlow API)的简介、安装、使用方法之详细攻略

DL框架之PyTorch:深度学习框架PyTorch的简介、安装、使用方法之详细攻略

DL框架之darknet:深度学习框架darknet的简介、安装、使用方法的详细攻略

DL框架之AutoKeras框架:深度学习框架AutoKeras框架的简介、特点、安装、使用方法详细攻略

DL框架之Keras:深度学习框架Keras框架的简介、安装(Python库)、相关概念、Keras模型使用、使用方法之详细攻略

(1)、TensorFlow

(2)、Torch

(3)、Theano

2.4、并行计算

2.5、数据库和数据仓库

Database之SQLSever:SQLSever数据库管理学习并深入理解SQL命令语句进阶综合篇《初级→中级→高级》(持续更新,建议收藏)

2.6、系统服务架构

三、特征工程

相关文章

ML之DataScience:基于机器学习处理数据科学(DataScience)任务(数据分析、特征工程、科学预测等)的简介、流程、案例应用执行详细攻略

ML之FE:数据处理—特征工程之稀疏特征的简介、如何处理、案例应用之详细攻略

ML之FE:数据处理—特征工程的简介、使用方法、案例应用之详细攻略

 

3.1、特征离散化与归一化

3.2、特征组合

3.3、特征选择

3.4、词嵌入表示

四、模型评估

相关文章

ML之模型评价指标(损失函数):基于不同机器学习框架(sklearn/TF)下算法的模型评估函数(Scoring/metrics)集合(仅代码实现)

4.1、评价指标

4.2、A/B测试

4.3、过拟合与欠拟合

DL之DNN优化技术:DNN中抑制过拟合/欠拟合、提高泛化能力技术的简介、使用方法、案例应用详细攻略

4.4、超参数选择

DL之模型调参:深度学习算法模型优化参数之对深度学习模型的超参数采用网格搜索进行模型调优(建议收藏)

五、优化算法

5.1、损失函数

ML之LF:机器学习中常见损失函数(LiR损失、L1损失、L2损失、Logistic损失)求梯度/求导、案例应用之详细攻略

ML之LF:机器学习中常见的损失函数(连续型/离散型)的简介、损失函数/代价函数/目标函数之间区别、案例应用之详细攻略

5.2、正则化

AI:神经网络调参(数据、层数、batch大小,学习率+激活函数+正则化+分类/回归)并进行结果可视化

5.3、EM算法

5.4、梯度下降/随机梯度下降

5.5、反向传播

5.6、梯度验证

5.7、Momentum

DL之DNN优化技术:GD、SGD、Momentum、NAG、Ada系列、RMSProp各种代码实现之详细攻略

5.8、AdaGrad

5.9、Adam

六、机器学习基本概念和分类

6.1、基本概念

(1)、假设空间

(2)、训练/测试数据

(3)、标注

(4)、损失函数

6.2、按数据分类

(1)、分类

(2)、回归

(3)、序列标注

6.3、按监督分类

相关文章

ML之SL:监督学习(Supervised Learning)的简介、应用、经典案例之详细攻略

ML之UL:无监督学习Unsupervised Learning的概念、应用、经典案例之详细攻略

ML之SSL:Semi-Supervised Learning半监督学习的简介、应用、经典案例之详细攻略

(1)、监督学习

(2)、非监督学习

(3)、强化学习

6.4、按模型分类

(1)、生成式模型

(2)、判别式模型

七、经典机器学习模型

7.1、监督学习

(1)、经典算法

支持向量机

逻辑回归

决策树

(2)、概率图模型

朴素贝叶斯

最大熵模型

隐马尔可夫模型

条件随机场

7.2、非监督学习

相关文章

ML之Clustering之普聚类算法:普聚类算法的相关论文、主要思路、关键步骤、代码实现等相关配图之详细攻略

(1)、层次聚类

(2)、k均值聚类

(3)、高斯混合模型

(4)、主题模型

7.3、集成学习

相关文章

EL:集成学习(Ensemble Learning)的概念讲解、问题应用、算法分类、关键步骤、代码实现等相关配图详细攻略

(1)、Bagging

(2)、Boosting

(3)、GBDT

(4)、随机森林

7.4、降维算法

FE之DR之线性降维:PCA/白化、LDA算法的数学知识(协方差矩阵)、相关论文、算法骤、代码实现、案例应用等相关配图之详细攻略

7.5、采样

DataScience:对严重不均衡数据集进行多种采样策略(随机过抽样、SMOTE过采样、SMOTETomek综合采样、改变样本权重等)简介、经验总结之详细攻略

7.6、强化学习

ML之RL:强化学习Reinforcement Learning的简介、应用、经典案例、学习资源之详细攻略

八、深度学习模型

8.1、前向神经网络

(1)、多层感知机

DL之Perceptron:Perceptron感知器(感知机/多层感知机/人工神经元)的简介、原理、案例应用(相关配图)之详细攻略

(2)、卷积神经网络

DL之CNN:计算机视觉之卷积神经网络算法的简介(经典架构/论文)、CNN优化技术、调参学习实践、CNN经典结构及其演化、案例应用之详细攻略

(3)、深度残差网络

DL之ResNet:ResNet算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

(4)、自组织映射神经网络

(5)、受限玻尔兹曼机

8.2、循环神经网络

(1)、循环神经网络

DL之RNN:循环神经网络RNN的简介、应用、经典案例之详细攻略

(2)、长短期记忆模型

DL之LSTM:LSTM算法论文简介(原理、关键步骤、RNN/LSTM/GRU比较、单层和多层的LSTM)、案例应用之详细攻略

(3)、注意力机制

DL之Attention:Attention注意力机制的简介、应用领域之详细攻略

(4)、Seq2Seq

8.3、深度学习优化技巧

(1)、批量归一化

DataScience:深入探讨与分析机器学习中的数据处理之线性变换—标准化standardization、归一化Normalization/比例化Scaling的区别与联系

(2)、Dropout

DL之DNN优化技术:利用Dropout(简介、使用、应用)优化方法提高DNN模型的性能

(3)、激活函数

  • Sigmoid
  • Softmax
  • Tanh
  • ReLU

ML/DL之激活函数/求导函数:ML中常用的AF激活函数(step_function、sigmoid、softmax、ReLU等)&求导函数等代码实现之详细攻略

8.4、强化学习

ML之RL:强化学习Reinforcement Learning的简介、应用、经典案例、学习资源之详细攻略

8.5、生成式对抗网络

DL之GAN:生成对抗网络GAN的简介、应用、经典案例之详细攻略

九、业务与应用

9.1、计算机视觉

CV:人工智能之计算机视觉方向的简介(CV发展史+常用数据集+CV职位)、传统方法对比CNN类算法、计算机视觉八大应用(知识导图+经典案例)之详细攻略

9.2、自然语言处理

NLP:自然语言处理技术的简介、发展历史、案例应用之详细攻略

9.3、推荐系统

ML之RS:基于用户的CF+LFM实现的推荐系统(基于相关度较高的用户实现电影推荐)

9.4、计算广告

ML之FE:数据处理—特征工程之高维组合特征的处理案例(矩阵分解)——基于LoR算法的广告点击预估问题

9.5、智能游戏

RL之PG:基于TF利用策略梯度算法玩Cartpole游戏实现智能得


相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
相关文章
|
6月前
|
机器学习/深度学习 数据采集 人工智能
【机器学习算法篇】K-近邻算法
K近邻(KNN)是一种基于“物以类聚”思想的监督学习算法,通过计算样本间距离,选取最近K个邻居投票决定类别。支持多种距离度量,如欧式、曼哈顿、余弦相似度等,适用于分类与回归任务。结合Scikit-learn可高效实现,需合理选择K值并进行数据预处理,常用于鸢尾花分类等经典案例。(238字)
|
11月前
|
机器学习/深度学习 数据采集 人工智能
20分钟掌握机器学习算法指南
在短短20分钟内,从零开始理解主流机器学习算法的工作原理,掌握算法选择策略,并建立对神经网络的直观认识。本文用通俗易懂的语言和生动的比喻,帮助你告别算法选择的困惑,轻松踏入AI的大门。
751 8
|
机器学习/深度学习 存储 Kubernetes
【重磅发布】AllData数据中台核心功能:机器学习算法平台
杭州奥零数据科技有限公司成立于2023年,专注于数据中台业务,维护开源项目AllData并提供商业版解决方案。AllData提供数据集成、存储、开发、治理及BI展示等一站式服务,支持AI大模型应用,助力企业高效利用数据价值。
|
机器学习/深度学习 人工智能 自然语言处理
AI训练师入行指南(三):机器学习算法和模型架构选择
从淘金到雕琢,将原始数据炼成智能珠宝!本文带您走进数字珠宝工坊,用算法工具打磨数据金砂。从基础的经典算法到精密的深度学习模型,结合电商、医疗、金融等场景实战,手把手教您选择合适工具,打造价值连城的智能应用。掌握AutoML改装套件与模型蒸馏术,让复杂问题迎刃而解。握紧算法刻刀,为数字世界雕刻文明!
444 6
|
机器学习/深度学习 存储 算法
基于MobileNet深度学习网络的活体人脸识别检测算法matlab仿真
本内容主要介绍一种基于MobileNet深度学习网络的活体人脸识别检测技术及MQAM调制类型识别方法。完整程序运行效果无水印,需使用Matlab2022a版本。核心代码包含详细中文注释与操作视频。理论概述中提到,传统人脸识别易受非活体攻击影响,而MobileNet通过轻量化的深度可分离卷积结构,在保证准确性的同时提升检测效率。活体人脸与非活体在纹理和光照上存在显著差异,MobileNet可有效提取人脸高级特征,为无线通信领域提供先进的调制类型识别方案。
|
机器学习/深度学习 算法 数据安全/隐私保护
基于机器学习的人脸识别算法matlab仿真,对比GRNN,PNN,DNN以及BP四种网络
本项目展示了人脸识别算法的运行效果(无水印),基于MATLAB2022A开发。核心程序包含详细中文注释及操作视频。理论部分介绍了广义回归神经网络(GRNN)、概率神经网络(PNN)、深度神经网络(DNN)和反向传播(BP)神经网络在人脸识别中的应用,涵盖各算法的结构特点与性能比较。
|
人工智能 编解码 算法
使用 PAI-DSW x Free Prompt Editing图像编辑算法,开发个人AIGC绘图小助理
使用 PAI-DSW x Free Prompt Editing图像编辑算法,开发个人AIGC绘图小助理
517 0
|
机器学习/深度学习 运维 安全
深度学习在安全事件检测中的应用:守护数字世界的利器
深度学习在安全事件检测中的应用:守护数字世界的利器
521 22
|
机器学习/深度学习 编解码 人工智能
计算机视觉五大技术——深度学习在图像处理中的应用
深度学习利用多层神经网络实现人工智能,计算机视觉是其重要应用之一。图像分类通过卷积神经网络(CNN)判断图片类别,如“猫”或“狗”。目标检测不仅识别物体,还确定其位置,R-CNN系列模型逐步优化检测速度与精度。语义分割对图像每个像素分类,FCN开创像素级分类范式,DeepLab等进一步提升细节表现。实例分割结合目标检测与语义分割,Mask R-CNN实现精准实例区分。关键点检测用于人体姿态估计、人脸特征识别等,OpenPose和HRNet等技术推动该领域发展。这些方法在效率与准确性上不断进步,广泛应用于实际场景。
1389 64
计算机视觉五大技术——深度学习在图像处理中的应用
|
机器学习/深度学习 传感器 数据采集
深度学习在故障检测中的应用:从理论到实践
深度学习在故障检测中的应用:从理论到实践
1272 6

热门文章

最新文章