开发者学堂课程【机器学习实战:需求分析(上)】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/530/detail/7129
需求分析(上)
如何进行场景分析
(一)场景分析,对场景进行分析,针对既定目标,抽象成一个可由机器学习等解决的的技术问题。
换言之,需要提出一个可由已知数据回答的问题。
(二)分析方法
1、首先分析场景里是否有确定的结果字段,然后判断收集的数据集里是否包含结果字段,若包含则为有监督学习,没包含为无监督学习,若只有一般结果即为半监督学习。
2、有监督学习,若为联系的数值即为回归问题,若为离散型数值则为分类问题。
无监督学习中,若希望返回的是发现群组,为聚类问题;若是让发现项与项间的关系,即为关联性问题;
若是希望用更少的数据特征描述整个数据,则为数据降维问题可以考虑 PCA。半监督学习比较复杂。
3、集成学习、增强学习、深度学习相当于算法增强,可适应更复杂的场景解决更复杂问题。
(三)生存预测(以泰坦尼克生存预测做分析)
1、首先确定场景中有无结果字段,如图发现有
2、确定训练数据中有无 survived 字段,如图可见有,所以认为包含结果字段
3、因为为包含结果字段,所以认定为有监督学习
4、如同可看到取值为 0 1,所以认定为离散的两分类问题,应采取合适的算法。至于是否需要算法增强要根据实际判断
(四)更多案例