机器学习可以解决多种类型的任务,下面列出最典型的常见的几种:
分类:模型输出的是一个类别,类别为离散的数据类型。比如计算机视觉中的图像分类算法解决的就是一个分类任务。
回归:模型输出的是一个连续的数值。这类任务的一个示例是预测投保人的索赔金额(用于设置保险费),或者预测证券未来的价格。
聚类:对大量未知标注的数据,按数据的内在相似性,将数据划分为多个类别,同一类别内的数据相似度较大,而类别间的相似性比较小。可以被运用在图片检索,用户画像等场景中。
生成:这类任务中,输出的结果可以是向量,矩阵,序列等,输出结果中存在内在的关联。例如机器翻译和语音识别。
分类和回归是预测问题的两种主要类型,分类的输出是离散的类别值,而回归的输出是连续数值。
欠拟合:模型过于简单导致训练误差泛化误差大。
过拟合:训练得到的模型的训练误差很小,而泛化能力较弱即泛化误差较大。