开发者社区 问答 正文

有研究SVM的吗 想问个问题

这个图时多分类问题中的一对一分类解决。有个问题。模型训练好之后,我输入一个未知的样本,对其进行分类。会不会在一个分类器中存在都不属于的情况,比如,对于第一个我可能既不属于A也不属于B,这样我投票选择的时候是不是就不投票。还有一个问题,最后根据投票的结果得出输出,这个输出具体怎么来的。之前输入的属性矩阵每一个都对应一个标签。按道理说 输出的就应该是所有标签中的一个(分类,肯定是属性中的某一类吧),但是我回归分析的时候发现最后的结果并不是标签中的值,会有误差,这个误差怎么来的呢?

image.png

用多个二分类模型来实现多分类效果

本问题来自阿里云开发者社区的【11大垂直技术领域开发者社群】。 https://developer.aliyun.com/article/706511 点击链接欢迎加入感兴趣的技术领域群。

展开
收起
珍宝珠 2019-09-11 18:30:54 436 分享 版权
阿里云 AI 助理回答

在多分类问题中,使用一对一(One-vs-One, OvO)策略时,确实每个分类器都只负责区分两个类别。如果一个未知样本在某个分类器中既不符合类别A也不符合类别B,理论上这个分类器不会为任何一方投票,但这在实际操作中不太可能发生,因为对于训练好的模型,几乎所有的输入样本都会被预测为其中一个类别,即使其特征可能更接近决策边界。这种情况下,模型可能会根据训练时的偏置或微小特征差异做出选择。

关于最后的输出结果,通常在一对一策略中,会为每个二分类器进行预测,得到一系列的“胜利”类别。然后通过统计所有分类器的投票结果来决定最终的类别归属。具体实现上,可以是直接计数哪个类别的“胜利”次数最多,或者采用加权投票等策略。因此,最终输出应该是所有原始标签中的一个,代表了多数分类器认为的最可能类别。

至于您提到的回归分析时发现输出结果不是标签中的确切值,且存在误差,这可能是理解上的一个小误会。在多分类问题中,我们实际上是在做分类任务,而不是回归。分类任务的输出是离散的类别标签,而不是连续的数值。如果您看到的是类似于概率分数的结果,那通常是每个类别对应的预测概率,最大的那个概率所对应的类别即为模型的预测类别。这些概率分数反映了模型对各个类别预测的信心程度,并非直接与标签值相比较。

误差的来源可能有以下几点: 1. 模型能力限制:模型可能没有足够复杂去完美拟合数据,导致预测不准确。 2. 过拟合/欠拟合:模型可能过度学习训练数据的噪声(过拟合),或者未能充分学习数据的特征(欠拟合)。 3. 数据质量问题:训练数据可能存在噪声、缺失值或不一致性,影响模型学习。 4. 特征选择不当:使用的特征可能不足以区分不同的类别,或者包含了无关的特征。 5. 类别不平衡:如果某些类别的样本数量远少于其他类别,模型可能倾向于预测数量多的类别,导致少数类别的预测准确性下降。

解决这些问题的方法包括调整模型复杂度、增加数据量、数据增强、特征工程、类别平衡技术等。

有帮助
无帮助
AI 助理回答生成答案可能存在不准确,仅供参考
0 条回答
写回答
取消 提交回答