开发者社区问答正文

有研究SVM的吗想问个问题

这个图时多分类问题中的一对一分类解决。有个问题。模型训练好之后，我输入一个未知的样本，对其进行分类。会不会在一个分类器中存在都不属于的情况，比如，对于第一个我可能既不属于A也不属于B，这样我投票选择的时候是不是就不投票。还有一个问题，最后根据投票的结果得出输出，这个输出具体怎么来的。之前输入的属性矩阵每一个都对应一个标签。按道理说输出的就应该是所有标签中的一个（分类，肯定是属性中的某一类吧），但是我回归分析的时候发现最后的结果并不是标签中的值，会有误差，这个误差怎么来的呢？

用多个二分类模型来实现多分类效果

本问题来自阿里云开发者社区的【11大垂直技术领域开发者社群】。 https://developer.aliyun.com/article/706511 点击链接欢迎加入感兴趣的技术领域群。

展开

收起

珍宝珠 2019-09-11 18:30:54 504 版权

阿里云 AI 助理回答

在多分类问题中，使用一对一（One-vs-One, OvO）策略时，确实每个分类器都只负责区分两个类别。如果一个未知样本在某个分类器中既不符合类别A也不符合类别B，理论上这个分类器不会为任何一方投票，但这在实际操作中不太可能发生，因为对于训练好的模型，几乎所有的输入样本都会被预测为其中一个类别，即使其特征可能更接近决策边界。这种情况下，模型可能会根据训练时的偏置或微小特征差异做出选择。

关于最后的输出结果，通常在一对一策略中，会为每个二分类器进行预测，得到一系列的“胜利”类别。然后通过统计所有分类器的投票结果来决定最终的类别归属。具体实现上，可以是直接计数哪个类别的“胜利”次数最多，或者采用加权投票等策略。因此，最终输出应该是所有原始标签中的一个，代表了多数分类器认为的最可能类别。

至于您提到的回归分析时发现输出结果不是标签中的确切值，且存在误差，这可能是理解上的一个小误会。在多分类问题中，我们实际上是在做分类任务，而不是回归。分类任务的输出是离散的类别标签，而不是连续的数值。如果您看到的是类似于概率分数的结果，那通常是每个类别对应的预测概率，最大的那个概率所对应的类别即为模型的预测类别。这些概率分数反映了模型对各个类别预测的信心程度，并非直接与标签值相比较。

误差的来源可能有以下几点： 1. 模型能力限制：模型可能没有足够复杂去完美拟合数据，导致预测不准确。 2. 过拟合/欠拟合：模型可能过度学习训练数据的噪声（过拟合），或者未能充分学习数据的特征（欠拟合）。 3. 数据质量问题：训练数据可能存在噪声、缺失值或不一致性，影响模型学习。 4. 特征选择不当：使用的特征可能不足以区分不同的类别，或者包含了无关的特征。 5. 类别不平衡：如果某些类别的样本数量远少于其他类别，模型可能倾向于预测数量多的类别，导致少数类别的预测准确性下降。

解决这些问题的方法包括调整模型复杂度、增加数据量、数据增强、特征工程、类别平衡技术等。

有帮助

无帮助

AI 助理回答生成答案可能存在不准确，仅供参考

0 条回答

写回答

取消提交回答

问答分类：

机器学习/深度学习开发者

问答地址：

开发者社区 > 人工智能 > 问答

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

有研究SVM的吗 想问个问题

相关文章

有研究SVM的吗想问个问题