Swing是一种用于二分类问题的评价指标,其定义如下:
SWING = TP - FP + TN - FN
其中,TP表示真正例(True Positive),FP表示假正例(False Positive),TN表示真反例(True Negative),FN表示假反例(False Negative)
它基于四个基础指标(TP、FP、TN、FN),既考虑了分类器的准确性又考虑了分类器的偏差性(bias)。Swing值可以取正负值,当Swing值为正时,分类器思考的方式更倾向于预测样本为正例,而当Swing值为负时,则更倾向于预测样本为反例。
一般来说,对于具有较好性能的模型,Swing值应该为正。其显著优点是不受数据分布倾斜的影响,因此适用于不平衡数据集的评估。
我能够为你提供有关Swing机器学习算法的基本信息。Swing 是基于分类器的机器学习算法,其本质是一种决策树的改进版本。
在 Swing 算法中,每个节点都会遍历训练集中的数据,并选择最优的特征来评估所需的分裂方式。 在评估分裂方式时,Swing 算法综合考虑分类准确率和分裂程度的平衡,使得分裂后的数据更加具有代表性和区分性。最终,Swing 算法构建出一棵分裂之后分类器的决策树,用于对新的数据进行二分类预测。
与传统的分类树相比,Swing 算法的计算公式是一个优化问题,具体来说是在每个节点上根据特定的目标函数测量每个特征(或特征组合)的重要性,该目标函数可以根据用户需求进行定制。
由于 Swing 算法是一种比较新的算法,因此其具体的计算公式可能会被不断改进和优化。在具体使用 Swing 算法时,建议参考相关的文献和资料,了解其最新的计算公式,并使用专业的机器学习工具包进行实现和操作。
Swing = (TP + TN) / (TP + TN + FP + FN)
其中,TP表示真正例(True Positive)的数量,即被正确地预测为正例的数量;TN表示真反例(True Negative)的数量,即被正确地预测为反例的数量;FP表示假正例(False Positive)的数量,即被错误地预测为正例的数量;FN表示假反例(False Negative)的数量,即被错误地预测为反例的数量。
Swing算法是阿里巴巴提出的一种召回算法,swing算法考虑user - item - user这样的局部图结构关系;对于共同点击商品的用户,如果用户之间共同点击的商品越少则商品就越相似。 商品的Swing得分计算如下:
上式中,表示点击商品的所有用户;表示用户点击的所有商品;是一个平滑因子;
参考文档https://zhuanlan.zhihu.com/p/364593067,此回答整理自钉群“【EasyRec】推荐算法交流群”
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。