计算有序因子变量间的差异-阿里云开发者社区

开发者社区> 青衫无名> 正文

计算有序因子变量间的差异

简介:
+关注继续查看

文章讲的是计算有序因子变量间的差异,在作者持续探索温布尔登数据过程中,他想要弄清楚一个运动员所表现的,是否达到了他被当做种子选手的预期值。

  因此,作者想找出运动员中,某一轮真实结果和期望值之间的差异。在数据集上,“一轮比赛”相当于一个有序因子变量。

  以下是所有可能的值:

  rounds = c("Did not enter", "Round of 128", "Round of 64", "Round of 32", "Round of 16", "Quarter-Finals", "Semi-Finals", "Finals", "Winner")

  如果想将这一对字符串分解成因子,我们需要这样做:

round = factor("Finals", levels = rounds, ordered = TRUE)
expected = factor("Winner", levels = rounds, ordered = TRUE)  
> round
[1] Finals
9 Levels: Did not enter < Round of 128 < Round of 64 < Round of 32 < Round of 16 < Quarter-Finals < ... < Winner
> expected
[1] Winner
9 Levels: Did not enter < Round of 128 < Round of 64 < Round of 32 < Round of 16 < Quarter-Finals < ... < Winner

  在这种情况下,实际值和期待值之间的差异应该是:该球员有望赢得锦标赛,但是会在决赛中输掉。我们可以通过对每个变量调用unclass功能,来计算出他们的差值:


> unclass(round) - unclass(expected)
[1] -1
attr(,"levels")
[1] "Did not enter"  "Round of 128"   "Round of 64"    "Round of 32"    "Round of 16"    "Quarter-Finals"
[7] "Semi-Finals"    "Finals"         "Winner"

  然后,似乎仍然有一些残余的变量因素需要解决掉,我们可以赋数字值给它:

> as.numeric(unclass(round) - unclass(expected))
[1] -1

  这时,我们就可以把这个计算方法应用到所有种子选手下,来预测他们的表现。


作者: 信雪蕊

来源:IT168

原文链接:计算有序因子变量间的差异

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
阿里云服务器怎么设置密码?怎么停机?怎么重启服务器?
如果在创建实例时没有设置密码,或者密码丢失,您可以在控制台上重新设置实例的登录密码。本文仅描述如何在 ECS 管理控制台上修改实例登录密码。
9489 0
差异分析①
加载数据 setwd("D:\\diff") # Reading in count data files
1093 0
自动化测试|录制回放效果差异检测
闲鱼技术-深宇 概述   回归测试是指修改了旧代码后,重新进行测试以确认修改没有引入新的错误或导致其他的代码出现错误。传统的自动化回归测试需要手动编写脚本获得页面元素的视图树,与原有的元素视图树进行比对。
8178 0
文件夹差异文件对比工具 meld
/***************************************************************************************** * 文件夹差异文件对比工具 meld * 说明: * 之前就听说Lee使用文件夹文本差异对比软件winmerge,不过如果要在Linux下使用,那么就要 * 装wine才行了,索性还是换一个在Linux下通用的比较好,于是选择了meld。
1249 0
阿里云服务器如何登录?阿里云服务器的三种登录方法
购买阿里云ECS云服务器后如何登录?场景不同,阿里云优惠总结大概有三种登录方式: 登录到ECS云服务器控制台 在ECS云服务器控制台用户可以更改密码、更换系.
13172 0
差异分析②
样品的无监督聚类 检查基因表达分析最重要的探索性策略之一是多维定标(MDS)图或类似的图。该图以无监督的方式显示了样本之间的相似性和不相似性,以便人们可以了解在进行正式测试之前可以检测差异表达的程度。
869 0
+关注
3598
文章
840
问答
文章排行榜
最热
最新
相关电子书
更多
《2021云上架构与运维峰会演讲合集》
立即下载
《零基础CSS入门教程》
立即下载
《零基础HTML入门教程》
立即下载