R语言CRAN软件包Meta分析-阿里云开发者社区

R语言CRAN软件包Meta分析

2024-04-16 158

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： R语言CRAN软件包Meta分析

我一直在寻找各种方法来查找有关R包的信息，但我最近才了解CRAN_package_db()了基本tools包中的函数。

当被调用时，这个函数发送到由环境变量指定的CRAN镜像，R_CRAN_WEB并返回一个数据帧，其中包含有关CRAN上当前每个包的大量信息。它是元数据的宝库。

作为处理角色数据的一个例子。我选择进行协作的代理是每个软件包列出的作者数量。我对其他软件包开发人员有用的代理是反向依赖和反向导入的联合。

首先选择数据框的一个子集来处理



## Observations: 12,123
## Variables: 6
## $ Package"A3", "abbyyR", "abc", "abc.data", "ABC.RAP", "ABCanal...
## $ Dep"R (>= 2.15.0), xtable, pbapply", "R (>= 3.2.0)", "R (...
## $ ImpNA, "httr, XML, curl, readr, plyr, progress", NA, NA, ...
## $ Aut"Scott Fortmann-Roe", "Gaurav Sood [aut, cre]", "Csill...
## $ RDNA, NA, "abctools, EasyABC", "abc", NA, NA, NA, NA, NA...
## $ RI NA, NA, "ecolottery", NA, NA, NA, NA, NA, NA, NA, NA, ...

请注意，在这篇文章中，我正在使用我刚刚讲话之前从CRAN提取的一个文件中的数据，但您应该没有任何问题CRAN_package_db()来获取更新的数据集。

接下来我做的是向数据集中添加两个新变量：DepImp依赖包和导入包RDRI的联合，以及反向联合依赖并反向导入包。

另外，事实证明，作者字段需要一些工作，以便从作者字符串中删除像“[aut，cre]”和“[ctb，cph]”这样的限定性文本。

一旦我有了一些干净的文本，我使用了以下代码的非常混乱的初步版本来获取我正在查找的计数数据。请注意，派生的特性DepImp以及RDRI需要的某些预处理与从我选择的其他特性中提取计数所需的预处理不同。在这里，我做了一件非常不整洁的事情，并创建了两个初步的数据框架 - 效率不高。


##      Package Aut Dep Imp RD RI DepImp RDRI
## 1          A3  1  3  0  0  0      3    0
## 2      abbyyR  1  1  6  0  0      7    0
## 3        abc  4  6  0  2  1      6    3
## 4    abc.data  4  1  0  1  0      1    1
## 5    ABC.RAP  4  1  3  0  0      4    0
## 6 ABCanalysis  3  1  1  0  0      2    0

一旦我有了清晰的数据，计算一些简单的统计数据就变得微不足道了。

在这里，我们看到手段和中位数的数字很小，但是反向依赖和反向进口以及它们的联合的标准偏差反映了相当


##  Features mean    sd median
## 1      Aut 2.25  2.73      1
## 2      Dep 1.53  1.57      1
## 3      Imp 2.85  3.89      1
## 4      RD 0.81  9.09      0
## 5      RI 2.30 23.23      0
## 6  DepImp 4.37  4.06      3
## 7    RDRI 3.11 30.79      0

在一目了然RDRI位数表明，这种变化是由于比较少的包。直方图表示很长的尾巴。



## 0% 25% 50% 75% 100%
## 0 0 0 0 1239


## Warning: Removed 4 rows containing non-finite values (stat_bin).


## Warning: Removed 1 rows containing missing values (geom_bar).

对RDRI字段进行排序可找到前15个最集成的软件包。由此，我的意思是最依赖或由其他软件包导入的软件包。


##    Package Aut DepImp RDRI
## 1      Rcpp  7      3 1239
## 2      MASS  6      6 1157
## 3      MASS  6      6 1157
## 4  ggplot2  3    11 1149
## 5    dplyr  5    12  716
## 6    Matrix  13      7  680
## 7    Matrix  13      7  680
## 8      plyr  1      2  555
## 9  stringr  2      3  500
## 10  mvtnorm  9      3  483
## 11 magrittr  1      0  454
## 12 survival  2      7  434
## 13 survival  2      7  434
## 14 jsonlite  3      1  426
## 15    httr  2      6  420

最后，查看作者领域的分位数和直方图给出了一些合作的想法。大多数软件包的作者少于三位，表明只有非常适度的协作。


## 0% 25% 50% 75% 100%## 1 1 1 3 97




## Warning: Removed 9 rows containing non-finite values (stat_bin).

R语言CRAN软件包Meta分析

热门文章

最新文章

相关课程

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

R语言CRAN软件包Meta分析

热门文章

最新文章

相关课程

相关电子书