R语言_一个矩阵除以向量会发生什么

简介: R语言_一个矩阵除以向量会发生什么

在用featureCounts做完表达矩阵的counts值后进行TPM需要注意这个细节问题,在计算TPM时每个基因需要除以各自的基因长度来校正基因长度,每一个样本又要除以它各自的文库大小校正测序深度。


因此,我们的表达矩阵,其实是需要除以两个长度不一的向量,而且方向不一样,一个是按照行来除以(基因长度),一个是按照列来除以(测序深度),在我之前的文章https://www.jianshu.com/p/cd1c7b4ec6a2RNA-seq数据分析一:(HISAT2+featureCounts)中有提到

countdata <- read.csv("countdata.csv")
#countdata.csv是提取了上一步的counts数据以及gene length
rownames(countdata) <- countdata[,1]
countdata <- countdata[,-1]
kb <- countdata$length / 1000
count <- countdata[,1:8]
rpk <- count / kb
tpm <- t(t(rpk)/colSums(rpk) * 1000000)
fpkm <- t(t(rpk)/colSums(count) * 10^6) 
#想计算数据框中每列的总和,使用colSums函数。
write.table(fpkm,file="eight_tissues_fpkm.xls",sep="\t",quote = F)

count 是表达矩阵,kb是不同基因长度向量,而 colSums(count)  是不同样本的长度向量。

矩阵除以向量,是按行的顺序来的,如果需要按列的顺序来(不同样本,一列一列),就得先转置,再转回来


关于矩阵除以向量,我以一个简单的例子向大家介绍

微信截图_20230606150939.png

我们可以看到,一个矩阵除以向量是将向量按照行(第一行第一个,第二行第一个...)的顺序与矩阵中的数据相除。

相关文章
|
3月前
|
机器学习/深度学习
R语言模型评估:深入理解混淆矩阵与ROC曲线
【9月更文挑战第2天】混淆矩阵和ROC曲线是评估分类模型性能的两种重要工具。混淆矩阵提供了模型在不同类别上的详细表现,而ROC曲线则通过综合考虑真正率和假正率来全面评估模型的分类能力。在R语言中,利用`caret`和`pROC`等包可以方便地实现这两种评估方法,从而帮助我们更好地理解和选择最适合当前任务的模型。
|
7月前
|
BI 索引
R语言数据结构-----向量
R语言数据结构-----向量
36 4
|
7月前
|
索引
R语言中的数据结构----矩阵
R语言中的数据结构----矩阵
62 3
|
7月前
|
机器学习/深度学习 数据可视化 数据挖掘
R语言逻辑回归logistic对ST股票风险建模分类分析混淆矩阵、ROC曲线可视化
R语言逻辑回归logistic对ST股票风险建模分类分析混淆矩阵、ROC曲线可视化
|
7月前
|
机器学习/深度学习 数据可视化 算法
R语言独立成分分析fastICA、谱聚类、支持向量回归SVR模型预测商店销量时间序列可视化
R语言独立成分分析fastICA、谱聚类、支持向量回归SVR模型预测商店销量时间序列可视化
|
7月前
|
机器学习/深度学习 搜索推荐 数据挖掘
R语言矩阵特征值分解(谱分解)和奇异值分解(SVD)特征向量分析有价证券数据
R语言矩阵特征值分解(谱分解)和奇异值分解(SVD)特征向量分析有价证券数据
|
7月前
|
机器学习/深度学习 人工智能 数据可视化
【视频】R语言支持向量回归SVR预测水位实例讲解|附代码数据
【视频】R语言支持向量回归SVR预测水位实例讲解|附代码数据
|
7月前
|
机器学习/深度学习 数据可视化
R语言逻辑回归、决策树、随机森林、神经网络预测患者心脏病数据混淆矩阵可视化(下)
R语言逻辑回归、决策树、随机森林、神经网络预测患者心脏病数据混淆矩阵可视化
|
7月前
|
机器学习/深度学习 数据采集 数据可视化
R语言逻辑回归、决策树、随机森林、神经网络预测患者心脏病数据混淆矩阵可视化(上)
R语言逻辑回归、决策树、随机森林、神经网络预测患者心脏病数据混淆矩阵可视化
|
7月前
|
数据可视化 前端开发 计算机视觉
R语言时变向量自回归(TV-VAR)模型分析时间序列和可视化
R语言时变向量自回归(TV-VAR)模型分析时间序列和可视化