首先DESeq2在R-studio上的安装非常让人自闭,具体可参考徐洲更老师的R语言安装介绍https://www.bilibili.com/video/BV19p4y1i7Zb?from=search&seid=2717757288900359126,我认为最关键的问题是要用BioManager来安装,就像conda装软件也要写一个conda install -c bioconda XXX
。
#安装DESeq2包; BiocManager::install("DESeq2") #载入DESeq2包; library(DESeq2)
输入矩阵数据(mycounts),行名为sample,列名为gene;对照组在前,实验组在后DESeq2不支持无生物学重复的数据,数据应是htseq-count的结果,如果是RSEM定量结果,要对count data取整,因为DESeq2包不支持count数有小数点,需要round取整。
#使用csv文件,在csv文件中把colnames改成文本,其它全部为数值。 #在R语言中csv的可读性非常好,其他格式非常容易让人自闭。 mycounts <- read.csv("Count_DH1_DH10_.csv") rownames(mycounts) <- mycounts[,1] ##colnames列名 ##rownames行名 mycounts <- mycounts[,-1] condition <- factor(c(rep("DHF_",3),rep("DHT_",3)),levels = c("DHF_","DHT_")) colData <- data.frame(row.names = colnames(mycounts),condition) ##dds=DESeqDataSet Object dds <- DESeqDataSetFromMatrix(mycounts,colData,design = ~ condition) #~在R里面用于构建公式对象,~左边为因变量,右边为自变量 dds <- DESeq(dds) res= results(dds) table(res$padj <0.05) res <- res[order(res$padj),] resdata <- merge(as.data.frame(res), as.data.frame(counts(dds, normalized=TRUE)),by="row.names",sort=FALSE) write.csv(resdata,file = "9.Results_DHF_vs_DHT.csv")