利用GAPIT进行GWAS分析的方法
引言
GAPIT是张志武老师开发的基于R语言的GWAS分析工具,能够根据表型和基因型数据自动进行不同模型的全基因组关联分析,网上有很多公开的教程。本文分享一种方法,进行单基因GWAS分析。
主要步骤
- 加载分析环境
- 导入数据
- 选择模型并开始分析
- 结果提取
项目运行环境
- centos7 linux
- R4.2.3
具体操作步骤
加载R包与环境
library(MASS) # required for ginv library(multtest) library(gplots) library(compiler) #required for cmpfun library(scatterplot3d) library(bigmemory) library(ape) library(EMMREML) source("./01_scripts/GAPIT1.txt") source("./01_scripts/GAPIT2.txt")
导入数据
myG <- read.delim(paste0("./06_out_gene/",job,".gene.hmp.txt"), header = F) myY <- read.table(paste0("./07_out_trait/",job,".trait.txt"), header = T,sep = "\t")
这里需要的数据有两个,myG是基因型文件,需要hmp格式,myY是表型文件,需要制表符分隔的txt文件。
设置项目路径
now_dir <- getwd() dir.create(paste0(now_dir,"/08_out_GWAS/MLM_",job)) setwd(paste0(now_dir,"/08_out_GWAS/MLM_",job))
由于GAPIT运行后会自动在当前目录下生成若干结果文件,为了避免紊乱,因此对每次结果设置独立路径。这里会读取当前文件夹,然后创建新文件夹并设为临时工作目录。
GAPIT分析
myGAPIT <- GAPIT( Y=myY, G=myG, PCA.total=3, model="MLM", Random.model = TRUE )
该步骤是GWAS的核心步骤,根据样本数据量的不同,这一步耗费的时间也不同,完成后会看到很多自动生成的图片和表格文件,该步骤可以选择不同的模型,比如MLM等。
setwd(now_dir) print(paste0(job," GWAS finished!"))
完成后重新回到之前的工作目录
END
© 素材来源于网络,侵权请联系后台删除
笔记合集,点击直达