本文重点
1.MetaWRAP配置安装
软件开源,代码和教程:https://github.com/bxlab/metaWRAP
但是笔者在进行流程中的相关软件数据库的配置时,发现数据下载十分缓慢。但是”国家微生物科学数据中心“为我们打开了新世界。
2.相关数据库配置
网站链接:https://nmdc.cn/datadownload。
笔者在进行各种数据下载的时候,最大的感受就是”科学无国界,但科学家有国界“,我想这也是”国家微生物科学数据中心“创建的初衷。
流程
小小记录一下。简单高效的conda安装
- 下载安装metaWRAP:git clone https://github.com/bxlab/metaWRAP.git
- 加入环境:PATH=yourpath/metaWRAP/bin/:$PATH
- 安装mamba(可以替代conda安装相关依赖,但是更快速):conda install -y mamba
- 创建一个metaWRAP的虚拟环境:mamba create -y -n metawrap-env python=2.7
这里也可以用conda创建:conda create -y -n metawrap-env python=2.7
- 激活metaWRAP的虚拟环境:conda activate metawrap-env
- 安装相关依赖:
conda config --add channels defaults conda config --add channels conda-forge conda config --add channels bioconda conda config --add channels ursky mamba install biopython blas=2.5 blast=2.6.0 bmtagger bowtie2 bwa checkm-genome fastqc kraken=1.1 kraken=2.0 krona=2.7 matplotlib maxbin2 megahit metabat2 pandas prokka quast r-ggplot2 r-recommended salmon samtools=1.9 seaborn spades trim-galore
接下来就是数据库的下载配置啦 强烈推荐使用”国家微生物科学数据中心“这个网站来下载相关数据,童叟无欺 这是一个保姆级的guideline
- 打开网站https://nmdc.cn/datadownload,进入数据下载专栏;
image.png
- 选择”工具资源下载“模块的”宏基因组数据库“;
image.png
- 选择我们今天的主角metaWRAP的pipeline中的相关数据库;
需要的数据:
需要啥咱下载啥:
image.png
image.png
- 右键复制这些下载链接,打开FileZilla,粘贴相关链接;
image.png
- 上传到服务器上的相关目录下;
- 数据库相关的配置直接参考作者github的guideline就可以啦:https://github.com/bxlab/metaWRAP/blob/master/installation/database_installation.md
思考
这一次只是记录了一下宏基因组分箱流程MetaWRAP的安装和数据库配置的相关内容,最主要是介绍一个宝藏网站(”国家微生物科学数据中心“)的简单使用。我们不仅要有自己的芯片,也要有自己的权威数据库,中国人的发展命脉要掌握在我们自己的手中。路漫漫其修远兮,让我们一起上下求索。