宏基因组分箱流程MetaWRAP安装和数据库配置

简介: 宏基因组分箱流程MetaWRAP安装和数据库配置

本文重点

1.MetaWRAP配置安装

软件开源,代码和教程:https://github.com/bxlab/metaWRAP

但是笔者在进行流程中的相关软件数据库的配置时,发现数据下载十分缓慢。但是”国家微生物科学数据中心“为我们打开了新世界。

2.相关数据库配置

网站链接:https://nmdc.cn/datadownload

笔者在进行各种数据下载的时候,最大的感受就是”科学无国界,但科学家有国界“,我想这也是”国家微生物科学数据中心“创建的初衷。

流程

小小记录一下。简单高效的conda安装

  1. 下载安装metaWRAP:git clone https://github.com/bxlab/metaWRAP.git
  2. 加入环境:PATH=yourpath/metaWRAP/bin/:$PATH
  3. 安装mamba(可以替代conda安装相关依赖,但是更快速):conda install -y mamba
  4. 创建一个metaWRAP的虚拟环境:mamba create -y -n metawrap-env python=2.7

这里也可以用conda创建:conda create -y -n metawrap-env python=2.7

  1. 激活metaWRAP的虚拟环境:conda activate metawrap-env
  2. 安装相关依赖:

conda config --add channels defaults conda config --add channels conda-forge conda config --add channels bioconda conda config --add channels ursky mamba install biopython blas=2.5 blast=2.6.0 bmtagger bowtie2 bwa checkm-genome fastqc kraken=1.1 kraken=2.0 krona=2.7 matplotlib maxbin2 megahit metabat2 pandas prokka quast r-ggplot2 r-recommended salmon samtools=1.9 seaborn spades trim-galore

接下来就是数据库的下载配置啦 强烈推荐使用”国家微生物科学数据中心“这个网站来下载相关数据,童叟无欺 这是一个保姆级的guideline

  1. 打开网站https://nmdc.cn/datadownload,进入数据下载专栏;

f781d3c81b6ea9adde48b057203f4c5b_640_wx_fmt=png&wxfrom=5&wx_lazy=1&wx_co=1.png

image.png

  1. 选择”工具资源下载“模块的”宏基因组数据库“;

84c2d238f5210ea7e6cbcf80b991e644_640_wx_fmt=png&wxfrom=5&wx_lazy=1&wx_co=1.png

image.png

  1. 选择我们今天的主角metaWRAP的pipeline中的相关数据库;

需要的数据:

aeab6c914a33473bb7620740b9839fed_640_wx_fmt=png&wxfrom=5&wx_lazy=1&wx_co=1.png

需要啥咱下载啥:

fbaeea340cfa0b906b338314bbb75606_640_wx_fmt=png&wxfrom=5&wx_lazy=1&wx_co=1.png

image.png

2fe1f6de4e1652491fb6e6f580d94b9c_640_wx_fmt=png&wxfrom=5&wx_lazy=1&wx_co=1.png

image.png

  1. 右键复制这些下载链接,打开FileZilla,粘贴相关链接;

725baef0eb1e0bd535e20a865597f55d_640_wx_fmt=png&wxfrom=5&wx_lazy=1&wx_co=1.png

image.png

  1. 上传到服务器上的相关目录下;
  2. 数据库相关的配置直接参考作者github的guideline就可以啦:https://github.com/bxlab/metaWRAP/blob/master/installation/database_installation.md

思考

这一次只是记录了一下宏基因组分箱流程MetaWRAP的安装和数据库配置的相关内容,最主要是介绍一个宝藏网站(”国家微生物科学数据中心“)的简单使用。我们不仅要有自己的芯片,也要有自己的权威数据库,中国人的发展命脉要掌握在我们自己的手中。路漫漫其修远兮,让我们一起上下求索。

相关文章
|
4天前
|
消息中间件 资源调度 关系型数据库
如何在Flink on YARN环境中配置Debezium CDC 3.0,以实现实时捕获数据库变更事件并将其传输到Flink进行处理
本文介绍了如何在Flink on YARN环境中配置Debezium CDC 3.0,以实现实时捕获数据库变更事件并将其传输到Flink进行处理。主要内容包括安装Debezium、配置Kafka Connect、创建Flink任务以及启动任务的具体步骤,为构建实时数据管道提供了详细指导。
21 9
|
2天前
|
SQL 关系型数据库 MySQL
go语言数据库中mysql驱动安装
【11月更文挑战第2天】
13 4
|
3天前
|
SQL 关系型数据库 MySQL
go语言中安装数据库驱动
【11月更文挑战第1天】
16 5
|
4天前
|
安全 Nacos 数据库
Nacos是一款流行的微服务注册与配置中心,但直接暴露在公网中可能导致非法访问和数据库篡改
Nacos是一款流行的微服务注册与配置中心,但直接暴露在公网中可能导致非法访问和数据库篡改。本文详细探讨了这一问题的原因及解决方案,包括限制公网访问、使用HTTPS、强化数据库安全、启用访问控制、监控和审计等步骤,帮助开发者确保服务的安全运行。
14 3
|
8天前
|
关系型数据库 MySQL Linux
在 CentOS 7 中通过编译源码方式安装 MySQL 数据库的详细步骤,并与使用 RPM 包安装进行了对比
本文介绍了在 CentOS 7 中通过编译源码方式安装 MySQL 数据库的详细步骤,并与使用 RPM 包安装进行了对比。通过具体案例,读者可以了解如何准备环境、下载源码、编译安装、配置服务及登录 MySQL。编译源码安装虽然复杂,但提供了更高的定制性和灵活性,适用于需要高度定制的场景。
28 3
|
7天前
|
PHP 数据库 数据安全/隐私保护
布谷直播源码部署服务器关于数据库配置的详细说明
布谷直播系统源码搭建部署时数据库配置明细!
|
9天前
|
关系型数据库 MySQL Linux
在 CentOS 7 中通过编译源码安装 MySQL 数据库的详细步骤,并与使用 RPM 包安装进行了对比。
本文介绍了在 CentOS 7 中通过编译源码安装 MySQL 数据库的详细步骤,并与使用 RPM 包安装进行了对比。内容涵盖准备工作、下载源码、编译安装、配置服务、登录设置及实践心得,帮助读者根据需求选择最适合的安装方法。
17 2
|
10天前
|
Java 数据库连接 数据库
如何构建高效稳定的Java数据库连接池,涵盖连接池配置、并发控制和异常处理等方面
本文介绍了如何构建高效稳定的Java数据库连接池,涵盖连接池配置、并发控制和异常处理等方面。通过合理配置初始连接数、最大连接数和空闲连接超时时间,确保系统性能和稳定性。文章还探讨了同步阻塞、异步回调和信号量等并发控制策略,并提供了异常处理的最佳实践。最后,给出了一个简单的连接池示例代码,并推荐使用成熟的连接池框架(如HikariCP、C3P0)以简化开发。
25 2
|
11天前
|
关系型数据库 MySQL Linux
在 CentOS 7 中通过编译源码方式安装 MySQL 数据库的详细步骤,包括准备工作、下载源码、编译安装、配置 MySQL 服务、登录设置等。
本文介绍了在 CentOS 7 中通过编译源码方式安装 MySQL 数据库的详细步骤,包括准备工作、下载源码、编译安装、配置 MySQL 服务、登录设置等。同时,文章还对比了编译源码安装与使用 RPM 包安装的优缺点,帮助读者根据需求选择最合适的方法。通过具体案例,展示了编译源码安装的灵活性和定制性。
50 2
|
25天前
|
存储 关系型数据库 MySQL
Mysql(4)—数据库索引
数据库索引是用于提高数据检索效率的数据结构,类似于书籍中的索引。它允许用户快速找到数据,而无需扫描整个表。MySQL中的索引可以显著提升查询速度,使数据库操作更加高效。索引的发展经历了从无索引、简单索引到B-树、哈希索引、位图索引、全文索引等多个阶段。
58 3
Mysql(4)—数据库索引
下一篇
无影云桌面