宏基因组分箱流程MetaWRAP安装和数据库配置

简介: 宏基因组分箱流程MetaWRAP安装和数据库配置

本文重点

1.MetaWRAP配置安装

软件开源,代码和教程:https://github.com/bxlab/metaWRAP

但是笔者在进行流程中的相关软件数据库的配置时,发现数据下载十分缓慢。但是”国家微生物科学数据中心“为我们打开了新世界。

2.相关数据库配置

网站链接:https://nmdc.cn/datadownload

笔者在进行各种数据下载的时候,最大的感受就是”科学无国界,但科学家有国界“,我想这也是”国家微生物科学数据中心“创建的初衷。

流程

小小记录一下。简单高效的conda安装

  1. 下载安装metaWRAP:git clone https://github.com/bxlab/metaWRAP.git
  2. 加入环境:PATH=yourpath/metaWRAP/bin/:$PATH
  3. 安装mamba(可以替代conda安装相关依赖,但是更快速):conda install -y mamba
  4. 创建一个metaWRAP的虚拟环境:mamba create -y -n metawrap-env python=2.7

这里也可以用conda创建:conda create -y -n metawrap-env python=2.7

  1. 激活metaWRAP的虚拟环境:conda activate metawrap-env
  2. 安装相关依赖:

conda config --add channels defaults conda config --add channels conda-forge conda config --add channels bioconda conda config --add channels ursky mamba install biopython blas=2.5 blast=2.6.0 bmtagger bowtie2 bwa checkm-genome fastqc kraken=1.1 kraken=2.0 krona=2.7 matplotlib maxbin2 megahit metabat2 pandas prokka quast r-ggplot2 r-recommended salmon samtools=1.9 seaborn spades trim-galore

接下来就是数据库的下载配置啦 强烈推荐使用”国家微生物科学数据中心“这个网站来下载相关数据,童叟无欺 这是一个保姆级的guideline

  1. 打开网站https://nmdc.cn/datadownload,进入数据下载专栏;

f781d3c81b6ea9adde48b057203f4c5b_640_wx_fmt=png&wxfrom=5&wx_lazy=1&wx_co=1.png

image.png

  1. 选择”工具资源下载“模块的”宏基因组数据库“;

84c2d238f5210ea7e6cbcf80b991e644_640_wx_fmt=png&wxfrom=5&wx_lazy=1&wx_co=1.png

image.png

  1. 选择我们今天的主角metaWRAP的pipeline中的相关数据库;

需要的数据:

aeab6c914a33473bb7620740b9839fed_640_wx_fmt=png&wxfrom=5&wx_lazy=1&wx_co=1.png

需要啥咱下载啥:

fbaeea340cfa0b906b338314bbb75606_640_wx_fmt=png&wxfrom=5&wx_lazy=1&wx_co=1.png

image.png

2fe1f6de4e1652491fb6e6f580d94b9c_640_wx_fmt=png&wxfrom=5&wx_lazy=1&wx_co=1.png

image.png

  1. 右键复制这些下载链接,打开FileZilla,粘贴相关链接;

725baef0eb1e0bd535e20a865597f55d_640_wx_fmt=png&wxfrom=5&wx_lazy=1&wx_co=1.png

image.png

  1. 上传到服务器上的相关目录下;
  2. 数据库相关的配置直接参考作者github的guideline就可以啦:https://github.com/bxlab/metaWRAP/blob/master/installation/database_installation.md

思考

这一次只是记录了一下宏基因组分箱流程MetaWRAP的安装和数据库配置的相关内容,最主要是介绍一个宝藏网站(”国家微生物科学数据中心“)的简单使用。我们不仅要有自己的芯片,也要有自己的权威数据库,中国人的发展命脉要掌握在我们自己的手中。路漫漫其修远兮,让我们一起上下求索。

相关文章
|
6月前
|
关系型数据库 MySQL Java
【YashanDB知识库】原生mysql驱动配置连接崖山数据库
【YashanDB知识库】原生mysql驱动配置连接崖山数据库
【YashanDB知识库】原生mysql驱动配置连接崖山数据库
|
6月前
|
数据库
【YashanDB知识库】数据库一主一备部署及一主两备部署时,主备手动切换方法及自动切换配置
【YashanDB知识库】数据库一主一备部署及一主两备部署时,主备手动切换方法及自动切换配置
【YashanDB知识库】数据库一主一备部署及一主两备部署时,主备手动切换方法及自动切换配置
|
5月前
|
安全 Linux 网络安全
YashanDB数据库服务端SSL连接配置
YashanDB支持通过SSL连接确保数据传输安全,需在服务端生成根证书、服务器证书及DH文件,并将根证书提供给客户端以完成身份验证。服务端配置包括使用OpenSSL工具生成证书、设置SSL参数并重启数据库;客户端则需下载根证书并正确配置环境变量与`yasc_env.ini`文件。注意:启用SSL后,所有客户端必须持有根证书才能连接,且SSL与密码认证独立运行。
|
5月前
|
存储 XML JSON
Activiti 7 核心数据库表概览及流程生命周期中的作用
Activiti 7 工作流引擎通过约25张核心数据库表实现流程定义、运行时状态、历史记录与身份数据的存储。表名以ACT_开头,后跟标识用途的字母组合(如RE表示Repository静态信息,RU表示Runtime动态数据)。流程启动时在运行时表登记数据,任务执行中更新关联信息,结束时清理运行时记录并完善历史记录。各表分工明确且逻辑紧密关联,确保高效运行与完整留痕的平衡。掌握这些表的作用和关联有助于深入理解Activiti底层原理及进行高级应用开发。
321 0
|
5月前
|
Ubuntu 关系型数据库 Linux
Linux数据库安装
本文介绍了在CentOS 8.0和Ubuntu 22.04系统上安装、配置和启动MariaDB数据库服务器的详细步骤。包括通过`yum`和`apt`包管理器安装MariaDB服务,启动并检查服务运行状态,设置root用户密码以及连接数据库的基本操作。此外,还展示了如何在Ubuntu上更新软件包列表、安装依赖项,并验证MariaDB的版本和运行状态。通过这些步骤,用户可以成功部署并初始化MariaDB环境,为后续数据库管理与应用开发奠定基础。
229 61
|
2月前
|
SQL XML Java
配置Spring框架以连接SQL Server数据库
最后,需要集成Spring配置到应用中,这通常在 `main`方法或者Spring Boot的应用配置类中通过加载XML配置或使用注解来实现。
173 0
|
4月前
|
SQL 关系型数据库 MySQL
MySQL下载安装全攻略!小白也能轻松上手,从此数据库不再难搞!
这是一份详细的MySQL安装与配置教程,适合初学者快速上手。内容涵盖从下载到安装的每一步操作,包括选择版本、设置路径、配置端口及密码等。同时提供基础操作指南,如数据库管理、数据表增删改查、用户权限设置等。还介绍了备份恢复、图形化工具使用和性能优化技巧,帮助用户全面掌握MySQL的使用方法。附带常见问题解决方法,保姆级教学让你无忧入门!
MySQL下载安装全攻略!小白也能轻松上手,从此数据库不再难搞!
|
5月前
|
Java 关系型数据库 MySQL
JDK、Tomcat、MariaDB数据库和Profile多环境的配置与使用
以上就是JDK、Tomcat、MariaDB数据库和Profile多环境的配置与使用的基本步骤。这些步骤可能会因为你的具体需求和环境而有所不同,但是基本的思路是一样的。希望这些信息能够帮助你更好地理解和使用这些工具。
162 17
|
5月前
|
监控 Java Shell
【YashanDB 知识库】ycm 托管数据库时,数据库非 OM 安装无法托管
本文主要介绍了因数据库未按规范使用 yasboot 安装导致的问题及解决方法。问题表现为无 yasom 和 yasagent 进程,且目录结构缺失,致使 ycm 无法托管与监控。分析发现可能是数据库版本旧或安装不规范引起。解决方法为先生成配置文件,安装 yasom 和 yasagent,再生成并修改托管配置模板,最终通过命令完成托管至 yasom 和 ycm。总结强调了按规范安装数据库的重要性以避免类似问题。

热门文章

最新文章