宏基因组分箱流程MetaWRAP安装和数据库配置

简介: 宏基因组分箱流程MetaWRAP安装和数据库配置

本文重点

1.MetaWRAP配置安装

软件开源,代码和教程:https://github.com/bxlab/metaWRAP

但是笔者在进行流程中的相关软件数据库的配置时,发现数据下载十分缓慢。但是”国家微生物科学数据中心“为我们打开了新世界。

2.相关数据库配置

网站链接:https://nmdc.cn/datadownload

笔者在进行各种数据下载的时候,最大的感受就是”科学无国界,但科学家有国界“,我想这也是”国家微生物科学数据中心“创建的初衷。

流程

小小记录一下。简单高效的conda安装

  1. 下载安装metaWRAP:git clone https://github.com/bxlab/metaWRAP.git
  2. 加入环境:PATH=yourpath/metaWRAP/bin/:$PATH
  3. 安装mamba(可以替代conda安装相关依赖,但是更快速):conda install -y mamba
  4. 创建一个metaWRAP的虚拟环境:mamba create -y -n metawrap-env python=2.7

这里也可以用conda创建:conda create -y -n metawrap-env python=2.7

  1. 激活metaWRAP的虚拟环境:conda activate metawrap-env
  2. 安装相关依赖:

conda config --add channels defaults conda config --add channels conda-forge conda config --add channels bioconda conda config --add channels ursky mamba install biopython blas=2.5 blast=2.6.0 bmtagger bowtie2 bwa checkm-genome fastqc kraken=1.1 kraken=2.0 krona=2.7 matplotlib maxbin2 megahit metabat2 pandas prokka quast r-ggplot2 r-recommended salmon samtools=1.9 seaborn spades trim-galore

接下来就是数据库的下载配置啦 强烈推荐使用”国家微生物科学数据中心“这个网站来下载相关数据,童叟无欺 这是一个保姆级的guideline

  1. 打开网站https://nmdc.cn/datadownload,进入数据下载专栏;

f781d3c81b6ea9adde48b057203f4c5b_640_wx_fmt=png&wxfrom=5&wx_lazy=1&wx_co=1.png

image.png

  1. 选择”工具资源下载“模块的”宏基因组数据库“;

84c2d238f5210ea7e6cbcf80b991e644_640_wx_fmt=png&wxfrom=5&wx_lazy=1&wx_co=1.png

image.png

  1. 选择我们今天的主角metaWRAP的pipeline中的相关数据库;

需要的数据:

aeab6c914a33473bb7620740b9839fed_640_wx_fmt=png&wxfrom=5&wx_lazy=1&wx_co=1.png

需要啥咱下载啥:

fbaeea340cfa0b906b338314bbb75606_640_wx_fmt=png&wxfrom=5&wx_lazy=1&wx_co=1.png

image.png

2fe1f6de4e1652491fb6e6f580d94b9c_640_wx_fmt=png&wxfrom=5&wx_lazy=1&wx_co=1.png

image.png

  1. 右键复制这些下载链接,打开FileZilla,粘贴相关链接;

725baef0eb1e0bd535e20a865597f55d_640_wx_fmt=png&wxfrom=5&wx_lazy=1&wx_co=1.png

image.png

  1. 上传到服务器上的相关目录下;
  2. 数据库相关的配置直接参考作者github的guideline就可以啦:https://github.com/bxlab/metaWRAP/blob/master/installation/database_installation.md

思考

这一次只是记录了一下宏基因组分箱流程MetaWRAP的安装和数据库配置的相关内容,最主要是介绍一个宝藏网站(”国家微生物科学数据中心“)的简单使用。我们不仅要有自己的芯片,也要有自己的权威数据库,中国人的发展命脉要掌握在我们自己的手中。路漫漫其修远兮,让我们一起上下求索。

相关文章
|
13天前
|
存储 SQL 关系型数据库
MySQL的安装&数据库的简单操作
本文介绍了数据库的基本概念及MySQL的安装配置。首先解释了数据库、数据库管理系统和SQL的概念,接着详细描述了MySQL的安装步骤及其全局配置文件my.ini的调整方法。文章还介绍了如何启动MySQL服务,包括配置环境变量和使用命令行的方法。最后,详细说明了数据库的各种操作,如创建、选择和删除数据库的SQL语句,并提供了实际操作示例。
57 13
MySQL的安装&数据库的简单操作
|
28天前
|
SQL 关系型数据库 分布式数据库
PolarDB Proxy配置与优化:提升数据库访问效率
【9月更文挑战第6天】PolarDB是阿里云推出的高性能分布式关系型数据库,PolarDB Proxy作为其关键组件,位于客户端与PolarDB集群间,负责SQL请求的解析与转发,并支持连接池管理、SQL过滤及路由规则等功能。本文详细介绍了PolarDB Proxy的配置方法,包括连接池、负载均衡和SQL过滤设置,并探讨了监控调优、缓存及网络优化策略,以帮助提升数据库访问效率。
29 1
|
1月前
|
Java 数据库连接 数据库
数据库以及其他项目配置
该项目配置了数据库连接和MyBatis设置,并解决了配置文件加载问题。启动类使用 `@SpringBootApplication` 注解,可通过 `@ComponentScan` 指定扫描包。Lombok 自动生成 getter/setter 等方法,简化代码。Result 实体类用于统一返回格式。用户模块包括注册与登录功能,使用 MD5 加密密码、Spring Validation 参数校验及 JWT 认证。JWT 工具类处理令牌生成与解析,并通过拦截器验证。Redis 优化登录功能,利用 ThreadLocal 存储用户信息。此外,还包括文章模块的相关功能,如文章分类管理、
38 2
|
16天前
|
SQL 关系型数据库 MySQL
Python操作pymysql数据库的流程与技巧
在现代软件开发中,Python作为一门高效且易于学习的编程语言,广泛应用于各种场景,其中包括数据库操作。**PyMySQL** 是一个流行的Python数据库接口,用于连接和操作MySQL数据库。它提供了一种简便的方法来执行SQL语句、处理数据和管理数据库事务。以下是使用PyMySQL操作MySQL数据库的流程与技巧,旨在为开发者提供一个清晰、实用的指南。
18 0
|
21天前
|
SQL 关系型数据库 MySQL
MySQL技术安装配置、数据库与表的设计、数据操作解析
MySQL,作为最流行的关系型数据库管理系统之一,在WEB应用领域中占据着举足轻重的地位。本文将从MySQL的基本概念、安装配置、数据库与表的设计、数据操作解析,并通过具体的代码示例展示如何在实际项目中应用MySQL。
62 0
|
28天前
|
关系型数据库 Java MySQL
"解锁Java Web传奇之旅:从JDK1.8到Tomcat,再到MariaDB,一场跨越数据库的冒险安装盛宴,挑战你的技术极限!"
【9月更文挑战第6天】在Linux环境下安装JDK 1.8、Tomcat和MariaDB是搭建Java Web应用的关键步骤。本文详细介绍了使用apt-get安装OpenJDK 1.8、下载并配置Tomcat,以及安装和安全设置MariaDB(MySQL的开源分支)的方法。通过这些步骤,您可以快速构建一个稳定、高效的开发和部署环境,并验证各组件是否正确安装和运行。这为您的Java Web应用提供了一个坚实的基础。
34 0
|
2月前
|
API Java 开发框架
【从零到精通】如何用Play Framework快速构建RESTful API?看完这篇你就懂了!
【8月更文挑战第31天】《Play Framework快速入门:从零开始构建RESTful API》介绍了如何使用高性能Web开发框架Play Framework构建简单的RESTful API。从环境搭建到项目创建,再到实现用户列表的增删查功能,本文档详细指导每个步骤,并解释核心概念。适合初学者快速上手。首先确保已安装JDK和sbt,然后通过sbt创建Play项目,接着定义控制器、模型及路由,最后运行应用进行测试。通过本教程,你将掌握构建RESTful API的基础知识,为进一步学习Play Framework打下坚实基础。
30 0
|
2月前
|
SQL Oracle 关系型数据库
Entity Framework Core 实现多数据库支持超厉害!配置连接、迁移与事务,开启多元数据库之旅!
【8月更文挑战第31天】在现代软件开发中,为了满足不同业务需求及环境要求,常需支持多个数据库系统。Entity Framework Core(EF Core)作为一款强大的对象关系映射(ORM)框架,通过数据库提供程序与多种数据库如SQL Server、MySQL、PostgreSQL、Oracle等交互。开发者可通过安装相应NuGet包并配置`DbContextOptionsBuilder`来指定不同数据库连接,从而实现多数据库支持。
32 0
|
2月前
|
关系型数据库 MySQL 机器人
Django入门到放弃之数据库配置
Django入门到放弃之数据库配置
下一篇
无影云桌面