BBTools-bbduk安装使用

简介: BBTools-bbduk安装使用

BBTools是一套快速、多线程的生物信息学工具,用于分析DNA和RNA序列数据。开源无限制使用

处理常见的序列如fastq,fasta,sam等等,需要java(version7 ro higher),可以再多平台使用。

该套件包括以下模块:

bbduk – filters or trims reads for adapters and contaminants using k-mers
bbmap – short-read aligner for DNA and RNA-seq data
bbmerge – merges overlapping or nonoverlapping pairs into a single reads
reformat – converts sequence files between different formats such as fastq and fasta

下载安装

下载地址

安装指导

image-20230220092357751

image-20230220092548160

# 下载文件
$ wget https://nchc.dl.sourceforge.net/project/bbmap/BBMap_39.01.tar.gz
$ cd (installation parent folder)
# 解压文件
$ tar -xvzf BBMap_(version).tar.gz
# 测试安装 cd到安装文件夹下
$ ./stats.sh in=/home/yanziming/vicent/bbmap/resources/phix174_ill.ref.fa.gz
A       C       G       T       N       IUPAC   Other   GC      GC_stdev
0.2399  0.2144  0.2326  0.3130  0.0000  0.0000  0.0000  0.4471  0.0000

Main genome scaffold total:             1
Main genome contig total:               1
Main genome scaffold sequence total:    0.005 MB
Main genome contig sequence total:      0.005 MB        0.000% gap
Main genome scaffold N/L50:             1/5.386 KB
Main genome contig N/L50:               1/5.386 KB
Main genome scaffold N/L90:             1/5.386 KB
Main genome contig N/L90:               1/5.386 KB
Max scaffold length:                    5.386 KB
Max contig length:                      5.386 KB
Number of scaffolds > 50 KB:            0
% main genome in scaffolds > 50 KB:     0.00%


Minimum         Number          Number          Total           Total           Scaffold
Scaffold        of              of              Scaffold        Contig          Contig  
Length          Scaffolds       Contigs         Length          Length          Coverage
--------        --------------  --------------  --------------  --------------  --------
    All                      1               1           5,386           5,386   100.00%
   5 KB                      1               1           5,386           5,386   100.00%

安装java依赖

# 地址:https://www.oracle.com/java/technologies/downloads/
# 查看系统版本号 ubuntu
$ uname -a
Linux server1 4.15.0-197-generic #208-Ubuntu SMP Tue Nov 1 17:23:37 UTC 2022 x86_64 x86_64 x86_64 GNU/Linux
$ wget https://download.oracle.com/java/19/latest/jdk-19_linux-x64_bin.tar.gz
$ tar -zxvf jdk-19_linux-x64_bin.tar.gz
# 编辑.bashrc文件,添加以下命令
JAVA_HOME=/home/yanziming/vicent/jdk-19.0.2
CLASSPATH=$JAVA_HOME/lib/
PATH=$PATH:$JAVA_HOME/bin
export PATH JAVA_HOME CLASSPATH

bbduk使用

ktrim=r模式下,一旦在读取中匹配参考kmer,该kmer和右侧的所有碱基将被修剪,只留下左侧的碱基;这是适配器修剪的正常模式。

k=23:在参考基因组中存储23-mers,

# 预处理
# step1 ./bbduk.sh  in1=() in2=() out1=() out2=() ref=adapters.fa ktrim=r k=23 mink=11 hdist=1 minlen=50 tpe tbo
./bbduk.sh  in1=/home/yanziming/vicent/data_set/synthetic_metagenomic_yeast/shotgun/SRR1262938/SRR1262938_1.fastq in2=/home/yanziming/vicent/data_set/synthetic_metagenomic_yeast/shotgun/SRR1262938/SRR1262938_2.fastq out1=/home/yanziming/vicent/data_set/synthetic_metagenomic_yeast/shotgun/SRR1262938/out_SRR1262938_1.fastq out2=/home/yanziming/vicent/data_set/synthetic_metagenomic_yeast/shotgun/SRR1262938/out_SRR1262938_2.fastq ref=/home/yanziming/vicent/bbmap/resources/adapters.fa ktrim=r k=23 mink=11 hdist=1 minlen=50 tpe tbo
# step2 ./bbduk.sh  in1=() in2=() out1=() out2=() trimq=10 qtrim=r ftm=5 minlen=50
./bbduk.sh  in1=/home/yanziming/vicent/data_set/synthetic_metagenomic_yeast/shotgun/SRR1262938/out_SRR1262938_1.fastq in2=/home/yanziming/vicent/data_set/synthetic_metagenomic_yeast/shotgun/SRR1262938/out_SRR1262938_2.fastq out1=/home/yanziming/vicent/data_set/synthetic_metagenomic_yeast/shotgun/SRR1262938/out1_SRR1262938_1.fastq out2=/home/yanziming/vicent/data_set/synthetic_metagenomic_yeast/shotgun/SRR1262938/out2_SRR1262938_2.fastq trimq=10 qtrim=r ftm=5 minlen=50
# step3  ./bbduk.sh  in1=() in2=() out1=() out2=() ftl=10
./bbduk.sh in1=/home/yanziming/vicent/data_set/synthetic_metagenomic_yeast/shotgun/SRR1262938/out1_SRR1262938_1.fastq in2=/home/yanziming/vicent/data_set/synthec_metagenomic_yeast/shotgun/SRR1262938/out2_SRR1262938_2.fastq out1=/home/yanziming/vicent/data_set/synthetic_metagenomic_yeast/shotgun/SRR1262938/finre_SRR1262938_1.fastq out2=/home/yanziming/vicent/data_set/synthetic_metagenomic_yeast/shotgun/SRR1262938/finre_SRR1262938_2.fastq ftl=10

shotgun数据

image-20230220130645498

HiC数据

image-20230221182226799


相关文章
|
安全 Linux iOS开发
Anaconda下载及安装保姆级教程(详细图文)
Anaconda下载及安装保姆级教程(详细图文)
27899 1
Anaconda下载及安装保姆级教程(详细图文)
|
10月前
|
Java 应用服务中间件 Linux
【Docker容器化技术】docker安装与部署、常用命令、容器数据卷、应用部署实战、Dockerfile、服务编排docker-compose、私有仓库
本文主要讲解了Docker的安装与部署、常用命令、容器数据卷、应用部署实战、Dockerfile、服务编排docker-compose、私有仓库以及Docker容器虚拟化与传统虚拟机比较。
11625 38
【Docker容器化技术】docker安装与部署、常用命令、容器数据卷、应用部署实战、Dockerfile、服务编排docker-compose、私有仓库
|
存储 开发者 Docker
|
5月前
|
缓存 运维 安全
2025 年 3 个最佳 WordPress 托管平台推荐
2025年,WordPress托管平台的选择对网站成功至关重要。本文推荐三大优质平台:WebSoft9,以企业级安全和开源优化见长;Hostinger,高性价比且新手友好;Bluehost,官方认证稳定性强。根据用户需求,WebSoft9适合技术要求高的企业,Hostinger适配预算有限的个人,Bluehost则面向追求稳定的中小企业。综合评估网站规模、技术和预算,选择最适合的平台可显著提升效率与安全性。
244 1
|
搜索推荐 Linux Shell
在Linux中,如何创建一个新用户?
在Linux中,如何创建一个新用户?
|
数据采集 存储 索引
转录组分析丨一套完整的操作流程简单案例(上)
转录组分析丨一套完整的操作流程简单案例
|
API Python
首先,我们导入了`http.client`模块,它是Python标准库中的一个模块,用于创建和发送HTTP请求。
首先,我们导入了`http.client`模块,它是Python标准库中的一个模块,用于创建和发送HTTP请求。
|
存储
STM32--ADC模数转换
STM32--ADC模数转换
312 0
|
数据库
利用massdatabase包提取物种KEGG通路与基因/化合物对应信息
最近手头处理一批代谢组数据, 想基于几十个关键差异代谢物代谢物进行下KEGG富集,能想到有两种方式解决,一种常用方式就是基于MetaboAnalyst在线富集,另一种就是解析出该物种的通路与代谢物的对应关系文件,然后用Y叔叔的Clusterprofiler包富集。经一番搜索,massdatabase包可帮我们轻松获得这个文件。 作者:凯凯何_Boy 链接:https://www.jianshu.com/p/654784925903 来源:简书 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
638 1
|
机器学习/深度学习 数据可视化 数据挖掘
8种交叉验证类型的深入解释和可视化介绍
8种交叉验证类型的深入解释和可视化介绍
607 3
8种交叉验证类型的深入解释和可视化介绍