一条命令行区分Contigs中的真核原核序列

简介: 本文介绍一款可用于宏基因组中的分类小软件,简单一条命令可以将上游组装的Contigs进行原核与真核生物区分~

Github地址:https://github.com/patrickwest/EukRep

41b64f9b2f351bd31380bd0fff9b474.png

安装

  • Conda直接安装(python3环境)

conda create -y -n eukrep-env -c bioconda scikit-learn==0.19.2 eukrep

可以看到用到了python中的机器学习的包scikit-leran

  • 使用pip安装

$ pip install EukRep

使用

EukRep -h

cd8a23f6d566720030b110f9f2726c1.png

常用参数不多:

  • -i: 输入fasta文件
  • -o 输出文件
  • --min 设置最短序列,默认3kb
  • --model : 线性SVM训练模型
  • --seq_names:输出序列ID名称

默认-o 输出预测真核序列

EukRep -i <Sequences in Fasta format> -o <Eukaryote sequence output file>

加上--prokarya即可预测出原核生物的序列

EukRep -i <Sequences in Fasta format> -o <Eukaryote sequence output file> --prokarya <Prokaryote sequence output file>

获得真核生物Bins

Eukrep软件旨在用作后续Bining分析管道中的一部分,可用于获得高质量的真核生物的预测序列或者Binning,详细内容可以看“Genome-reconstruction for eukaryotes from complex natural microbial communities"(West et Al。)文中的方法部分(https://doi.org/10.1101/171355)

另外,作者也提供了一个workfolw例子:https://github.com/patrickwest/EukRep_Pipeline,有需要的可以试一下~~

相关文章
|
9月前
53.从键盘输入任意一串字符串,程序输出同样的一串字符,要求输出字符串中大小写相互转化,其他符号不变。如输入“a123BxC”,则输出“A123bXc”
53.从键盘输入任意一串字符串,程序输出同样的一串字符,要求输出字符串中大小写相互转化,其他符号不变。如输入“a123BxC”,则输出“A123bXc”
66 0
|
Python
Python|寻找比目标字母大的最小字母问题解决方法
Python|寻找比目标字母大的最小字母问题解决方法
179 4
|
iOS开发
快捷指令实现“随机单词”生成的指令
因为英语测试和日常工作需要,在记忆英语单词上煞费苦心,而且记忆单词是一件持之以恒的事情
414 0
|
算法 数据挖掘 Python
如何在 Python 中查找两个字符串之间的差异位置?
如何在 Python 中查找两个字符串之间的差异位置?
334 0
|
API Windows
[✔️]命令行选项的符号释义
[✔️]命令行选项的符号释义
113 0
|
PyTorch 算法框架/工具 Python
jupyter 输出向量自动省略了中间的值,如何查看完整的向量值
Jupyter 默认情况下会根据向量的长度来自动省略中间的值,以便在输出时能够更好地适应屏幕大小。如果想要查看完整的向量值,可以通过以下两种方式实现: 1. 使用 print() 函数显示完整的向量内容。这种方法适用于任何大小的向量,但是需要显式调用 print() 函数来输出向量。Jupyter 默认情况下会根据张量的长度来自动省略中间的值,以便在输出时能够更好地适应屏幕大小。如果想要查看完整的张量内容,可以通过以下两种方式实现: 1. 使用 print() 函数显示完整的张量内容。这种方法适用于任何大小的张量,但是需要显式调用 print() 函数来输出张量。
1374 0
Python 定义一个函数,接受任意三个数字并按顺序从小大输出
Python 定义一个函数,接受任意三个数字并按顺序从小大输出
% 批处理变量引导符
% 批处理变量引导符
104 0
|
Shell Linux Perl
linux shell之字符串的更具字符分割和删除字符和文本内容的删除以及内容是否匹配成功
linux shell之字符串的更具字符分割和删除字符和文本内容的删除以及内容是否匹配成功
213 0