一条命令行区分Contigs中的真核原核序列

简介: 本文介绍一款可用于宏基因组中的分类小软件,简单一条命令可以将上游组装的Contigs进行原核与真核生物区分~

Github地址:https://github.com/patrickwest/EukRep

41b64f9b2f351bd31380bd0fff9b474.png

安装

  • Conda直接安装(python3环境)

conda create -y -n eukrep-env -c bioconda scikit-learn==0.19.2 eukrep

可以看到用到了python中的机器学习的包scikit-leran

  • 使用pip安装

$ pip install EukRep

使用

EukRep -h

cd8a23f6d566720030b110f9f2726c1.png

常用参数不多:

  • -i: 输入fasta文件
  • -o 输出文件
  • --min 设置最短序列,默认3kb
  • --model : 线性SVM训练模型
  • --seq_names:输出序列ID名称

默认-o 输出预测真核序列

EukRep -i <Sequences in Fasta format> -o <Eukaryote sequence output file>

加上--prokarya即可预测出原核生物的序列

EukRep -i <Sequences in Fasta format> -o <Eukaryote sequence output file> --prokarya <Prokaryote sequence output file>

获得真核生物Bins

Eukrep软件旨在用作后续Bining分析管道中的一部分,可用于获得高质量的真核生物的预测序列或者Binning,详细内容可以看“Genome-reconstruction for eukaryotes from complex natural microbial communities"(West et Al。)文中的方法部分(https://doi.org/10.1101/171355)

另外,作者也提供了一个workfolw例子:https://github.com/patrickwest/EukRep_Pipeline,有需要的可以试一下~~

相关文章
|
11月前
|
人工智能 Linux 测试技术
NexaAI, 一行命令运行魔搭社区模型,首次在设备上运行 Qwen2-Audio
Qwen2-Audio是一个 70亿参数量 SOTA 多模态模型,可处理音频和文本输入。
895 8
|
机器学习/深度学习 数据采集 人工智能
Machine Learning机器学习之贝叶斯网络(BayesianNetwork)
Machine Learning机器学习之贝叶斯网络(BayesianNetwork)
|
数据库
ACN规则深度解密-全网最细的剖析
ACN规则深度解密-全网最细的剖析
|
存储 PHP 数据安全/隐私保护
Ueditor结合七牛云存储上传图片、附件和图片在线管理的实现和最新更新
最新下载地址: https://github.com/widuu/qiniu_ueditor_1.4.3 Ueditor七牛云存储版本 注意事项 老版本请查看 : https://github.com/widuu/qiniu_ueditor_1.
3305 0
|
开发框架 自然语言处理 前端开发
Fastadmin:乘时代热点之风,以 thinkphp 与 bootstrap 融合之力,开启高效后台开发新征程
【8月更文挑战第22天】在互联网飞速发展的今天,Fastadmin作为一款基于ThinkPHP与Bootstrap的高效后台开发框架,为开发者带来了前所未有的便捷。它融合两者优势,不仅利用ThinkPHP快速构建稳定Web应用,还借助Bootstrap实现美观的响应式界面设计。Fastadmin内置丰富的功能模块与插件,如权限管理、数据表格等,大幅提高开发效率。同时支持多语言,便于国际化应用开发。其清晰的代码结构易于扩展与维护,无论是小项目还是大型应用,都能助力开发者快速构建高质量后台系统。
361 2
|
数据采集 人工智能 搜索推荐
|
监控 应用服务中间件 数据库
Django 应用部署也太让人头疼了吧!但掌握这些,你就能轻松搞定,快来一探究竟!
【8月更文挑战第31天】作为一名开发者,将Django应用从开发环境顺利部署到生产环境至关重要。这涉及技术操作与实际考量,需确保应用稳定高效运行。从开发到部署至如DigitalOcean等云服务器,每一步——包括安装必要软件、配置数据库、使用Git上传代码、设置Nginx和Gunicorn、实施安全措施以及监控和日志记录——都需遵循最佳实践,以提供可靠的用户服务。
272 0
|
Kubernetes 搜索推荐 Docker
Kubernetes容器运行时:Containerd vs Docke
Kubernetes容器运行时:Containerd vs Docke
1692 5
|
存储 前端开发 JavaScript
状态管理(State Management):构建复杂应用的关键要素
在现代应用程序开发中,状态管理是一个至关重要的概念,它用于管理应用程序的数据和状态。无论您是开发Web应用、移动应用还是桌面应用,都需要有效的状态管理来确保应用程序的可维护性和可扩展性。在本博客中,我们将深入研究状态管理的定义、原则、工具和最佳实践,以及如何充分利用状态管理来构建复杂的应用程序。
928 0
|
前端开发
构建一个简单的React图片画廊应用
构建一个简单的React图片画廊应用
328 0