JBrowse使用说明:参考基因组准备

简介: 准备参考序列注意:这一步必须在后续步骤之前运行。通常,我们需要准备一个物种的基因组fasta文件,当然RNA和protein都是没有问题。通过prepare-refseqs.pl格式化生成的track,这为后续所有文件提供一个坐标,一直放大后参考序列的碱基也会显示出来。

准备参考序列

注意:这一步必须在后续步骤之前运行。

通常,我们需要准备一个物种的基因组fasta文件,当然RNA和protein都是没有问题。通过prepare-refseqs.pl格式化生成的track,这为后续所有文件提供一个坐标,一直放大后参考序列的碱基也会显示出来。生成的track 会为后续所有文件提供一个坐标,一直放大后参考序列的碱基也会显示出来。

主要用到工具是prepare-refseqs.pl,他的用法很多,如下:

prepare-refseqs.pl --gff <GFF file>  [options]
# OR:
prepare-refseqs.pl --fasta <file1> --fasta <file2>  [options]
# OR:
prepare-refseqs.pl --indexed_fasta <file>  [options]
# OR:
prepare-refseqs.pl --twobit <file>  [options]
# OR:
prepare-refseqs.pl --conf <JBrowse config file>  [options]
# OR:
prepare-refseqs.pl --sizes <sizes file>  [options]

更多内容用prepare-refseqs.pl -h查看。

# 以下操作在jbrowse家目录,序列文件根据实际情况修改
bin/prepare-refseqs.pl --fasta ~/lyrata/Sequence/Alyrata_384_v1.fa

这就会在当前生成data文件夹,直接访问I地址所看到的序列就来源于该文件夹。

准备特征序列

特征序列一般以"gff|gbk|bed"格式存放,用于注明序列的信息。所需工具为flatfile-to-json.pl

bin/flatfile-to-json.pl --gff ~/lyrata/Annotation/Alyrata_384_v2.1.gene.gff3 --trackType CanvasFeatures --trackLabel lyrata

结果是在当前目录下生成data,data里包括序列track配置文件. 同样可以用--out参数输出到指定文件夹。

bin/flatfile-to-json.pl --gff ~/Athalina/TAIR10/TAIR10_GFF3_genes.gtf --tracklabel gene --out ./Athaliana/

快捷搜索

除了在JBrowse上通过具体位置定位外,我们还可以0JBrowse上通过基因名快速定位到目标区间,只需要在上两步的基础上运行下面程序即可。

bin/generate-names.pl

推荐阅读:

目录
相关文章
|
4月前
|
JSON Java API
jjwt使用说明-笔记
这篇文章介绍了如何使用jjwt库在Java中生成和验证JSON Web Tokens (JWT)。文章提供了在Maven项目中添加jjwt依赖的步骤,生成token的方法,以及如何验证token的示例代码。此外,还包含了一些关于token标准载荷和自定义载荷的说明,以及如何处理token验证过程中可能遇到的异常。
jjwt使用说明-笔记
|
8月前
基因组组装:Hifiasm 使用教程
基因组组装:Hifiasm 使用教程
283 1
|
8月前
|
网络协议 Linux 网络安全
实验内容参考
实验内容参考
47 0
|
8月前
|
安全 物联网 API
学习TrustZone可以参考的资料
学习TrustZone可以参考的资料
186 0
|
弹性计算 前端开发 Linux
实验手册指导文档
主要介绍实验手册中的基本信息、实验资源配置、实验手册编写三项信息的填写规范,测试并提交审核和操作指南功能的使用方式。
|
安全 数据库 数据格式
EndnoteX9简介及基本教程使用说明
EndnoteX9简介及基本教程使用说明
515 0
EndnoteX9简介及基本教程使用说明
|
存储 弹性计算 Linux
阿里云基因公共数据集使用说明文档
基因常用参考注释文件、大型科研项目数据、以及最新测序平台标准等有价值的数据文件,分散且体量庞大,不利于传播和使用。以云的方式,我们建立集中开放的共享环境,免除数据重复下载和拷贝,同时借助阿里云的计算规模和产品技术,用户可以立刻开始分析研究工作。2019新型冠状病毒毒株数据已经上线,欢迎大家使用。
1841 0
阿里云基因公共数据集使用说明文档
简化基因组分析注意事项
简化基因组的方法一定要问清楚 建库前无论公司说的是RAD-seq,还是说的是GBS,都不要太当真,因为这两个名词定义越来越不清了,你只要问清楚,他们建库是检测哪个部分: 1)对单酶切位点邻近片段测序,如最初的RAD-seq 2)对酶切位点两翼片段测序,如Genoytping-by-Sequencing 具体看我写的这篇文章: 简化基因组的测序方法 关于建库的选择: 如果没有参考基因组: 使用RAD-seq双端测序,或者亲本50x以上进行组装,然后是GBS 如果有参考基因组: 使用GBS,这个很便宜。
1398 0
|
NoSQL Unix
一文尝试解决水稻参考基因组下载
昨天发了如何一步下载水稻泛基因组的contig序列,就有小伙伴在后台问我如何下载水稻最新版日本晴参考基因组序列。由于我主要是研究拟南芥(Arabidopsis thaliana), 默认都是去TAIR上下载TAIR10的参考序列和注释信息,对水稻其实没有多大了解。
2209 0
|
JavaScript Linux 前端开发

热门文章

最新文章

相关实验场景

更多