JBrowse使用说明:参考基因组准备-阿里云开发者社区

开发者社区> 云计算> 正文

JBrowse使用说明:参考基因组准备

简介: 准备参考序列 注意:这一步必须在后续步骤之前运行。 通常,我们需要准备一个物种的基因组fasta文件,当然RNA和protein都是没有问题。通过prepare-refseqs.pl格式化生成的track,这为后续所有文件提供一个坐标,一直放大后参考序列的碱基也会显示出来。

准备参考序列

注意:这一步必须在后续步骤之前运行。

通常,我们需要准备一个物种的基因组fasta文件,当然RNA和protein都是没有问题。通过prepare-refseqs.pl格式化生成的track,这为后续所有文件提供一个坐标,一直放大后参考序列的碱基也会显示出来。生成的track 会为后续所有文件提供一个坐标,一直放大后参考序列的碱基也会显示出来。

主要用到工具是prepare-refseqs.pl,他的用法很多,如下:

prepare-refseqs.pl --gff <GFF file>  [options]
# OR:
prepare-refseqs.pl --fasta <file1> --fasta <file2>  [options]
# OR:
prepare-refseqs.pl --indexed_fasta <file>  [options]
# OR:
prepare-refseqs.pl --twobit <file>  [options]
# OR:
prepare-refseqs.pl --conf <JBrowse config file>  [options]
# OR:
prepare-refseqs.pl --sizes <sizes file>  [options]

更多内容用prepare-refseqs.pl -h查看。

# 以下操作在jbrowse家目录,序列文件根据实际情况修改
bin/prepare-refseqs.pl --fasta ~/lyrata/Sequence/Alyrata_384_v1.fa

这就会在当前生成data文件夹,直接访问I地址所看到的序列就来源于该文件夹。

准备特征序列

特征序列一般以"gff|gbk|bed"格式存放,用于注明序列的信息。所需工具为flatfile-to-json.pl

bin/flatfile-to-json.pl --gff ~/lyrata/Annotation/Alyrata_384_v2.1.gene.gff3 --trackType CanvasFeatures --trackLabel lyrata

结果是在当前目录下生成data,data里包括序列track配置文件. 同样可以用--out参数输出到指定文件夹。

bin/flatfile-to-json.pl --gff ~/Athalina/TAIR10/TAIR10_GFF3_genes.gtf --tracklabel gene --out ./Athaliana/

快捷搜索

除了在JBrowse上通过具体位置定位外,我们还可以0JBrowse上通过基因名快速定位到目标区间,只需要在上两步的基础上运行下面程序即可。

bin/generate-names.pl

推荐阅读:

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

分享:
云计算
使用钉钉扫一扫加入圈子
+ 订阅

时时分享云计算技术内容,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。

其他文章