以查找斑胸草雀(zebra finch)线粒体基因为例:
打开NCBI("https://www.ncbi.nlm.nih.gov"), 选择基因组数据库(Gneome)数据库搜索物种名: "zebra finch"
跳转到斑胸草雀的基因组详情页,往下翻阅
在斑胸草雀的参考基因组染色体详细表单中定位到Type列为MT的染色体(线粒体基因组),记下MT染色体的RefSeq(Scaffold序列号)NC_007897.1
接下来下载斑胸草雀的参考基因组的注释文件,点击Assembly跳转
在斑胸草雀基因组的Assembly页面点击Download Assemblies 选择RefSeq(参考基因组)的Genomic.gtf文件下载注释文件,下载后打开
用less -S 命令查看 less -S GCF_003957565.2_bTaeGut1.4.pri_genomic.gtf
;红框的部分显示的是所有Scaffold序列号
用以下shell命令提取NC_007897.1序列(线粒体基因组)的的注释信息,然后提取出”gene"标签的内容,去重得到的便是线粒体基因名cat GCF_003957565.2_bTaeGut1.4.pri_genomic.gtf | awk '{if($1 == "NC_007897.1"){print $0}}' | awk '{match($0,/.+gene ([^;]+)/,a);print a[1]}' | sort -u >GCF_003957565.2_bTaeGut1.4.pri.MitoFeatures.txt