从NCBI获取物种线粒体基因信息

简介: 本分分享了一种从 NCBI获取物种基因组信息页面提取其线粒体基因信息的操作指南,以供参考

以查找斑胸草雀(zebra finch)线粒体基因为例:
打开NCBI("https://www.ncbi.nlm.nih.gov"), 选择基因组数据库(Gneome)数据库搜索物种名: "zebra finch"

斑胸草雀基因组表单

跳转到斑胸草雀的基因组详情页,往下翻阅
斑胸草雀基因组染色体详情表单(1)

斑胸草雀基因组染色体详情表单(2)

在斑胸草雀的参考基因组染色体详细表单中定位到Type列为MT的染色体(线粒体基因组),记下MT染色体的RefSeq(Scaffold序列号)NC_007897.1
接下来下载斑胸草雀的参考基因组的注释文件,点击Assembly跳转
斑胸草雀基因组表单
Assembly下载页面

在斑胸草雀基因组的Assembly页面点击Download Assemblies 选择RefSeq(参考基因组)的Genomic.gtf文件下载注释文件,下载后打开
下载的gtf文件

用less -S 命令查看 less -S GCF_003957565.2_bTaeGut1.4.pri_genomic.gtf ;红框的部分显示的是所有Scaffold序列号
斑胸草雀基因组gtf详情

用以下shell命令提取NC_007897.1序列(线粒体基因组)的的注释信息,然后提取出”gene"标签的内容,去重得到的便是线粒体基因名
cat GCF_003957565.2_bTaeGut1.4.pri_genomic.gtf | awk '{if($1 == "NC_007897.1"){print $0}}' | awk '{match($0,/.+gene ([^;]+)/,a);print a[1]}' | sort -u >GCF_003957565.2_bTaeGut1.4.pri.MitoFeatures.txt

目录
相关文章
|
机器学习/深度学习 人工智能 负载均衡
基于 NVIDIA Megatron-Core 的 MoE LLM 实现和训练优化
本文将分享阿里云人工智能平台 PAI 团队与 NVIDIA Megatron-Core 团队在 MoE (Mixture of Experts) 大型语言模型(LLM)实现与训练优化上的创新工作。
|
数据采集 芯片
GWAS全基因组关联分析入门教程
GWAS全基因组关联分析入门教程
Threejs制作骨骼模型
这篇文章详细介绍了在Three.js中创建骨骼动画的过程,包括骨骼节点的创建、权重设置以及控制骨骼关节实现动态效果的步骤,并通过一个具体的圆柱体模型演示了如何添加和控制骨骼动画。
251 2
|
机器学习/深度学习 编解码 数据挖掘
Sentieon 应用教程 | 使用CNVscope进行CNV检测分析
CNVscope是Sentieon推出的一款基于机器学习的全基因组CNV分析检测模块。该模块主要用于检测大于5kb的拷贝数增加或缺失,方法是通过分析reads的深度信息,并结合断点检测等其他特征进行拷贝数判断。
156 1
|
运维 算法 安全
Linux下使用MD5SUM命令详解
Linux下使用MD5SUM命令详解
701 0
|
机器学习/深度学习 算法
m基于深度学习的QPSK调制解调系统频偏估计和补偿算法matlab仿真
MATLAB 2022a中展示了基于深度学习的QPSK调制解调系统频偏估计和补偿算法仿真结果。该算法运用神经网络模型实时估计并补偿无线通信中的频率偏移。QPSK调制将二进制信息映射到四个相位状态,解调通常采用相干解调。深度学习算法通过预处理、网络结构设计、损失函数选择和优化算法实现频偏估计。核心程序生成不同SNR下的信号,比较了有无频偏补偿的误码率,显示了补偿效果。
280 1
|
测试技术 Android开发
Android App获取不到pkgInfo信息问题原因
Android App获取不到pkgInfo信息问题原因
831 0
|
数据挖掘
2-华大时空组学分析软件 Spateo 空转数据基础分析用法示例
本分分享了使用华大时空组学分析软件 Spateo进行聚类、DE等简单空间转录组分析的用法示例,以供参考
1656 1
PSMC软件分析群体历史有效群体大小步骤(bcftools+PSMC))
PSMC软件分析群体历史有效群体大小步骤(bcftools+PSMC))
|
并行计算 算法 数据挖掘
GATK4丨如何设置线程数和内存大小?
GATK4丨如何设置线程数和内存大小?