从NCBI获取物种线粒体基因信息

简介: 本分分享了一种从 NCBI获取物种基因组信息页面提取其线粒体基因信息的操作指南,以供参考

以查找斑胸草雀(zebra finch)线粒体基因为例:
打开NCBI("https://www.ncbi.nlm.nih.gov"), 选择基因组数据库(Gneome)数据库搜索物种名: "zebra finch"

斑胸草雀基因组表单

跳转到斑胸草雀的基因组详情页,往下翻阅
斑胸草雀基因组染色体详情表单(1)

斑胸草雀基因组染色体详情表单(2)

在斑胸草雀的参考基因组染色体详细表单中定位到Type列为MT的染色体(线粒体基因组),记下MT染色体的RefSeq(Scaffold序列号)NC_007897.1
接下来下载斑胸草雀的参考基因组的注释文件,点击Assembly跳转
斑胸草雀基因组表单
Assembly下载页面

在斑胸草雀基因组的Assembly页面点击Download Assemblies 选择RefSeq(参考基因组)的Genomic.gtf文件下载注释文件,下载后打开
下载的gtf文件

用less -S 命令查看 less -S GCF_003957565.2_bTaeGut1.4.pri_genomic.gtf ;红框的部分显示的是所有Scaffold序列号
斑胸草雀基因组gtf详情

用以下shell命令提取NC_007897.1序列(线粒体基因组)的的注释信息,然后提取出”gene"标签的内容,去重得到的便是线粒体基因名
cat GCF_003957565.2_bTaeGut1.4.pri_genomic.gtf | awk '{if($1 == "NC_007897.1"){print $0}}' | awk '{match($0,/.+gene ([^;]+)/,a);print a[1]}' | sort -u >GCF_003957565.2_bTaeGut1.4.pri.MitoFeatures.txt

目录
相关文章
|
6月前
|
机器学习/深度学习 数据采集 算法
乳腺癌治疗创新:特征权重分配引领精准医学
乳腺癌治疗创新:特征权重分配引领精准医学
80 1
|
网络协议 大数据 数据挖掘
文献丨多组学大数据构建小麦穗发育转录调控网络,TRN+GWAS挖掘关键转录调控(二)
文献丨多组学大数据构建小麦穗发育转录调控网络,TRN+GWAS挖掘关键转录调控(二)
|
2月前
|
存储 数据挖掘
单细胞|线粒体基因型和DNA可及性联合分析
单细胞|线粒体基因型和DNA可及性联合分析
79 15
单细胞|线粒体基因型和DNA可及性联合分析
|
5月前
|
人工智能 安全 搜索推荐
1.8B参数,阿里云首个联合DNA、RNA、蛋白质的生物大模型,涵盖16.9W物种
【6月更文挑战第14天】阿里云发布首个集成DNA、RNA和蛋白质数据的生物大模型LucaOne,拥有1.8B参数,涉及16.9万物种。LucaOne通过few-shot learning技术和streamlined downstream architecture实现多生物语言统一处理,提升生物系统理解与分析能力。该模型将加速生物信息学研究,推动生物医学应用,但同时也引发生物数据安全、预测偏差及AI伦理法律等问题的讨论。[论文链接](https://www.biorxiv.org/content/10.1101/2024.05.10.592927v1)
305 3
|
大数据 数据挖掘 Go
文献丨多组学大数据构建小麦穗发育转录调控网络,TRN+GWAS挖掘关键转录调控(一)
文献丨多组学大数据构建小麦穗发育转录调控网络,TRN+GWAS挖掘关键转录调控
|
数据可视化 大数据 数据挖掘
文献丨多组学大数据构建小麦穗发育转录调控网络,TRN+GWAS挖掘关键转录调控(三)
文献丨多组学大数据构建小麦穗发育转录调控网络,TRN+GWAS挖掘关键转录调控(三)
|
6月前
|
芯片
基因测序的原理是什么
基因测序的原理是什么
|
数据库
生信分析|基因组倍型鉴定
生信分析|基因组倍型鉴定
169 0
|
传感器 数据采集 人工智能
人体行为足力特征分析及其应用研究_kaic
随着社会现代化的发展和科技的不断进步,我国航天事业蓬勃发展,与此同时产生了很多亟待解决的难题,康复医疗成为航天医学和康复领域的重要课题之一。载人航天实践证明,失重对航天员生理功能有很大影响,这不仅涉及到航天员完成任务的安全性,同时会制约航天员返回地球后的再适应能力。这种因失重产生的生理问题与老年人的生理机能退化有相似之处,老年人摔倒是社会迫切需要面对的另一重大社会问题。老年人群体的跌倒发生率最高且后果严重,这不仅会导致高龄老年人安全感的严重缺失,还会大量消耗医疗服务资源。因此,开展助老防摔装备的研究是目前医疗和社会领域的必要发展方向,它有助于减少老年人跌倒所带来的生命危险.。
[数据科学] 通过基因表达监测进行肿瘤预测
[数据科学] 通过基因表达监测进行肿瘤预测
159 0
[数据科学] 通过基因表达监测进行肿瘤预测