GFF文件格式

简介: GFF文件格式

GFF(General Feature Format)是文本文件,是用来记录基因特征的文件,目前最新的版本是gff3版本。

下面是苹果GFF文件开头的一部分,我也将以此为例

##gff-version 3
1 GDDH13  gene  6557  19041 . - . ID=MD01G0000000;biotype=protein_coding;gene_id=MD01G0000000;logic_name=genes_gddh
1 GDDH13  mRNA  6557  19041 . - . ID=MD01G0000000;Parent=MD01G0000000;biotype=protein_coding;transcript_id=MD01G0000000
1 GDDH13  three_prime_UTR 6557  6930  . - . Parent=MD01G0000000
1 GDDH13  exon  6557  8110  . - . Parent=MD01G0000000;Name=MD01G0000000-E3;constitutive=1;ensembl_end_phase=-1;ensembl_phase=2;exon_id=MD01G0000000-E3;rank=3
1 GDDH13  CDS 6931  8110  . - 1 ID=MD01G0000000;Parent=MD01G0000000;protein_id=MD01G0000000
1 GDDH13  exon  9412  11077 . - . Parent=MD01G0000000;Name=MD01G0000000-E2;constitutive=1;ensembl_end_phase=2;ensembl_phase=1;exon_id=MD01G0000000-E2;rank=2
1 GDDH13  CDS 9412  11077 . - 2 ID=MD01G0000000;Parent=MD01G0000000;protein_id=MD01G0000000
1 GDDH13  CDS 18512 18884 . - 0 ID=MD01G0000000;Parent=MD01G0000000;protein_id=MD01G0000000
1 GDDH13  exon  18512 19041 . - . Parent=MD01G0000000;Name=MD01G0000000-E1;constitutive=1;ensembl_end_phase=1;ensembl_phase=-1;exon_id=MD01G0000000-E1;rank=1
1 GDDH13  five_prime_UTR  18885 19041 . - . Parent=MD01G0000000

首先gff文件由9列组成,列于列之间由\t隔开,\t你可能还不认识,它更为常见的是用在Excelcsv格式文件中作为列于列的分割符,你完全可以使用Excel将一个gff文件打开,因为他们组成是相同的,gff文件中,每一行称为一个feature,由#开头的行不记录feature信息,只用作注释。九列信息分别是:

  1. seqid  序列ID
  2. Source 资料来源
  3. Feature Type 功能的类型  比如基因、mRNA或外显子等
  4. Feature Start feature开始的位置
  5. Feature end feature结束的位置
  6. Score 得分,可以用来记录序列相似性等
  7. Strand 链的正负 +为正链,-为负链
  8. Phase 指示阅读框从何处开始,值为0、1、2中的一个,表示从这个特征开始到达下一个密码子的第一个碱基的碱基数目
  9. Atributes 这个特征的一些其他属性,通常会有一个唯一的ID


gff文件可用来绘制基因结构图,确定基因在染色体中的位置,又或者是用来将基因组比对到参考基因组上。

相关文章
XP-CLR分析笔记丨检测不同种群之间由于选择引起的差异信息,群体遗传学经典方法
XP-CLR分析笔记丨检测不同种群之间由于选择引起的差异信息,群体遗传学经典方法
QGS
(麒麟V10-arm)编译安装php-7.4及部分依赖
记(麒麟V10-arm)编译安装php-7.4及部分依赖
QGS
1658 0
(麒麟V10-arm)编译安装php-7.4及部分依赖
|
缓存 Linux Windows
Linux环境aspose插件word转pdf中文乱码解决方案
Linux环境aspose插件word转pdf中文乱码解决方案
2010 0
|
Ubuntu Python
Ubuntu安装pip并切换国内源
Ubuntu安装pip并切换国内源
3913 0
Ubuntu安装pip并切换国内源
|
11月前
|
物联网 5G 数据处理
|
10月前
|
数据采集 人工智能 自然语言处理
Midscene.js:AI 驱动的 UI 自动化测试框架,支持自然语言交互,生成可视化报告
Midscene.js 是一款基于 AI 技术的 UI 自动化测试框架,通过自然语言交互简化测试流程,支持动作执行、数据查询和页面断言,提供可视化报告,适用于多种应用场景。
2490 1
Midscene.js:AI 驱动的 UI 自动化测试框架,支持自然语言交互,生成可视化报告
|
存储 网络协议 Unix
NAS(Network Attached Storage)
NAS(Network Attached Storage)是一种网络存储设备,它可以通过网络连接提供数据存储和共享服务。NAS通常具有独立的操作系统和文件系统,可以通过网络协议(如NFS、CIFS、FTP等)提供文件共享、备份、存储等功能,这些功能可以被多个设备或用户同时访问和使用。
746 1
|
SQL 前端开发 Java
若依框架---PageHelper分页(一)
若依框架---PageHelper分页(一)
1908 0
|
缓存 Linux Android开发
[√]获取Android内存情况
[√]获取Android内存情况
297 0