Nature Genetics:水稻泛基因组文章继续解读
原文标题: Pan-genome analysis highlights the extent of genomic variation in cultivated and wild rice
原文地址: https://www.nature.com/articles/s41588-018-0041-z
今天看的部分是【Identification of functionally diverse alleles】,也就是找到功能变化等位基因。
文章提到,有了深度测序组装的contig,就能更加精细的找到多种农艺性状相关的数量性状核苷酸(quantitative trait nucleotides, QTNs),还能追踪重要功能等位基因的驯化起源。为了证明这一点,作者选择了五个比较重要的QTL, Hd3a, COLD1, GW6a, TAC1, Sd1, 这些基因参与花期,耐冷,粒重,抽穗角度和株高。
野生稻(O. rufipogon) 中基本由这些基因的多态位点,但是由于founder effect,栽培稻中这些基因的多态位点的分布就比较有趣了。下面作者就开始对这种是看似意外也不太意外的分布进行了解释。
- TAC1: 所有野生稻基本上都是T, 而所有的粳稻里都是C(突变方向是T->C),这就是导致粳稻的抽穗角度比较小,这种株型能够非常适合密植,并且能够比较地接受光。因此这种突变就会人为保留下来。
- sd1: 是一个株高相关基因,野生稻基本都是G,而粳稻基本都是A,这种突变会倒是株高降低。这种突变是绿色革命时被人为保留。
除了这些已知的突变类型,其实还是有大量的变异值得研究。作者后面就开始关注发生在基因编码区的变异,并且尝试预测这种变异会带来的影响。根据泛基因组编码变异数据集,每个基因平均包括10个错义SNP位点和6个较大效应的多态位点,那么组合数就很多了。比如说在waxy里面,从7个具有代表性的单倍型中就找到了3个错义SNP。在Hd1的7个单倍型中找到了22个错义SNP,7个indel
作者还分析了这些突变位点在38个基因家族里全局性分布,不出乎意外的就是控制基本生物学过程的基因变异小于植物免疫相关的基因。
今日得到
- 拿到那么多突变怎么办,先找几个重要基因分析
- 随后按照基因组家族分布,比较不同生物学过程下的变异情况。
- 问题来了,如何预测潜在突变呢?