每日文献:2018-01-19

简介: Nature Genetics:水稻泛基因组文章继续解读原文标题: Pan-genome analysis highlights the extent of genomic variation in cultivated and wild rice原文地址: https://www.nature.com/articles/s41588-018-0041-z在组装完66个品系水稻的contig后,也找到了变异信息如SNP/InDel, SV等,下面的工作就是从各种角度对这些变异信息继续解读。

Nature Genetics:水稻泛基因组文章继续解读

原文标题: Pan-genome analysis highlights the extent of genomic variation in cultivated and wild rice
原文地址: https://www.nature.com/articles/s41588-018-0041-z

在组装完66个品系水稻的contig后,也找到了变异信息如SNP/InDel, SV等,下面的工作就是从各种角度对这些变异信息继续解读。

驯化和基因渗入(Domestication and introgression)

如果你手头上拿着多个物种的全基因组变异信息,那么你可以一言不合就建一个系统发育树。

img_8e7762f9dbee0ee70a0c4a6c24b58dfc.png
66个品种的邻接树

我们都尝试过用几天序列建树,那么全基因组变异信息建树是如何操作的呢?其实也比较粗暴,就是构建了66x66的SNP配对系数,然后用PHYLIP的neighbor软件构建进化发育树。你可能会觉得这样子会不会丢失很多信息,从而不太准确。其实只要你的大方向正确,反而不需要斤斤计较局部的得失。

那么建树有什么意义和好处呢?和之前的结果相互验证,表明自己选择的物种都是比较具有代表性,最起码能够分开。

随后又可以整一个驯化选择扫描(domestication selection scan)。 这个名词咋听起来一脸懵逼,其实和另一个词序列多态性核酸多态性有关,主要是衡量一个群体的多态性。最常用也是第一个提出的计算公式如下,由 NeiLi在1979年提出

img_a953eb88d51c2b4a57c1056b9ee5062f.png
序列多态性

公式你可能看不懂,但是知道概念后就可以用软件了,比如说MEGA,比如说R包PopGenome.

最后和之前的1529份低覆盖数据相比,找到了6个新的位点。当然作者也很谨慎,不太好说泛基因组的数据得到的结果更加有效,毕竟样本量也就是60.

img_08e685c597ae3ad0ec318dcd22b5b800.png
6个新的多态性位点

作者还对3种亚洲栽培稻(aus, aromatic , tropical japonica)在7个和水稻驯化相关位点进行进化上的分析,发现aus有点奇怪,不能完全被栽培稻分支上,这就说明aus 可能还没有完全驯化。

img_08fd99a70f9aca8ae5d7b583713df83c.png
不太合群的aus

此外,作者还发现几个籼稻往粳稻渗入的证据。 他们首先找到了807,139个在籼稻和温带粳稻高度差异的SNP。然后在热带粳稻里面查看这些位点的信息,将近16%的热带粳稻里面有籼稻的基因组渗入证据。尤其里面还有和温度耐受相关的位点OsTT1 (Os03g0387100)和大粒位点Os07g0505200

收获

  • 一个新的概念: 序列多样式 π
  • 一个新的全基因组建树方法: 序列相似矩阵计算后接着PHYLIP
  • 一个研究基因渗入的思想: 先找到明显有区别的两个品种的差异信息,然后在过渡型里看看差异性。
  • 一个吐槽: 要想富,先修路,少生XX多建树
目录
相关文章
每日文献:2018-02-27
如何使用高通量测序检测T-DNA插入 之前拿到了一批混池测序的数据,师兄除了让我帮他找一个突变位点,还让我顺便检查下基因组上的T-DNA插入。我去查了一下相关资料,已经有人那么干了,这里简要说明一下步骤。
973 0
每日文献:2018-02-24
自然选择的分子印迹(精读第三天) 由于最近不知不觉开始涉及群体遗传学,所以准备精读(其实就是原文翻译)一篇review尽力去了解这个我陌生的领域。文章原标题为Molecular Signatures of Natural Selection, 作者Rasmus Nielsen。
1021 0
|
自然语言处理
每日文献:2018-02-23
自然选择的分子印迹(精读第二天) 由于最近不知不觉开始涉及群体遗传学,所以准备精读(其实就是原文翻译)一篇review尽力去了解这个我陌生的领域。文章原标题为Molecular Signatures of Natural Selection, 作者Rasmus Nielsen。
873 0
每日文献:2018-02-20
自然选择的分子印迹(精读第一天) 由于最近不知不觉开始涉及群体遗传学,所以准备精读(其实就是原文翻译)一篇review尽力去了解这个我陌生的领域。文章原标题为Molecular Signatures of Natural Selection, 作者Rasmus Nielsen。
720 0
|
Perl
每日文献:2018-01-29
原文标题:hppRNA—a Snakemake-based handy parameter-free pipeline for RNA-Seq analysis of numerous samples 原文地址: https://academic.
1008 0
每日文献:2018-01-25
原文标题:APAtrap: identification and quantification of alternative polyadenylation sites from RNA-seq data 工具网址:https://sourceforge.net/projects/apatrap/ 可变多聚腺苷酸 (APA)逐渐地被认为在转录组多样性和基因表达调控中起到重要的作用。
928 0
|
数据库
每日文献:2018-01-24
Nature Genetics:水稻泛基因组文章继续解读 原文标题: Pan-genome analysis highlights the extent of genomic variation in cultivated and wild rice 原文地址: https://www.nature.com/articles/s41588-018-0041-z 今天要读部分是我看到这篇文章才接触到的一个概念基因的PAV(presence-absence variation)突变, 也是这篇文章对66个物种深度测序组装contig的主要用途。
1131 0
每日文献:2018-01-22
植物基因组的同线性和共线性 原文题目:Synteny and Collinearity in Plant Genomes 先明确两个概念,虽然synteny和collineraity翻译之后都有线性,但是要注意两者的联系和区别: 同线性(syn...
913 0
每日文献: 2018-01-16
Nature Genetics:水稻泛基因组研究方法解读 原文标题: Pan-genome analysis highlights the extent of genomic variation in cultivated and wild rice 原文地址: https://www.nature.com/articles/s41588-018-0041-z 由于目前课题和自然变异关系比较大,所以解读一下这篇文章在深度测序(约等于100X)组装66个水稻品种后是如何寻找变异,以及如何验证这些变异的质量。
888 0
|
Java
每日文献: 2018-01-15
高通量测序中的GC含量质量控制 原文标题: Summarizing and correcting the GC content bias in high-throughput sequencing 原文地址: https://academic.
1015 0