每日文献:2018-01-11

简介: SV2: 从全基因组上找到更好结构变异原文题目:SV2: Accurate Structural Variation Genotyping and De Novo Mutation Detection from Whole Genomes原文地址: https://academic.

SV2: 从全基因组上找到更好结构变异

原文题目:SV2: Accurate Structural Variation Genotyping and De Novo Mutation Detection from Whole Genomes
原文地址: https://academic.oup.com/bioinformatics/advance-article/doi/10.1093/bioinformatics/btx813/4781690
软件地址:https://github.com/dantaki/SV2

从全基因组的短读序列中找到结构变异(structural variation)是比较容易出错的, 也就对群体研究,基于家族的疾病研究提出了挑战.

作者开发了SV2, 使用机器学习的方法用来从双端测序数据中寻找缺失和重复部分. SV2能够整合其他结构变异算法找出的变异结果,从中找出比较一致的数据集,保证比较高的准确性,也能从头检测变异.目前在GitHub上已经有18个星了

img_d569ef72505ea54bf093d72614b8f578.png
流程图

长江流域附近拟南芥的适应情况

原文题目: Adaptation of Arabidopsis thaliana to the Yangtze River basin
原文地址: https://genomebiology.biomedcentral.com/articles/10.1186/s13059-017-1378-9

植物需要适应不断变化的环境. 通过研究某个植物近期的扩张情况,能够帮助理解物种是如何通过进化来克服环境因素. 物种如何适应环境变化是一个非常重要的生物学, 只不过一致无法得到有效的解决. 拟南芥是非常不错的模式植物能够用于研究这个问题. 它最早起源于伊比利亚半岛(the Iberian Peninsula )和南非(North Africa), 然而目前已经在很多地方都能见到他的身影,比如说长江流域.

作者找到该流域附近的118株拟南芥,进行高通量测序,作者发现长江流域的拟南芥群体比较特殊, 从61,409年前分化而来,基因流(gene flow)有着两个不同的时间节点,最后在上千年前在长江开始扩张. 正向筛选揭示了生物学调节进程,比如开花时间,免疫和防御响应过程,这些都和进化时间相关.尤其是,他们发现了开花时间基因SVP对拟南芥适应长江流域的帮助最大,.

img_81fca54ffd520a9a90674e639531d241.png
美图欣赏

我要尝试复现一下这篇文章的工作

目录
相关文章
每日文献:2018-02-27
如何使用高通量测序检测T-DNA插入 之前拿到了一批混池测序的数据,师兄除了让我帮他找一个突变位点,还让我顺便检查下基因组上的T-DNA插入。我去查了一下相关资料,已经有人那么干了,这里简要说明一下步骤。
977 0
每日文献:2018-02-24
自然选择的分子印迹(精读第三天) 由于最近不知不觉开始涉及群体遗传学,所以准备精读(其实就是原文翻译)一篇review尽力去了解这个我陌生的领域。文章原标题为Molecular Signatures of Natural Selection, 作者Rasmus Nielsen。
1024 0
|
自然语言处理
每日文献:2018-02-23
自然选择的分子印迹(精读第二天) 由于最近不知不觉开始涉及群体遗传学,所以准备精读(其实就是原文翻译)一篇review尽力去了解这个我陌生的领域。文章原标题为Molecular Signatures of Natural Selection, 作者Rasmus Nielsen。
877 0
每日文献:2018-02-20
自然选择的分子印迹(精读第一天) 由于最近不知不觉开始涉及群体遗传学,所以准备精读(其实就是原文翻译)一篇review尽力去了解这个我陌生的领域。文章原标题为Molecular Signatures of Natural Selection, 作者Rasmus Nielsen。
723 0
|
Perl
每日文献:2018-01-29
原文标题:hppRNA—a Snakemake-based handy parameter-free pipeline for RNA-Seq analysis of numerous samples 原文地址: https://academic.
1010 0
每日文献:2018-01-25
原文标题:APAtrap: identification and quantification of alternative polyadenylation sites from RNA-seq data 工具网址:https://sourceforge.net/projects/apatrap/ 可变多聚腺苷酸 (APA)逐渐地被认为在转录组多样性和基因表达调控中起到重要的作用。
931 0
|
数据库
每日文献:2018-01-24
Nature Genetics:水稻泛基因组文章继续解读 原文标题: Pan-genome analysis highlights the extent of genomic variation in cultivated and wild rice 原文地址: https://www.nature.com/articles/s41588-018-0041-z 今天要读部分是我看到这篇文章才接触到的一个概念基因的PAV(presence-absence variation)突变, 也是这篇文章对66个物种深度测序组装contig的主要用途。
1136 0
每日文献:2018-01-23
Nature Genetics:水稻泛基因组文章继续解读 原文标题: Pan-genome analysis highlights the extent of genomic variation in cultivated and wild rice 原文地址: https://www.nature.com/articles/s41588-018-0041-z 今天看的部分是【Identification of functionally diverse alleles】,也就是找到功能变化等位基因。
892 0
每日文献:2018-01-22
植物基因组的同线性和共线性 原文题目:Synteny and Collinearity in Plant Genomes 先明确两个概念,虽然synteny和collineraity翻译之后都有线性,但是要注意两者的联系和区别: 同线性(syn...
917 0
每日文献:2018-01-19
Nature Genetics:水稻泛基因组文章继续解读 原文标题: Pan-genome analysis highlights the extent of genomic variation in cultivated and wild rice 原文地址: https://www.nature.com/articles/s41588-018-0041-z 在组装完66个品系水稻的contig后,也找到了变异信息如SNP/InDel, SV等,下面的工作就是从各种角度对这些变异信息继续解读。
935 0