SV2: 从全基因组上找到更好结构变异
原文题目:SV2: Accurate Structural Variation Genotyping and De Novo Mutation Detection from Whole Genomes
原文地址: https://academic.oup.com/bioinformatics/advance-article/doi/10.1093/bioinformatics/btx813/4781690
软件地址:https://github.com/dantaki/SV2
从全基因组的短读序列中找到结构变异(structural variation)是比较容易出错的, 也就对群体研究,基于家族的疾病研究提出了挑战.
作者开发了SV2, 使用机器学习的方法用来从双端测序数据中寻找缺失和重复部分. SV2能够整合其他结构变异算法找出的变异结果,从中找出比较一致的数据集,保证比较高的准确性,也能从头检测变异.目前在GitHub上已经有18个星了
长江流域附近拟南芥的适应情况
原文题目: Adaptation of Arabidopsis thaliana to the Yangtze River basin
原文地址: https://genomebiology.biomedcentral.com/articles/10.1186/s13059-017-1378-9
植物需要适应不断变化的环境. 通过研究某个植物近期的扩张情况,能够帮助理解物种是如何通过进化来克服环境因素. 物种如何适应环境变化是一个非常重要的生物学, 只不过一致无法得到有效的解决. 拟南芥是非常不错的模式植物能够用于研究这个问题. 它最早起源于伊比利亚半岛(the Iberian Peninsula )和南非(North Africa), 然而目前已经在很多地方都能见到他的身影,比如说长江流域.
作者找到该流域附近的118株拟南芥,进行高通量测序,作者发现长江流域的拟南芥群体比较特殊, 从61,409年前分化而来,基因流(gene flow)有着两个不同的时间节点,最后在上千年前在长江开始扩张. 正向筛选揭示了生物学调节进程,比如开花时间,免疫和防御响应过程,这些都和进化时间相关.尤其是,他们发现了开花时间基因SVP对拟南芥适应长江流域的帮助最大,.
我要尝试复现一下这篇文章的工作