每日文献:2018-01-08

简介: Tools for mapping high-throughput sequencing data2017年过去了,大家都在总结过去的一年发生的故事,网易云音乐告诉你一年听了哪些歌,支付宝告诉你花了多少钱。

Tools for mapping high-throughput sequencing data

2017年过去了,大家都在总结过去的一年发生的故事,网易云音乐告诉你一年听了哪些歌,支付宝告诉你花了多少钱。但是最让我不可思议的是一张图片的更新。

img_5d39b92ffc783880d05f7b2277affbff.png
2018年比对软件年鉴

这张图的历史可以追溯到到6年前,bioinformatics的一篇文章 Tools for mapping high-throughput sequencing data。过去10年中高通量测序技术的快速发展,比如说DNA-Seq,ChIP-Seq, RNA-Seq, BS-Seq等,使得如何将测序得到的数据又快又准的比对到参考基因组方便下游分析成了刚需。为了解决这个问题,市面上出现了大量的比对软件,良莠不齐。

为了方便大家选择合适的软件,该文章把从2001年开始出现的比对软件都做了一次汇总,于是得到了下图:

img_c79b14aa7e666d329f45da5f68dc6dc8.png
2013年比对软件年鉴

很多类似的整理在发表文章后就会处于无人维护的状态,好一点的情况式能打开网页,就是数据旧了点,差一点就是404 NOT FOUND。而这篇文章却能坚持到现在,每年都更新,一方面说明发表文章的团队非常的良心,当然这也有可能说明一个问题: 比对软件的选择似乎成了习惯,BWA, Bowtie, TopHat, HISAT2, STAR里面选吧。于是除非有重大算法突破,不然很拿出现新的比对软件了。

让我们看下这个最新的RNA-Seq比对软件--DART吧

DART: a fast and accurate RNA-seq mapper with a divide and conquer strategy

DART是最近刚发表在bioinformatics上的RNA-Seq比对软件,名字全称是Division based Alignment for RNA-Seq Transcripts, 它能够不需要任何注释信息就可以进行剪切联配。这个工具和之前基于seed和动态规划不同,DART将要给read分成一个和多个片段代替了seed拓展一步,使得速度变得更快,还保证了准确性。

img_950b40a3d593d21197a70bb79e5320f9.png
性能测试图

从官方提供的测序来看,软件还是比较吃内存的,8G的笔记本看来是带不动,只能继续用HISAT2了。

GitHub项目地址: https://github.com/hsinnan75/DART

PS: 我还没有具体测试过。

目录
相关文章
每日文献:2018-02-27
如何使用高通量测序检测T-DNA插入 之前拿到了一批混池测序的数据,师兄除了让我帮他找一个突变位点,还让我顺便检查下基因组上的T-DNA插入。我去查了一下相关资料,已经有人那么干了,这里简要说明一下步骤。
977 0
每日文献:2018-02-24
自然选择的分子印迹(精读第三天) 由于最近不知不觉开始涉及群体遗传学,所以准备精读(其实就是原文翻译)一篇review尽力去了解这个我陌生的领域。文章原标题为Molecular Signatures of Natural Selection, 作者Rasmus Nielsen。
1024 0
|
自然语言处理
每日文献:2018-02-23
自然选择的分子印迹(精读第二天) 由于最近不知不觉开始涉及群体遗传学,所以准备精读(其实就是原文翻译)一篇review尽力去了解这个我陌生的领域。文章原标题为Molecular Signatures of Natural Selection, 作者Rasmus Nielsen。
877 0
每日文献:2018-02-20
自然选择的分子印迹(精读第一天) 由于最近不知不觉开始涉及群体遗传学,所以准备精读(其实就是原文翻译)一篇review尽力去了解这个我陌生的领域。文章原标题为Molecular Signatures of Natural Selection, 作者Rasmus Nielsen。
723 0
|
Perl
每日文献:2018-01-29
原文标题:hppRNA—a Snakemake-based handy parameter-free pipeline for RNA-Seq analysis of numerous samples 原文地址: https://academic.
1010 0
每日文献:2018-01-25
原文标题:APAtrap: identification and quantification of alternative polyadenylation sites from RNA-seq data 工具网址:https://sourceforge.net/projects/apatrap/ 可变多聚腺苷酸 (APA)逐渐地被认为在转录组多样性和基因表达调控中起到重要的作用。
931 0
|
数据库
每日文献:2018-01-24
Nature Genetics:水稻泛基因组文章继续解读 原文标题: Pan-genome analysis highlights the extent of genomic variation in cultivated and wild rice 原文地址: https://www.nature.com/articles/s41588-018-0041-z 今天要读部分是我看到这篇文章才接触到的一个概念基因的PAV(presence-absence variation)突变, 也是这篇文章对66个物种深度测序组装contig的主要用途。
1136 0
每日文献:2018-01-22
植物基因组的同线性和共线性 原文题目:Synteny and Collinearity in Plant Genomes 先明确两个概念,虽然synteny和collineraity翻译之后都有线性,但是要注意两者的联系和区别: 同线性(syn...
917 0
每日文献:2018-01-19
Nature Genetics:水稻泛基因组文章继续解读 原文标题: Pan-genome analysis highlights the extent of genomic variation in cultivated and wild rice 原文地址: https://www.nature.com/articles/s41588-018-0041-z 在组装完66个品系水稻的contig后,也找到了变异信息如SNP/InDel, SV等,下面的工作就是从各种角度对这些变异信息继续解读。
935 0
每日文献: 2018-01-16
Nature Genetics:水稻泛基因组研究方法解读 原文标题: Pan-genome analysis highlights the extent of genomic variation in cultivated and wild rice 原文地址: https://www.nature.com/articles/s41588-018-0041-z 由于目前课题和自然变异关系比较大,所以解读一下这篇文章在深度测序(约等于100X)组装66个水稻品种后是如何寻找变异,以及如何验证这些变异的质量。
891 0