认识DNA测序(1)

简介: 认识DNA测序(1)

Sanger测序

Sanger法测序又称一代测序,在1977年由Frederick Sanger和他的同事首次开发后,它成为了之后40多年里使用最广泛的测序方法。

62cc064e09793bcee8ac413c406c7426_640_wx_fmt=png&wxfrom=5&wx_lazy=1&wx_co=1.png

Sanger

主要发明人Frederick Sanger (1918.8.13 – 2013.11.19),英国生物化学家,两次获得诺贝尔化学奖,1958年,他因在蛋白质测序领域的贡献而获得该奖,1980年,他与Walter Gilbert因发明了首个DNA测序技术(至今仍在广泛使用)共同分享了他的第二个奖。

冷知识: 测序技术的发展是蛋白质先于RNA,再先于DNA,而Sanger的研究也是顺着这条线,遗憾的是强如Sanger这样的大神在RNA测序的研究上败给了竞争对手,文章被抢发,导致自1958年获得诺奖后陷入了一段低潮,直到1977年才在DNA测序领域取得重大突破,重拾诺奖,上演王者归来。

Sanger测序法在成为最终版本双脱氧核苷酸法之前经历了一系列进化过程,DNA测序最开始的方法也是效仿蛋白质测序的方法,使用酶将核酸切割为大小不同的片段,然后分离片段中的核苷酸。随着合成生物学的发展,核酸引物(primer)的出现,Sanger测序法的前身加减测序法出现了。如图所示,首先利用测序引物结合模板,然后用四种脱氧核苷酸复制模板,其中一种脱氧核苷酸带标记的,理想情况下,这种合成应该是不同步的,并且尽可能随机,这样可以形成最大数量的不同长度的寡核苷酸,以此来作为测序复合体。对于“减法”,就是加入三种脱氧核苷酸和DNA聚合酶,如果是dATP缺失的,就会在为A的前一位停止反应;对于“加法”,就是加入单个脱氧核苷酸和DNA外切酶,如果加入dATP,DNA外切酶会在A这一位停止切割。综合这两种方法,可以得到一个较为准备的结果。

07255e532480ac3e6636fd5ab6f6aebb_640_wx_fmt=png&wxfrom=5&wx_lazy=1&wx_co=1.png

“加减法”原理图

ffb855d3eace05fcf3fc7f77e7deae61_640_wx_fmt=png&wxfrom=5&wx_lazy=1&wx_co=1.png

“加减法”胶图

但是“加减法”也有其受限条件,最大的限制就是测序复合物的形成,在实际测序中发现,并不是总会得到所有情况的标记复合物,的标记还是会有一定的偏好性,导致一些复合物的缺失。

1977年,Sanger在PNAS上发表了其诺奖级别的文章,双脱氧核苷酸测序法。

720596d8420367808808630acd3ba585_640_wx_fmt=png&wxfrom=5&wx_lazy=1&wx_co=1.png

经典的链终止方法需要单链 DNA 模板、DNA 引物、DNA 聚合酶、正常的脱氧核苷酸三磷酸 (dNTP) 和修饰的二脱氧核苷酸三磷酸 (ddNTP),ddNTP用来终止 DNA 链的延伸。(如图所示)。DNA 样品分为四个独立的测序反应,包含所有四种标准脱氧核苷酸(dATP、dGTP、dCTP 和 dTTP)和 DNA 聚合酶。每个反应只添加四种双脱氧核苷酸(ddATP、ddGTP、ddCTP 或 ddTTP)中的一种,而其他添加的核苷酸是普通核苷酸。脱氧核苷酸浓度应比相应的双脱氧核苷酸(例如 0.5mM dTTP:0.005mM ddTTP)高约 100 倍,以允许产生足够的片段。延伸结果热变性后进行PAGE凝胶电泳,如图所示,通道中的暗带表示二脱氧核苷酸(ddATP、ddGTP、ddCTP或ddTTP)掺入后链终止的DNA片段。然后,从下到上,利用4个链之间不同条带的相对位置来读取DNA序列。

1fc3556b35aa0ec3ab8033d3ba462619_640_wx_fmt=png&wxfrom=5&wx_lazy=1&wx_co=1.png

双脱氧核苷酸测序法原理图

fbcdd0f728649dd88aa5b73f9503485a_640_wx_fmt=png&wxfrom=5&wx_lazy=1&wx_co=1.png

双脱氧核苷酸测序法胶图

自从Sanger利用双脱氧核苷酸进行DNA测序的核心思路提出后,在此基础上DNA测序蓬勃发展。1986年开发了带荧光标记的ddNTP,并进行了商业化,后来整合了微流控和自动化设备后,Sanger测序仪逐步完善为现在的样子。

d29704d75fcf78d5ec28e71b5c244ecf_640_wx_fmt=png&wxfrom=5&wx_lazy=1&wx_co=1.png

自动化仪器

饶毅老师称孟德尔为孤独的天才,那么Sanger就是内卷的天才。其独特的实验设计展现了超高的逻辑能力和智商,再看其成果产出也可谓分秒必争,Sanger解析了第一个简单生物噬菌体ΦX174的基因组并发表在Nature,轰轰烈烈的基因组测序浪潮由此开始。1992年,威康基金会和医学研究委员会成立了桑格中心(现在的桑格研究所),成为目前世界最领先的基因组研究机构之一。桑格于2013年11月19日在剑桥的阿登布鲁克医院(Addenbrooke’s Hospital)睡梦中去世。正如他自己在讣告中所指出的那样,他曾把自己描述为“只是一个在实验室里混日子的家伙”,“在学术上并不出色”。

0340da73bb2b066f8d39328b5c6f265e_640_wx_fmt=png&wxfrom=5&wx_lazy=1&wx_co=1.png

桑格研究所

也许天才真的对文章没有兴趣,天才努力奋斗,只是想给文章一个安稳的家而已。

参考文献

Sanger sequencing - Wikipedia

Frederick Sanger - Wikipedia

The path to sequencing nucleic acids (whatisbiotechnology.org)

Sanger F, Nicklen S, Coulson AR (December 1977). "DNA sequencing with chain-terminating inhibitors". Proceedings of the National Academy of Sciences of the United States of America. 74 (12): 5463–5467.

Sanger, F. & Coulson, A. R. (1975) J. Mol. Blol. 94, 441-448.

Sanger, F., Air, G. M., Barrell, B. G., Brown, N. L., Coulson, A.R., Fiddes, J. C., Hutchison, C. A., Slocombe, P. M. & Smith, M.(1977) Nature 265,687-695.

Smith LM, Sanders JZ, Kaiser RJ, Hughes P, Dodd C, Connell CR, et al. (1986). "Fluorescence detection in automated DNA sequence analysis". Nature. 321 (6071): 674–679.

相关文章
|
2月前
|
存储 数据挖掘
单细胞|线粒体基因型和DNA可及性联合分析
单细胞|线粒体基因型和DNA可及性联合分析
79 15
单细胞|线粒体基因型和DNA可及性联合分析
|
5月前
|
人工智能 安全 搜索推荐
1.8B参数,阿里云首个联合DNA、RNA、蛋白质的生物大模型,涵盖16.9W物种
【6月更文挑战第14天】阿里云发布首个集成DNA、RNA和蛋白质数据的生物大模型LucaOne,拥有1.8B参数,涉及16.9万物种。LucaOne通过few-shot learning技术和streamlined downstream architecture实现多生物语言统一处理,提升生物系统理解与分析能力。该模型将加速生物信息学研究,推动生物医学应用,但同时也引发生物数据安全、预测偏差及AI伦理法律等问题的讨论。[论文链接](https://www.biorxiv.org/content/10.1101/2024.05.10.592927v1)
306 3
|
存储 前端开发 安全
高通量基因测序在药物研发和靶向治疗中的应用(一)
高通量基因测序在药物研发和靶向治疗中的应用(一)
965 0
|
6月前
|
芯片
基因测序的原理是什么
基因测序的原理是什么
|
6月前
|
数据挖掘 数据库
基因测序的业务流程
基因测序的业务流程
|
算法 芯片
DNA测序原理:illumina和Pacbio对比介绍
DNA测序原理:illumina和Pacbio对比介绍
|
人工智能 算法 前端开发
高通量基因测序在药物研发和靶向治疗中的应用(二)
高通量基因测序在药物研发和靶向治疗中的应用(二)
562 0
DNA methyltransferase,DNMT
DNMT(DNA methyltransferase)是一种酶,主要负责将甲基基团(CH3)添加到DNA分子中特定的CpG位点上,从而实现DNA甲基化。DNMT在基因表达调控、细胞分化和疾病发生等方面具有重要作用。
62 1
|
算法 Shell 芯片
illumina和Pacbio测序技术对比
illumina和Pacbio测序技术对比
|
机器学习/深度学习 安全 数据挖掘
用于 DNA 测序的机器学习模型,理论上可以解码任何测序读数中所编码的数据值
用于 DNA 测序的机器学习模型,理论上可以解码任何测序读数中所编码的数据值
171 0
用于 DNA 测序的机器学习模型,理论上可以解码任何测序读数中所编码的数据值