DNA测序原理:illumina和Pacbio对比介绍

简介: DNA测序原理:illumina和Pacbio对比介绍

今天分享DNA测序技术和原理,包括illumina和pacbio测序原理、基本介绍和优缺点对比。

Illumina测序技术

  • 原理:边合成边测序
  • 测序长度:150bp
  • 通量:6TB

测序原理

观看网址:https://www.youtube.com/watch?v=fCd6B5HRaZ8

文库构建

  • DNA片段需要加接头修饰才能进行上机测序,这个过程称为二代测序的文库构建
  • 流程及其原理:末端修饰-添加接头-磁珠纯化-PCR扩增-磁珠纯化
  • 测序是以单链为单位的,建库完成后的每条DNA的单链均一端连有测序引物-Rd1Sp和P5,另一端为Rd2 SP、Index和P7。
  • Index用来区分不同的文库,因为测序仪一个run产生数据量巨大,由于实际情况不同,一次上机常会进行多个文库测序,因此需要加上Index来区分。

上机测序

  • 三个系统:

温度控制系统;酶控制系统;荧光信号收集系统

  • 过程:

首先以寡核苷酸为引物、文库片段为模板进行DNA复制,复制完成后解链,将文库片段洗去,留在流通池表面的为与文库模板互补的DNA链。

因为单链DNA另一端为不同的接头序列,可以与相邻的另一种寡核苷酸互补结合,之后进行“桥”式扩增。

桥式扩增后一个DNA簇都是由最初的一个文库模板复制而来,但是这时候P7上的序列与P5上的序列是分别从两端开始的,测序要保证每个片段一致性,因此再次解链线性化,切割并洗去P5上的DNA链,只留P7上的DNA单链。

加入测序引物Read1 SP和修饰过的DNA聚合酶,则在测序引物3’端开始DNA复制。

双末端测序,进行另一个方向的测序,洗掉前面复制合成的片段,从另一端进行序列读取。

测序数据

优缺点

  • 优点: 一次能够同时得到大量的序列数据,相比于一代测序技术,通量提高了成千上万倍;单条序列成本非常低廉
  • 缺点: 序列读长较短,Illumina平台最长为250-300bp

Pacbio测序技术

  • 原理:边合成边测序
  • 测序长度:30kb
  • 通量:20GB

测序原理

观看网址:https://www.youtube.com/watch?v=_lD8JyAbwEo

单分子实时测序SMRT

SMRT 中有很多 ZMW 小孔。ZMW(Zero-Mode Waveguides)孔,即零模波导孔。每一个SMRT Cell 中含有大量这种圆形纳米小孔,直径为50~100nm,该小孔利用了一种物理效应零模波导,外径比激发光波长小,当 DNA 分子进入小孔后,因激发光从孔底发出的光不能穿透小孔进入上方的溶液区,仅被限制在底部一个足以覆盖被检测 DNA 部分的区域,进而收集该区域的信号,将背景噪音降到最低。

在纳米孔底部,锚定着测序模板(DNA 单链)和 DNA 聚合酶,同时包含着四种被不同荧光基团修饰的 dNTP。由于每次添加的 dNTP 所携带的荧光颜色是不同的,在激光的激发下可以发出不同的荧光,根据散射出的荧光信号可以判断添加的碱基类型

HIFI reads

在这种测序模式下,酶读长一般大于插入片段长度,因此酶会绕着模板进行滚环测序,插入片段会被多次测序。单次测序中造成的随机测序错误,可以通过算法进行自我纠错校正,最终得到高准确度的 HiFi reads.

Pacbio优缺点

  • pacbio 的优点

1、超长读长

2、准确性高

3、测序速度快

  • pacbio 的缺点

1、数据量小,一张芯片目前最多只有 800 万个孔;

2、单分子测序原始数据的错误率高,需要重复测序降低错误率;

3、测序价格较高,SMRT 的成本是二代测序的 6-7 倍;

4、测序仪成本较高,不适合小规模组织购买;

5、提高准确性需要牺牲测序长度和数据量;

总结补充

1·第二代测序是基于PCR发展的高通量测序技术,第一代测序末端终止法,而二代测序使用可逆终止末端,能够实现边合成边测序。

2·特殊标记碱基的荧光信号是确定序列的关键,在测序过程中,必须将单DNA扩增成DNA簇,目的是增强信号。

3·若读取长度太长,基因簇的协同性降低,准确性下降,因此具有高通量,读长短的特点。

4·基因组DNA需要使用鸟枪法打成小片段,测序完成后拼装,而扩增子等小片段可以直接测序。

相关文章
|
2月前
|
安全
三维基因组|基因组结构 (2)
三维基因组|基因组结构 (2)
36 0
|
18天前
|
人工智能 安全 搜索推荐
1.8B参数,阿里云首个联合DNA、RNA、蛋白质的生物大模型,涵盖16.9W物种
【6月更文挑战第14天】阿里云发布首个集成DNA、RNA和蛋白质数据的生物大模型LucaOne,拥有1.8B参数,涉及16.9万物种。LucaOne通过few-shot learning技术和streamlined downstream architecture实现多生物语言统一处理,提升生物系统理解与分析能力。该模型将加速生物信息学研究,推动生物医学应用,但同时也引发生物数据安全、预测偏差及AI伦理法律等问题的讨论。[论文链接](https://www.biorxiv.org/content/10.1101/2024.05.10.592927v1)
39 3
|
2月前
|
芯片
基因测序的原理是什么
基因测序的原理是什么
|
11月前
|
算法 Shell 芯片
illumina和Pacbio测序技术对比
illumina和Pacbio测序技术对比
DNA methyltransferase,DNMT
DNMT(DNA methyltransferase)是一种酶,主要负责将甲基基团(CH3)添加到DNA分子中特定的CpG位点上,从而实现DNA甲基化。DNMT在基因表达调控、细胞分化和疾病发生等方面具有重要作用。
41 1
|
机器学习/深度学习 安全 数据挖掘
用于 DNA 测序的机器学习模型,理论上可以解码任何测序读数中所编码的数据值
用于 DNA 测序的机器学习模型,理论上可以解码任何测序读数中所编码的数据值
132 0
用于 DNA 测序的机器学习模型,理论上可以解码任何测序读数中所编码的数据值
|
数据可视化 数据挖掘 Python
跟着Science学数据分析:利用三代测序数据(PacBio)鉴定结构变异
跟着Science学数据分析:利用三代测序数据(PacBio)鉴定结构变异
|
数据库
3-华大时空组学分析软件 Spateo 细胞分割示例
本分示例了使用 华大时空组学分析软件 Spateo 基于SSDNA和 表达谱进行圈细胞的用法,以供参考
178 0
|
数据采集 算法
测序质控和基因组组装原理
测序质控和基因组组装原理
|
机器学习/深度学习 存储 人工智能
人工智能预测RNA和DNA结合位点,以加速药物发现
人工智能预测RNA和DNA结合位点,以加速药物发现
171 0