高通量测序中的接头(adapter)到底是什么

简介: 高通量测序中的接头(adapter)到底是什么

首先放一张测序示意图,在DNA片段两端所加的序列即接头序列,也就是我们今天要讲述的主角。

微信截图_20230606163920.png

1 基本概念

1.1 adapter

接头,为一段已知的短核苷酸序列,用于链接未知的目标测序片段

1.2 index或barcode

几个碱基组成的寡核苷酸链,用于在混合测序时,区分不同样本

1.3 insert

待测序的目标序列,位于两个adapter之间

微信截图_20230606163952.png

测序片段包括几个部分:universal_adapter-insert-indexed_adapter。

测序由5'端开始,最开始的几个碱基无法测得,第一个adapter在数据输出时去除,由于测序读长的限制,第二个adapter通常测不到。

但是如果插入片段本身较短,测序会测穿,即会得到 insert-部分adapter 这样的read,这里的adapter便是我们常常提到的需要去除的接头部分。


2 序列信息

2.1 接头序列(示例)

universal adapter:

5’-AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT-3’

indexed adapter:

5’-GATCGGAAGAGCACACGTCTGAACTCCAGTCAC(barcode)ATCTCGTATGCCGTCTTCTGCTTG-3’

仔细看上面这对接头序列,universal adapter的3'末端的T与待测片段新增的A配对,那么剩余序列的反向互补链为

GATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTAGATCTCGGTGGTCGCCGTATCATT

与 indexed adapter 的前面12个碱基一致

GATCGGAAGAGCACACGTCTGAACTCCAGTCAC,即两段接头序列部分互补,形成Y型的结构。


2.2 index序列

可根据fastq序列中的信息获取

@HWI-ST1276:71:C1162ACXX:1:1101:1208:2458 1:N:0:CGATGT

fastq的格式信息不再赘述,第一行最末的 CGATGT 即本次测序所使用的index。

相关文章
|
2月前
|
芯片
基因测序的原理是什么
基因测序的原理是什么
漫谈高通量测序(1)历史与发展
漫谈高通量测序(1)历史与发展
252 0
漫谈高通量测序(1)历史与发展
|
11月前
|
算法 芯片
DNA测序原理:illumina和Pacbio对比介绍
DNA测序原理:illumina和Pacbio对比介绍
|
11月前
|
算法 Shell 芯片
illumina和Pacbio测序技术对比
illumina和Pacbio测序技术对比
|
数据可视化 数据挖掘 Python
跟着Science学数据分析:利用三代测序数据(PacBio)鉴定结构变异
跟着Science学数据分析:利用三代测序数据(PacBio)鉴定结构变异
|
数据采集 算法
测序质控和基因组组装原理
测序质控和基因组组装原理
|
机器学习/深度学习 存储 人工智能
人工智能预测RNA和DNA结合位点,以加速药物发现
人工智能预测RNA和DNA结合位点,以加速药物发现
171 0
|
传感器 芯片
漫谈高通量测序(3)Illumina文库构建
漫谈高通量测序(3)Illumina文库构建
482 0
漫谈高通量测序(3)Illumina文库构建
|
vr&ar
认识DNA测序(1)
认识DNA测序(1)
170 0
认识DNA测序(1)
|
传感器 机器学习/深度学习 编解码
领域最全!多传感器融合方法综述!(Camera/Lidar/Radar等多源异构数据)(下)
自动驾驶正成为影响未来行业的关键技术,传感器是自动驾驶系统中感知外部世界的关键,其协作性能直接决定自动驾驶车辆的安全性。本文主要讨论了近年来自动驾驶中多传感器融合的不同策略。分析了常规传感器的性能和多传感器融合的必要性,包括radar、激光雷达、摄像机、超声波、GPS、IMU和V2X。
领域最全!多传感器融合方法综述!(Camera/Lidar/Radar等多源异构数据)(下)