数学建模(6)-DNA限制性图谱的绘制

简介: DNA限制性图谱的绘制 ? 绘制DNA限制性图谱是遗传生物学中的重要问题。由于DNA分子很长,目前的实验技术无法对其进行直接测量,所以生物学家们需要把DNA分子切开,一段一段的来测量。

<?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office" />

DNA限制性图谱的绘制

?

绘制DNA限制性图谱是遗传生物学中的重要问题。由于DNA分子很长,目前的实验技术无法对其进行直接测量,所以生物学家们需要把DNA分子切开,一段一段的来测量。在切开的过程中,DNA片段在原先DNA分子上的排列顺序丢失了,如何找回这些片段的排列顺序是一个关键问题。

为了构造一张限制性图谱,生物学家用不同的生化技术获得关于图谱的间接的信息,然后采用组合方法用这些数据重构图谱。一种方法是用限制性酶来消化DNA分子。这些酶在限制性位点把DNA链切开,每种酶对应的限制性位点不一样。对于每一种酶,每个DNA分子可能有多个限制性位点,此时可以按照需要来选择切开某几个位点(不一定连续)。DNA分子被切开后,得到的每个片段的长度就是重构这些片段的原始顺序的基本信息。在多种获取这种信息的实验方法中,有一种广泛采用的方法:部分消化(the partial digest, PDP)方法。

PDP中,采用一种酶,通过实验得到任意两个限制性位点之间片段的长度。假设与使用的酶对应的限制性位点有n个, 通过大量实验,可得到n+2个点(n个位点加上两个端点)中任意两点之间的距离,共<?xml:namespace prefix = v ns = "urn:schemas-microsoft-com:vml" />个值。然后用这个距离来重构n个限制性位点的位置(解不一定唯一,两个端点对应于最长的距离)。若是线段上的点集中所有点之间距离的集合,PDP就是给定。下图给出了一个例子。

?

???????? 2??????? 3?????????? 4???????????? 5???? ???????2

?

???????

?A?????? a????????? b??????????? c?????????????? d?????? B

1.?? A,BDNA分子的两个端点。 abcd是限制性位点。? 通过实验可以得到 ={2,3,4,5,2,5,9,14,16,7,12,14,9,11,7}. 再通过来求,对应于上图的={0,2,5,9,14,16}是一种解。

?

上述方法要把DNA分子在任意的两个限制性位点处切开,这对于当前的实验技术来说有相当难度,而且,还要对实验数据进行处理,也很复杂。最近研究人员提出了一种新的方法,称为简化的部分消化方法(SPDP)。这个方法与PDP的不同就在于它避免了在任意两个位点切开DNA分子的难题和处理重复数据的困难。仍假设与使用的酶对应的限制性位点有n个。首先DNA分子被复制成n+1份,前n个复制品中的每一个在一个限制性位点处被切开,最后一个复制品在所有的限制性位点处被切开。这样我们分别得到2n个片段长度(称为第一组数据)和n+1个片段长度(称为第二组数据)。在没有误差的前提下,第一组数据中2n个长度可以分成n对,每对的和都等于DNA分子的总长度;第二组数据中n+1个长度的和也等于DNA分子的总长度。 SPDP问题是如何利用这两组数据重构出这n+1个片段在DNA分子上的排列,使得这个排列在n个位点切开后得到的2n个片段长度与实验得到的2n个长度相等。下图给出了一个例子。

?(a)

2?????? 6???????? 1?????? 4?????? 3

?


(b)

?????????? 2?????????????????? 14

?


???????????????? 8????????????????? 8

?


???????????????? 9??????????????????? 7

?


???????????????????? 13??????????????????? 3

?


?????????

2???? 1???????? 4?????????? 3????????????? 6

?

?


2.? 这个例子对应的位点有4个。(a) 就是我们希望重构的顺序。 (b)中的前4对为第一组数据,它通过切开一个位点得到,每对长度的和都是16,剩下的为第二组数据,含5个片段长度,它通过切开所有位点得到,它们的长度总和也是16 但实验结果只告知每段的长度,不知道它们在DNA分子上的排列顺序。

?

现对上述SPDP问题,建立数学模型,并研究以下问题:

(1)???? 设计求解该问题的算法, 并评估该算法的效率和效果。对下述2个实例给出答案:

实例1 第一组数据:2148897133

第二组数据:21436

?

实例2:? 第一组数据:1141237896114123132510

第二组数据:112122123

?

(2)??? 讨论在实验中测量片段长度时的误差,将在多大程度上影响算法的效果,当误差到多大程度时,限制性图谱的重构将无法进行。

目录
相关文章
|
2月前
|
机器学习/深度学习 算法 安全
m基于深度学习网络的中药识别系统matlab仿真,包含GUI界面
在MATLAB 2022a中,一个基于GoogLeNet的中药识别系统展示了其仿真效果,通过6张图像展示了识别流程。该系统利用深度学习解决传统识别方法的局限,尤其是借助CNN自动提取中药图像特征。核心程序涉及数据集加载、分割、预训练模型加载以及网络调整,如替换GoogLeNet的特征学习层和分类器层以适应中药分类任务。
19 1
|
4月前
|
机器学习/深度学习 算法 计算机视觉
基于GoogleNet深度学习网络的花朵类型识别matlab仿真
基于GoogleNet深度学习网络的花朵类型识别matlab仿真
|
机器学习/深度学习 传感器 编解码
史上最全 | 基于深度学习的3D分割综述(RGB-D/点云/体素/多目)(上)
3D目标分割是计算机视觉中的一个基本且具有挑战性的问题,在自动驾驶、机器人、增强现实和医学图像分析等领域有着广泛的应用。它受到了计算机视觉、图形和机器学习社区的极大关注。传统上,3D分割是用人工设计的特征和工程方法进行的,这些方法精度较差,也无法推广到大规模数据上。在2D计算机视觉巨大成功的推动下,深度学习技术最近也成为3D分割任务的首选。近年来已涌现出大量相关工作,并且已经在不同的基准数据集上进行了评估。本文全面调研了基于深度学习的3D分割的最新进展,涵盖了150多篇论文。论文总结了最常用的范式,讨论了它们的优缺点,并分析了这些分割方法的对比结果。并在此基础上,提出了未来的研究方向。
史上最全 | 基于深度学习的3D分割综述(RGB-D/点云/体素/多目)(上)
|
22天前
|
自然语言处理 数据可视化 算法
R语言文本挖掘、情感分析和可视化哈利波特小说文本数据
R语言文本挖掘、情感分析和可视化哈利波特小说文本数据
|
2月前
|
机器学习/深度学习 数据采集 算法
m基于深度学习网络的花朵种类识别系统matlab仿真,包含GUI界面
m基于深度学习网络的花朵种类识别系统matlab仿真,包含GUI界面
34 6
|
2月前
|
数据采集 数据库 数据格式
【数学建模竞赛】数据预处理知识总结2——数据变换
【数学建模竞赛】数据预处理知识总结2——数据变换
24 1
|
9月前
|
机器学习/深度学习 搜索推荐 数据可视化
无热图不组学!高阶文献热图R语言绘制小专场拿捏
近在阅读近五年的一区高分的机器学习文献,其中有一种图出现频率特别高——热图。《
165 0
|
10月前
|
存储 数据采集 自然语言处理
知识图谱之《海贼王-ONEPICE》领域图谱项目实战(含码源):数据采集、知识存储、知识抽取、知识计算、知识应用、图谱可视化、问答系统(KBQA)等
知识图谱之《海贼王-ONEPICE》领域图谱项目实战(含码源):数据采集、知识存储、知识抽取、知识计算、知识应用、图谱可视化、问答系统(KBQA)等
知识图谱之《海贼王-ONEPICE》领域图谱项目实战(含码源):数据采集、知识存储、知识抽取、知识计算、知识应用、图谱可视化、问答系统(KBQA)等
|
5月前
|
机器学习/深度学习 人工智能 算法
AI Earth有没有相关文档或论文介绍平台地物分类、目标提取、变化检测等算法的原理呢?
AI Earth有没有相关文档或论文介绍平台地物分类、目标提取、变化检测等算法的原理呢?
303 1
|
9月前
|
机器学习/深度学习 存储 算法
【使用机器学习和深度学习对城市声音进行分类】基于两种技术(ML和DL)对音频数据(城市声音)进行分类(Matlab代码实现)
【使用机器学习和深度学习对城市声音进行分类】基于两种技术(ML和DL)对音频数据(城市声音)进行分类(Matlab代码实现)
192 0