Rosalind工具库:FASTA/LALIGN

简介: 基因组不同区域在进化上的速率是不同的。在编码区的碱基突变可能会导致氨基酸性质发生改变导致后代死亡,以及插入缺失导致开放读码框(ORF)变化,因此编码区更有可能是同义的点突变。

基因组不同区域在进化上的速率是不同的。在编码区的碱基突变可能会导致氨基酸性质发生改变导致后代死亡,以及插入缺失导致开放读码框(ORF)变化,因此编码区更有可能是同义的点突变。但是对于非编码区,比如说内含子或者是基因间隔区,突变对生物体的生存影响不大,因此更容易出现插入、缺失、倒置和重复这些变异。

在1940~1950年期间,Barbara McClintock 在玉米中发现了转座子现象,并证明许多基因组重排是因为转座子在基因组上移动引起。

下图表明基因组原本只有两个转座子,由于姊妹染色单体之间的Tn插入重拍最后形成了三个转座子。

img_77ebdd8bb4ad17509269bd846d10ea10.png
transposon

基因组上的转座子不需要完全一致就能够发生重拍,因此无法使用传统的局部联配找到序列中的多个重复,因为它只会找到最优的联配。比如说"AAAATTTTT"和"TTTTTAAAA"的局部最优联配只会得到

001    1 TTTTT 5
         |||||
002    5 TTTTT 9

为了找到序列中AAAA部分的联配,我们就需要用到次最优联配技术,它能获取不止一个的不同位点局部联配,因此还能在上面的基础上得到如下的联配

001    6 AAAA 9
         ||||
002    1 AAAA 4

实现亚最优联配的工具为FASTA/Lalign,输出结果和EMBOSS的NeedleWater类似

问题: 给定两条DNA序列(A,B),两者存在32~40 bp的不精确重复序列C。使用Lalign的网页工具 ,请给出长度在32~40之间的C序列分别在A和B里出现了几次

学会看结果图就行了。

img_e8c8f02725d9e00c7f8aa0f715567062.png
以Rosalind12为背景
img_8623993ba88d1f7b9f6cc5e7583752af.png
以Rosalind37为背景
目录
相关文章
|
6月前
|
安全 Java Linux
Android反编译——jadx工具
Android反编译——jadx工具
243 1
|
3月前
|
JSON JavaScript API
用Python编写小工具下载OSM路网数据
用Python编写小工具下载OSM路网数据
|
5月前
|
存储 监控 Java
python自研流星监控系统meteor_monitor(第一篇)
本文介绍了作者开发的一个Python流星监控系统,替代了性能不佳且收费的ufocapturehd2软件。系统采用Win10相机应用低耗录制视频,通过SikuliX进行自动化控制,分段录制并存储到本地,然后通过脚本同步到NAS。视频分析使用帧差法检测流星,支持分布式分析。代码已更新,旧文章不再适用,最新内容可见:[用python自行开发的流星监控系统meteor_monitor(第二篇)-CSDN博客](https://github.com/xingxinghuo1000/meteor_monitor_scripts.git)。
|
4月前
|
自然语言处理 Shell 开发者
|
数据处理
Graphpad Prism9.5.1 (含Win/Mac版) 科研医学生物数据处理绘图软件详细安装教程 亲测有效!!!
GraphPad Prism是一款非常专业强大的科研医学生物数据处理绘图软件,它可以将科学图形、综合曲线拟合(非线性回归)、可理解的统计数据、数据组织结合在一起,除了最基本的数据统计分析外,还能自动生成统计图。
Graphpad Prism9.5.1 (含Win/Mac版) 科研医学生物数据处理绘图软件详细安装教程  亲测有效!!!
|
关系型数据库 MySQL Java
五十六、Kettle工具的使用
前言:此块内容文字描述效果不佳,故采用看图说话的形式进行阐述 提示:双击图片可以将图片放大进行查看
五十六、Kettle工具的使用
Omni/USDT PHP开发包OmniTool简介
OmniTool开发包适用于为PHP应用快速增加对Omni Layer/USDT数字资产的支持能力,即支持使用自有Omni Layer节点的应用场景,也支持基于第三方API服务和离线裸交易的轻量级部署场景。
2297 0
|
Python
python魔法师solo数字游戏
前言 先学学基础的python,万事开头难!还是好好学学开发吧! 直接上干货 #coding:utf8 s=input('请输入一个年份:') s=int(s) year=False if s % 100 ==0 and % 400 ==0: year=True elif s %...
930 0
|
数据挖掘 数据格式
Rosalind工具库:寻找motif的MEMEsuite
在做数据分析时,有两种解决问题的策略,一种是自己写代码处理数据,一种是用开源在互联网的工具。 如果你代码写的贼流,并且嫌弃已有工具质量不够,那么在空闲的时候开源自己写一个。
1526 0
|
数据安全/隐私保护 Python
Rosalind工具库:使用Biopython处理生物数据
DNA互补链 Complementing a Strand of DNA 根据Waston和Crick的双螺旋学说,DNA是存在两条链,并且根据A-T, C-G反向互补。
1363 0