开发者社区> 徐洲更> 正文

Rosalind工具库:寻找motif的MEMEsuite

简介: 在做数据分析时,有两种解决问题的策略,一种是自己写代码处理数据,一种是用开源在互联网的工具。 如果你代码写的贼流,并且嫌弃已有工具质量不够,那么在空闲的时候开源自己写一个。
+关注继续查看

在做数据分析时,有两种解决问题的策略,一种是自己写代码处理数据,一种是用开源在互联网的工具。 如果你代码写的贼流,并且嫌弃已有工具质量不够,那么在空闲的时候开源自己写一个。如果你对代码还不够熟练,或者是一个常规的数据分析任务,那么我建议你使用别人已经写好的工具,将这些工具进行组合处理大任务中的不同部分。
Rosalind兵工厂这一部分主要介绍了常见数据格式以及处理这些数据的工具。我建议先学会用轮子,在熟练使用后开始自己实现这些轮子的代码

New Motif Discovery

Motif(模体,基序)是一种序列模式,可以被转录因子识别结合,因此与转录调控有关。目前寻找motif的程序有两种方式表示结果,一种是正则表达式,一种是motif每个位置碱基的概率矩阵。在论文中最常见的表示方法就是sequence logo,每个位置的碱基大小表示这位置上出现该碱基的可能性

img_d532cdbce751e6308db77d4fa2c5e351.png
motif的图形化表示

寻找Motif目前的主流工具就是MEME Suite,他不是一种工具,而是一个套餐,将motif识别相关的可能工具都整合在了一起

img_200ee10d28cf65a8d0cd6bb7c0a9ff34.png
MEME suite

题目:根据已有的FASTA文件,识别其中相似的motif,长度不低于20. 结果请给出最佳得分motif的正则表达式。
解决方法: 尽管有一个网页版的工具meme可以使用,但是往往在出来结果前,时间就到了。所以最佳的方法就是安装本地版工具, 安装方法见http://meme-suite.org/doc/install.html

img_a9f6df9046b4ffba4b2ceeff2609dab4.png
时间到。。
~/opt/biosoft/meme_4.12.0/bin/meme rosalind_meme.txt -protein

查看"meme_out/meme.txt"里的结果,手动修改。。提交答案。。

img_c439772b0a9357a3df3259d3592b1aa4.png
motif

感觉有点纯。。可能要用一个正则

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
Windows 下 tail 查看日志命令工具分享
以前在公司时服务器上面可以实现tail 命令查看程序运行日志,感觉相当不错,上网查了下这些命令是linux 下的,还好有好心人开发了一个可以在Windows下的运行的小工具,来给分享一下:   使用方法: 下载后解压,把tail.
1064 0
做了个小工具:阿里云和腾讯云哪个好?哪个速度快?
阿里云与腾讯云哪个好?哪个速度快?怎么选? 我做了个小工具,图形化对比,可以直接看出哪个节点的速度快慢。
68486 0
+关注
徐洲更
生信媛公众号编辑、生信必修课之软件安装课程作者
284
文章
0
问答
文章排行榜
最热
最新
相关电子书
更多
OceanBase 入门到实战教程
立即下载
阿里云图数据库GDB,加速开启“图智”未来.ppt
立即下载
实时数仓Hologres技术实战一本通2.0版(下)
立即下载