那些MECAT组装基因组中遇到的坑

简介: 链接Github地址和文章的链接:https://github.com/xiaochuanle/MECAThttps://www.biorxiv.org/node/26657在MECAT的文章2017年正式发表没过几天的时候就试过安装mecat,当时遇到了一些奇怪的问题,现在想来大概是因为对linux不够熟悉只会复制粘贴代码造成的吧。

链接

Github地址和文章的链接:

https://github.com/xiaochuanle/MECAT
https://www.biorxiv.org/node/26657

在MECAT的文章2017年正式发表没过几天的时候就试过安装mecat,当时遇到了一些奇怪的问题,现在想来大概是因为对linux不够熟悉只会复制粘贴代码造成的吧。昨天,2018.1.20,在阿里云服务器和腾讯云的服务器上疯狂尝试了两轮才发现问题所在。还是太年轻。复制粘贴确实能避免很多因为手残导致的问题,但还是要认真审视代码的呢。一味无脑复制人家的代码只会闹这样的低级笑话。

安装的坑

主要是给我这种初学者和粗心的小伙伴们提个醒:

img_dff50d0da553d9ce207ed381da27d94e.png
install HDF5

这里的这个位置跟自己电脑的位置大概率来说是不一样的噢,所以别一股脑的就复制进去了,然后安装在了一个奇怪的位置(别问我是怎么知道的……说多了心累……)我直接就安装在了 /home/hanschen/hdf5这个位置。下面写export的地方别忘了也改一下噢。

quick start的坑

MECAT官网是提供pacbio和nanopore两种测序方式的组装的,也提供了两个示例文件with代码,可以用来测试MECAT软件有木有安装成功。初心是挺好的,但是这个文档写得太不走心了。。这代码迷之错误让我debug了很久。。虽然看懂了之后发现原来就这么简单。。

img_c7607f099bfbf06b81b76684263bb9d5.png
pacbio的示例代码

可以看到第二步里是生成了一个文件叫 corrected_ecoli_filtered,但是第三步里却需要一个叫 corrected_ecoli_filtered.fasta的文件,之前一度认为是第二步出了问题,少生成了一个 corrected_ecoli_filtered.fasta文件导致第三步运行的时候失败,报错说找不到这个 .fasta文件,就一直在返回去看第二步的结果,总觉得是第二步的问题……今天熬了个夜突然脑子就开窍了。。会不会™是文档写错了?遂less了一下 corrected_ecoli_filtered,发现这个文件就是fasta格式……

我跟你讲我就是这个表情! ↓↓↓


img_f66d36e3028f41a2e2129b8bcd067e50.jpe

转换思路开始怀疑文档有误之后,一切都顺利了起来。。第四步的代码也是有一个小错误的,纠正了前面错误的同学应该能很快发现的。。

于是就很顺利的跑完了示例基因组……

C++ 缺少模块的坑

我不知道是我服务器的问题还是MECAT软件的问题,在跑pacbio示例和nanopore的示例的时候都报了个缺少perl模块。

这里倒是顺便学习到了如何安装perl模块之类的linux实用技巧(强行安慰自己)

pacbio缺少的模块:Filesys::Df

第一种办法:自动安装。
自动安装的代码如下。

 sudo  perl -MCPAN -e shell
         cpan>install Filesys::Df

第二种办法:下载源码进行安装。

http://search.cpan.org/~iguthrie/Filesys-Df-0.92/Df.pm

下载好解压后,cd进目录

perl Makefile.PL
make
make test  #当出现“all test ok”时说明测试成功,此步非必须
make install

所以建议大家用第一种安装方式,简单省事儿。

nanopore缺少的模块:ios::in

这个bug我至今没修好……一方面是自动安装找不到这个模块,另一方面是找不到源码……就很懵逼,我也不知道是软件的问题还是我服务器的问题……诶。需要去求个大神帮忙解决一下了……


这一篇大概之后还会继续填坑的,毕竟这个软件相对于falcon和canu的优势还是很大的,毕竟省下了很多的计(nei)算(cun)资(tiao)源和时(qian)间呢。

2018年1月27日09点54分。

相关文章
社区活动礼品兑换攻略
社区活动礼品兑换攻略
14153 1
|
监控 调度 开发工具
IO神器blktrace使用介绍
## 前言 1. blktrace的作者正是block io的maintainer,开发此工具,可以更好的追踪IO的过程。 2. blktrace 结合btt可以统计一个IO是在调度队列停留的时间长,还是在硬件上消耗的时间长,利用这个工具可以协助分析和优化问题。 ## blktrace的原理 一个I/O请求的处理过程,可以梳理为这样一张简单的图: ![](http://image
20198 0
|
7月前
|
传感器 人工智能 物联网
《跨越架构鸿沟:分布式软总线实现设备通信大一统》
随着设备多样性增加,不同芯片架构(如X86、ARM、RISC-V)在通信中面临诸多障碍。分布式软总线技术应运而生,通过融合底层通信技术、协议货架适配和中间适配层,屏蔽硬件、操作系统及协议差异,实现高效统一通信。该技术已在智能家居与办公场景中展现价值,未来结合AI与新一代通信技术,将助力万物互联愿景的实现。
337 6
|
Ubuntu Linux 网络安全
Ubuntu 22.04 LTS有哪些新特性
Ubuntu 22.04 LTS有哪些新特性
ly~
|
供应链 监控 搜索推荐
大数据的应用场景
大数据在众多行业中的应用场景广泛,涵盖金融、零售、医疗保健、交通物流、制造、能源、政府公共服务及教育等领域。在金融行业,大数据用于风险评估、精准营销、反欺诈以及决策支持;零售业则应用于商品推荐、供应链管理和门店运营优化等;医疗保健领域利用大数据进行疾病预测、辅助诊断和医疗质量评估;交通物流业通过大数据优化物流配送、交通管理和运输安全;制造业则在生产过程优化、设备维护和供应链协同方面受益;能源行业运用大数据提升智能电网管理和能源勘探效率;政府和公共服务部门借助大数据改善城市管理、政务服务及公共安全;教育行业通过大数据实现个性化学习和资源优化配置;体育娱乐业则利用大数据提升赛事分析和娱乐制作水平。
ly~
2711 2
【LaTex、markdown】常用语法写出漂亮的blog
【9月更文挑战第9天】本文介绍了使用LaTeX和Markdown编写美观博客的方法。LaTeX方面,需定义文档类型、设置标题与作者,并利用特定命令处理文本格式、列表、数学公式、图片和超链接。Markdown则通过井号表示标题级别,使用星号或下划线标记文本,简化列表和公式的编写,并以直观方式插入图片和链接。两者均可通过合理布局提升博客的可读性和视觉效果。
346 8
|
机器学习/深度学习 数据挖掘
机器学习之聚类——模糊聚类FCM
机器学习之聚类——模糊聚类FCM
563 4
|
消息中间件 Java 测试技术
【RocketMQ系列八】SpringBoot集成RocketMQ-实现普通消息和事务消息
【RocketMQ系列八】SpringBoot集成RocketMQ-实现普通消息和事务消息
1188 1
|
机器学习/深度学习
上三角矩阵(Upper Triangular Matrix
上三角矩阵(Upper Triangular Matrix)是一种特殊形式的矩阵,其非零元素仅位于主对角线以上。在数学和工程领域中,上三角矩阵通常用于线性代数和微积分等问题。以下是一些关于上三角矩阵的特点和应用:
2485 0
|
缓存 前端开发 JavaScript
构建可靠的前端工程:自动化、代码质量与性能优化
构建可靠的前端工程:自动化、代码质量与性能优化
构建可靠的前端工程:自动化、代码质量与性能优化