「毅硕|生信教程」 micromamba:mamba的C++实现,超越conda

简介: 还在为生信软件的安装配置而烦恼?micromamba(micromamba是mamba包管理器的小型版本,采用C++实现,具有mamba的核心功能,且体积更小,可以脱离conda独立运行,更易于部署)帮你解决!

未标题-1_画板 1.png

1 Micromamba 简介

大家是否有这样的经历,使用conda/anaconda进行环境配置的是否速度非常慢,进度经常卡在“Collecting package metadata”上。甚至有时候需要安装的软件比较多,或者需要用到conda-forge这个最大的channel,conda能一直卡在collecting步骤上直到http连接超时也没能处理完毕。直到有天小编发现了mamba这个工具,进而发现了micromamba(micromamba是mamba包管理器的小型版本,采用C++实现,具有mamba的核心功能,且体积更小,可以脱离conda独立运行,更易于部署),从此再也没有因为生信软件的安装配置而烦恼抓狂过。闲话少说,开始我们的教程。


2 Micromamba 教程

2.1 安装与配置

小编比较推荐国内用户从miniconda的安装起手,这里使用的是TUNA镜像站的链接,https://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/Miniconda3-py311_24.4.0-0-Linux-x86_64.sh。 下载完毕后,执行命令

sh Miniconda3-py311_24.4.0-0-Linux-x86_64.sh

通常没有特殊需求的情况下,一路“enter,yes”把miniconda安装到${HOME}/miniconda3即可。一般安装完毕后会询问是否直接执行conda init命令,回车即可。这样以后登录的时候就自动加载进入base环境,可以便捷使用conda的各种功能。如果没有继续回车执行,或者执行失败,则可以

${HOME}/miniconda3/bin/conda init

成功以后,~/.bashrc文件(其他sh则是其各自的rc文件路径)会有如下类似的内容

# 仅展示,非命令行代码
# >>> conda initialize >>>
# !! Contents within this block are managed by 'conda init' !!
__conda_setup="$('/home/snpbio/miniconda3/bin/conda' 'shell.bash' 'hook' 2> /dev/null)"
if [ $? -eq 0 ]; then
    eval "$__conda_setup"
else
    if [ -f "/home/snpbio/miniconda3/etc/profile.d/conda.sh" ]; then
        . "/home/snpbio/miniconda3/etc/profile.d/conda.sh"
    else
        export PATH="/home/snpbio/miniconda3/bin:$PATH"
    fi
fi
unset __conda_setup
# <<< conda initialize <<<

接着我们配置condarc文件,condarc文件路径可以是 ~/.condarc ,也可以是 conda base 环境下的 $CONDA_PREFIX/.condarc。一般情况下使用 ~/.condarc 即可。创建condarc文件

cat > ~/.condarc << EOF
channels:
  - conda-forge
  - bioconda
  - defaults
show_channel_urls: true
default_channels:
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/r
custom_channels:
  conda-forge: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  bioconda: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  pytorch: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
report_errors: false
EOF

然后我们就可以在conda base环境下安装micromamba

conda install -n base micromamba

安装完毕后,执行

echo "export MAMBA_ROOT_PREFIX=${HOME}/miniconda3" >> ~/.bashrc

至此,miniconda和micromamba的配置就完成了。(小编的这种做法是为了能利用conda的api去调用micromamba配置的环境,所以就把MAMBA_ROOT_PREFIX变量设置成和conda base的$CONDA_PREFIX一样)

2.2 测试

开始测试

用micromamba进行搜索

micromamba search sentieon

运行神速,很快就得到结果了

# 仅展示,截取部分输出内容
bioconda/linux-64                                   0.8s
bioconda/noarch                                     0.9s
https://mirrors.tuna.tsinghua.edu.cn/anaconda/pk..  0.1s
https://mirrors.tuna.tsinghua.edu.cn/anaconda/pk..  1.0s
https://mirrors.tuna.tsinghua.edu.cn/anaconda/pk..  0.3s
https://mirrors.tuna.tsinghua.edu.cn/anaconda/pk..  0.3s
conda-forge/noarch                                  16.9MB @   8.8MB/s  1.9s
conda-forge/linux-64                                39.0MB @  12.3MB/s  3.1s
 Name     Version   Build                   Channel  Subdir
──────────────────────────────────────────────────────────────
 sentieon 202308.03 h43eeafb_0              bioconda bioconda
 sentieon 202308.02 h43eeafb_0              bioconda bioconda
 sentieon 202308.01 h43eeafb_0              bioconda bioconda
 sentieon 202308    h43eeafb_0              bioconda bioconda

然后我们可以创建环境并安装

micromamba create -n sentieon sentieon
# 出现 Confirm changes: 时,输入Y

非常快就创建好了,此时我们用conda activate切换环境。

conda activate sentieon

2.3 结尾

本文也只是简单的入门,micromamba的配置方法还有很多,感兴趣的同学可以访问 https://mamba.readthedocs.io/en/latest/user_guide/micromamba.html 获取更多信息。


关于Sentieon

Sentieon为完整的纯软件基因变异检测二级分析方案,其分析流程完全忠于BWA、GATK、MuTect2、STAR、Minimap2、Fgbio、picard等金标准的数学模型。在匹配开源流程分析结果的前提下,大幅提升WGS、WES、Panel、UMI、ctDNA、RNA等测序数据的分析效率和检出精度,并匹配目前全部第二代、三代测序平台。

0-02.png

Sentieon软件团队拥有丰富的软件开发及算法优化工程经验,致力于解决生物数据分析中的速度与准确度瓶颈,为来自于分子诊断、药物研发、临床医疗、人群队列、动植物等多个领域的合作伙伴提供高效精准的软件解决方案,共同推动基因技术的发展。

截至2023年3月份,Sentieon已经在全球范围内为1300+用户提供服务,被世界一级影响因子刊物如NEJM、Cell、Nature等广泛引用,引用次数超过700篇。此外,Sentieon连续数年摘得了Precision FDA、Dream Challenges等多个权威评比的桂冠,在业内获得广泛认可。

目录
相关文章
|
2月前
|
存储 C++
c++的指针完整教程
本文提供了一个全面的C++指针教程,包括指针的声明与初始化、访问指针指向的值、指针运算、指针与函数的关系、动态内存分配,以及不同类型指针(如一级指针、二级指针、整型指针、字符指针、数组指针、函数指针、成员指针、void指针)的介绍,还提到了不同位数机器上指针大小的差异。
56 1
|
2月前
|
Linux C语言 C++
vsCode远程执行c和c++代码并操控linux服务器完整教程
这篇文章提供了一个完整的教程,介绍如何在Visual Studio Code中配置和使用插件来远程执行C和C++代码,并操控Linux服务器,包括安装VSCode、安装插件、配置插件、配置编译工具、升级glibc和编写代码进行调试的步骤。
337 0
vsCode远程执行c和c++代码并操控linux服务器完整教程
|
6月前
|
存储 算法 编译器
C++ 函数式编程教程
C++ 函数式编程学习
|
6月前
|
存储 编译器 开发工具
C++语言教程分享
C++语言教程分享
|
6月前
|
存储 编译器 C++
|
6月前
|
C++ 存储 索引
面向 C++ 的现代 CMake 教程(一)(5)
面向 C++ 的现代 CMake 教程(一)
107 0
|
6月前
|
缓存 存储 C++
面向 C++ 的现代 CMake 教程(一)(4)
面向 C++ 的现代 CMake 教程(一)
74 0
|
6月前
|
C++ 缓存 存储
面向 C++ 的现代 CMake 教程(一)(3)
面向 C++ 的现代 CMake 教程(一)
145 0
|
6月前
|
缓存 C++ Windows
面向 C++ 的现代 CMake 教程(一)(2)
面向 C++ 的现代 CMake 教程(一)
163 0
|
6月前
|
C++ 容器 Docker
面向 C++ 的现代 CMake 教程(一)(1)
面向 C++ 的现代 CMake 教程(一)
144 0