开发者社区> 阿里云基因组学> 正文

工作流在Kubernetes集群中的实践

简介: 本文主要介绍如何在ACK上基于工作流引擎进行大规模基因测序工作。阿里云工作流引擎基于开源项目Argo实现,支持并发、循环、重试等多种执行策略。

实验步骤:

依赖配置:
  1. 创建集群
  2. 安装AGS插件;
  3. 配置argo-ui;
  4. 创建NAS共享存储卷

实验:
  任务解析;
  试验一:单任务执行;
  试验二:多任务执行;

1. 创建集群:

拿到集群测试域名;c84e9207b8f6b49968cb5570aff4e6581.cn-beijing.alicontainer.com

1-1.png

2. 安装AGS插件;

1-2.png

3. 配置argo-ui:

1-3.png

apiVersion: extensions/v1beta1
kind: Ingress
metadata:
  name: workflow-ingress
  namespace: argo
spec:
  rules:
  - host: workflow.c84e9207b8f6b49968cb5570aff4e6581.cn-beijing.alicontainer.com
    http:
      paths:
      - path: /
        backend:
          serviceName: argo-ui
          servicePort: 80

通过界面登陆argo-ui: workflow.c84e9207b8f6b49968cb5570aff4e6581.cn-beijing.alicontainer.com

4. 创建NAS卷

登陆NAS控制台:
1-4.png
创建NAS盘后,添加挂载点:
1-5.png
获取挂载点地址:
1-6.png

Mapping步骤介绍:

1-7.png

数据准备:

wget reference;
        wget fastq1;
        wget fastq2;
        gzip -d subset_assembly.fa.gz;
        gunzip -c SRR1976948_1.fastq.gz | head -800000 > SRR1976948.1;
        gunzip -c SRR1976948_2.fastq.gz | head -800000 > SRR1976948.2;
        bwa index subset_assembly.fa;

比对到参考序列sai:

bwa aln subset_assembly.fa SRR1976948.1 > SRR1976948_1.untrimmed.sai;
        bwa aln subset_assembly.fa SRR1976948.2 > SRR1976948_2.untrimmed.sai;

生成sam、bam文件:

bwa sampe subset_assembly.fa SRR1976948_1.untrimmed.sai SRR1976948_2.untrimmed.sai SRR1976948.1 SRR1976948.2 > SRR1976948.untrimmed.sam;
        samtools import subset_assembly.fa SRR1976948.untrimmed.sam SRR1976948.untrimmed.sam.bam;
        samtools sort SRR1976948.untrimmed.sam.bam -o SRR1976948.untrimmed.sam.bam.sorted.bam;
        samtools index SRR1976948.untrimmed.sam.bam.sorted.bam;

5. 试验一:

不使用共享存储,通过单一pod实现,挂载主机目录,运行完成可以从日志查看结果;
1-8.png
到Argo-UI上看运行拓扑图:
1-9.png

5. 试验二:

使用多个任务完成,并使用共享nas存储,运行完成可以从日志查看结果;
1-10.png
到Argo-UI界面查看:
1-11.png

本文作者:阚俊宝

版权声明:如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件至:developerteam@list.alibaba-inc.com 进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容。

分享:
下一篇:E-HPC支持多队列管理和自动伸缩

Bio-IT技术交流,生物信息开发者社区,阿里云基因组学产品与解决方案

官方博客
官网链接