高通量计算框架HTCondor(一)——概述

简介: 高通量计算框架HTCondor(一)——概述

高通量计算框架HTCondor(一)——概述

目录

1. 正文

HTCondor是威斯康星大学麦迪逊分校构建的分布式计算软件和相关技术,用来处理高通量计算(High Throughput Computing )的相关问题。高通量计算中的Throughput应该是吞吐量的意思,也就是调度计算机资源的能力。与高性能计算(HPC)不同,高通量计算(HTC)应对的问题是在高性能的同时能够长时间稳定运行的能力,并充分利用集群或网络内计算资源。长时间计算时,集群或网络内计算资源往往是不可靠的,这中间蕴含了计算资源管理和任务调度的问题。

具体来说,HTC的思想就是将规模的密集运算拆分成一个个的子任务,交给集群计算机运算。HTCondor提供了如下功能:

  1. 发布任务:根据设定的集群内计算资源条件,将任务发布到集群计算机。
  2. 调度任务:任务能够发送到满足条件计算机中运行,或者迁移到另外一台计算机。
  3. 监视任务:随时监视任务运行的情况和计算资源的情况。
    注意拆分任务这一步还是需要用户自己控制的,拆分合适粒度的并行任务,有助于最大程度的负载均衡。

除此之外,一个不能忽视的的问题就是磁盘IO的问题。HTC往往伴随着海量数据,巨量数据的磁盘IO必定会造成性能瓶颈。HTCondor自带了一种文件传输机制,发布任务的时候能够自动将数据发送到对应的机器中运行。当然,也可以尝试搭配分布式文件系统如hdfs进行计算。

准备在这一系列博文中,通过一个具体的实例,总结下HTCondor的使用过程,也算对分布式计算或者集群计算有个感性的认识。

2. 目录

1.高通量计算框架HTCondor(一)——概述

简要介绍了高通量分布式计算与HTCondor。

2.高通量计算框架HTCondor(二)——环境配置

详细展示了HTCondor环境的搭建过程。

3.高通量计算框架HTCondor(三)——使用命令

介绍了HTCondor的使用环境,以及经常使用的命令。

4.高通量计算框架HTCondor(四)——案例准备

准备一个实际案例做分布式计算。

5.高通量计算框架HTCondor(五)——分布计算

使用一个实例进行简单的分布式计算。

6.高通量计算框架HTCondor(六)——拾遗

总结了使用HTCondor过程中的一些问题与建议。

3. 参考

[1]. 说说高通量计算(HTC)、高性能计算(HPC)和多任务计算(MTC)

[2]. HTCondor官网

[3]. Hadoop到底是干什么用的?

[4]. condor 使用详解

4. 相关

代码和数据地址

下一篇

分类: 分布式计算

标签: 集群计算 , 分布式计算 , HTCondor



目录
打赏
0
0
0
0
18
分享
相关文章
高通量计算框架HTCondor(二)——环境配置
高通量计算框架HTCondor(二)——环境配置
194 1
阿里云无影云电脑是什么?无影云桌面和传统电脑有什么区别?
阿里云无影云电脑是什么?无影云桌面和传统电脑有什么区别?
996 3
阿里云无影云电脑是什么?无影云桌面和传统电脑有什么区别?
基于DeepSeek的智能客服系统安全与隐私保护:构建可信赖的服务
在前四篇文章中,我们完成了智能客服系统的开发、部署、优化和扩展。本文聚焦于安全与隐私保护,探讨如何构建安全可靠的智能客服系统。内容涵盖数据安全(加密、脱敏、备份)、系统安全(输入验证、身份认证、日志监控)和隐私保护(隐私政策、数据最小化、访问控制),确保用户数据安全及系统稳定运行。通过这些措施,我们可以打造一个可信赖的智能客服系统,为用户提供更好的服务体验。
MongoDB索引知识
MongoDB索引知识
76 1
MongoDB索引知识
国内首个!高通量以太网协议标准正式发布
近日,在CCF全国高性能计算学术年会上,阿里云、中国科学院计算技术研究所等40余家机构举办发布会,联合发布国内首个高通量以太网ETH+协议标准,可实现集合通信性能30%的提升。
645 7
中国首个高通量以太网联盟诞生!阿里云等40多家企业率先加入
阿里云与中国科学院计算技术研究所联合发起高通量以太网联盟,中国首个高通量以太网协议即将发布
高通量计算框架HTCondor(五)——分布计算
高通量计算框架HTCondor(五)——分布计算
107 0
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等