高校的HPC之难

简介:

High performance computing(简称HPC)即高性能计算。指通常使用很多处理器或者某一集群中组织的几台计算机的计算系统和环境。高校中需要这种HPC,但面临着多重巨大挑战。具体的挑战有哪些呢?根据分散式和集中式两种HPC资源,总结如下:

1. 科研资源跨院系,资源分散、孤立,利用率低,资源相互之间无法共享,不断投资扩容,消耗大量资金。

2.跨专业,各自维护资源,技术难度大,学校无法统一管理。

3.HPC部署难度大,网络配置、操作系统安装维护难度大,增加学习成本 。

4.数据存储的成本攀升,性能不足。

5.平台应用固定,灵活度差,软件受限,难以满足各院不同领域研究 。

6.网络中心运维唯独难度大,工作价值难于体现 。

海南大学与HPC海南大学,简称海大,是国家“211工程”重点建设大学,其特色学科包括海洋、生物、材料和制药等学科,这些学科的科研往往需要高性能计算集群支撑,因此海大希望当前支撑学校业务系统的IT基础设施也可以为科研高性能计算提供支撑。海大现有IT资源主要分布在网教中心和图书馆,承担学校各类业务管理系统和公共服务平台。除此之外,现有部分学科还配备少量高性能服务器资源支撑科研。IT资源分布分散,无法实现共享,整体IT资源的利用率偏低,投资回报率偏高。

HPC in Cloud2014年上半年,海大与国内从事网络(含云计算)、服务器、虚拟化的多个厂家进行了沟通交流,通过组织校内外专家对厂家方案进行了严格的评审答辩,最后选定最好的三家方案作为基础进行整合优化,形成公开招标方案。

最终,品高在公开招标环节胜出,为海大提供了最优的HPC与云计算融合的计算平台解决方案(HPC in Cloud),即业务管理系统和公共服务平台,面向目标用户提供虚拟化服务及高性能计算服务。

包括:利用云平台建立校级云资源服务平台,并统一对教务和科研需求提供资源,老师可以按需申请HPC资源;通过应用自动化部署服务将常见HPC软件打包成模板,各学科老师按需申请资源;利用闲时可以将教务系统部分资源,停机保号(关机但数据保留),将资源提供出来跑HPC业务;利用弹性服务功能,当应用负载增加时自动创建资源应对,降低业务宕机风险;利用SAN做高性能计算,用普通PC组成分布式存储,存放结果数据,有效降低成本。


本文转自d1net(转载)

相关文章
|
5月前
|
弹性计算 人工智能 安全
阿里云弹性计算产品线负责人张献涛 为计算提速,弹性计算的创新与普惠
“阿里云始终围绕‘稳定、安全、性能、成本、弹性’的目标不断创新,为客户创造业务价值。”10月31日,杭州云栖大会上,阿里云弹性计算计算产品线负责人张献涛表示,通过持续的产品和技术创新,阿里云发布了HPC优化实例等多款新品,性能可提升40%,并对g8i等多款第八代ECS实例升级算力、降低成本,让客户真正体验到云计算带来的创新和普惠。
阿里云弹性计算产品线负责人张献涛  为计算提速,弹性计算的创新与普惠
|
异构计算 存储 虚拟化
看云栖说云栖——神龙、含光、擎天、云超算
说说以神龙为代表的阿里云计算资源
934 0
|
8月前
中国高校最大云上科研智算平台,上线!
中国高校最大云上科研智算平台,上线!
63 0
|
10月前
|
存储 人工智能 大数据
|
人工智能 达摩院 Cloud Native
阿里云新一代智能计算:灵骏来了!
灵骏,阿里云新一代智能计算!
阿里云新一代智能计算:灵骏来了!
|
机器学习/深度学习 人工智能 自动驾驶
会 | 迈向算力时代 阿里云基础设施亮相首届中国算力大会
“智能计算服务+硬核技术+绿色低碳”的算力基础设施
会 | 迈向算力时代 阿里云基础设施亮相首届中国算力大会
|
弹性计算 Kubernetes NoSQL
阿里云新品发布会周刊第146期 丨 弹性计算生命科学最佳实践- 云计算情报局
新产品、新版本、新技术、新功能、价格调整,评论在下方,下期更新!关注更多新品发布会!
584 0
阿里云新品发布会周刊第146期 丨 弹性计算生命科学最佳实践- 云计算情报局
|
存储 弹性计算 人工智能
阿里云何万青:南坡VS北坡,阿里云高性能计算行业实践
北坡模式:借助于云上大计算性能突破来提供HPC服务,切入的重点更加聚焦于云服务。
阿里云何万青:南坡VS北坡,阿里云高性能计算行业实践
|
弹性计算 资源调度 Cloud Native
阿里云张献涛:如何修炼云计算的弹指神通
如果有一台能同时打开1万个网页的笔记本电脑,你想要吗?这种设备在物理世界中可能是不存在的,但是云让它变成了可能。让这一切变为可能的,是因云而生的弹性计算。
|
大数据 分布式计算 Hadoop
【转载】阿里云飞天大数据平台亮相
7月25日,阿里云飞天大数据平台亮相阿里云峰会上海站,拥有中国唯一自主研发的计算引擎,是全球集群规模最大的计算平台,最大可扩展至10万台计算集群,支撑海量数据存储和计算。在民生服务领域,飞天大数据平台已经“最多跑一次”、城市大脑等场景中,协助政府优化服务模式,实现更智能便捷的服务能力,保障信息安全。
3524 0