LSF 集群全面监控!浅析 HPC 基于龙蜥操作系统的迁移替代解决方案

简介: 常青藤开源科技龙蜥社区完成基于龙蜥操作系统( Anolis OS )安装部署 HPCinsights 监控平台解决方案。

近日,北京常青藤开源科技有限公司(以下简称“常青藤开源科技”)与龙蜥社区完成基于龙蜥操作系统( Anolis OS )安装部署 HPCinsights 监控平台解决方案,进一步助力龙蜥操作系统在高性能计算领域的优化、提升。


芯片企业在芯片日常研发中,存在高性能计算(HPC) 集群资源平均利用率不高,同时伴随大量 pending 作业,以及作业平均等待时间较长等问题,对企业日常芯片设计整体进度造成不利影响。


HPCinsights 是一款对 HPC 集群进行监控和智能分析的软件,不仅具备常见的系统监控能力,也可以在作业资源分析、多维度资源统计和作业资源实时监控等方面,实现快速发现 HPC 集群存在的配置和使用问题,全面掌控集群资源状况,优化集群资源分配。

640.png

常青藤开源科技加入龙蜥社区后开展深入合作,基于龙蜥操作系统( Anolis OS )安装部署 HPCinsights 监控平台,实现对 LSF 集群资源调度使用情况进行全面监控和配置优化,从而提升芯片设计相关工作整体进度。通过对其 HPC 队列作业进行可视化分析,快速识别出集群使用的多个问题。HPCinsights 平台对 IC 设计计算任务进行统计、 查询、分析和资源监控,持续优化和改进 LSF 集群配置,集群资源利用率和作业平均等待时间得到较大提升,充分利用了现有服务器资源,并为后续芯片设计上云提供了数据支撑。


HPCinsights 软件产品和 Anolis OS 联合解决方案的完成,不仅解决了企业对国外产品高度依赖带来的 IT 成本和安全隐患影响,又可以在同等条件下获得到更好的技术支持和服务保障。在操作系统快速发展的支持下,摆脱对国外产品的依赖,使我们在信息安全防控上更加具有主动权。


龙蜥社区始终秉持着“中立开放”的原则继续诚邀各企业与龙蜥操作系统(Anolis OS),围绕兼容适配、技术合作、商业版发行等多角度进行逐步合作,欢迎各位合作伙伴来进行产品适配或安装部署解决方案等,如有适配需求,请联系:陈佳 jackie.cj@openanolis.org


「龙腾计划」自发布以来,已有超过百家企业签署 CLA 协议加入龙蜥社区,包括安全厂商格尔软件、海泰方圆,数据库厂商南大通用、巨杉数据库,中间件厂商东方通、中创中间件、宝兰德等,欢迎更多企业加入。

龙腾计划可参看:“龙腾计划”启动!邀请 500 家企业加入,与龙蜥社区一起拥抱无限生态

—— 完 ——

关于常青藤开源科技

常青藤开源科技成立于 2017 年,专注于 HPC (高性能计算)和开源解决方案,为国内芯片设计企业和制造业、金融、电信等行业客户提供领先的 HPC (高性能计算)解决方案和开源基础设施解决方案;及开源技术咨询、系统架构设计、操作系统安全补丁管理、自动化运维、系统软件定制和技术支持等相关服务。常青藤开源科技拥有多款自主研发的产品,为国内客户提供创新性产品和技术服务。


关于龙蜥社区

龙蜥社区(OpenAnolis)由企事业单位、高等院校、科研单位、非营利性组织、个人等在自愿、平等、开源、协作的基础上组成的非盈利性开源社区。龙蜥社区成立于 2020 年 9 月,旨在构建一个开源、中立、开放的 Linux 上游发行版社区及创新平台。

龙蜥社区成立的短期目标是开发龙蜥操作系统(Anolis OS)作为 CentOS 停服后的应对方案,构建一个兼容国际 Linux 主流厂商的社区发行版。中长期目标是探索打造一个面向未来的操作系统,建立统一的开源操作系统生态,孵化创新开源项目,繁荣开源生态。

目前,Anolis OS 8.4 已发布,支持 X86_64 、Arm64、LoongArch 架构,完善适配 Intel、兆芯、鲲鹏、龙芯等芯片,并提供全栈国密支持。

欢迎下载:

https://openanolis.cn/download

加入我们,一起打造面向未来的开源操作系统!

https://openanolis.cn


相关实践学习
CentOS 8迁移Anolis OS 8
Anolis OS 8在做出差异性开发同时,在生态上和依赖管理上保持跟CentOS 8.x兼容,本文为您介绍如何通过AOMS迁移工具实现CentOS 8.x到Anolis OS 8的迁移。
目录
打赏
0
0
0
0
1169
分享
相关文章
Intel 平台新特性助力龙蜥 OS 云计算 | 龙蜥大讲堂101期
本次分享的主题是Intel平台新特性助力龙蜥OS云计算。内容涵盖英特尔第四代和第五代至强处理器的新特性,如性能提升、内置加速器等,并详细介绍TDX、SGX、AMX等技术原理及其在虚拟化环境中的支持情况,旨在帮助云用户充分利用英特尔新平台的优势。
用户实操:如何以龙蜥操作系统为底座在 CPU 上运行 DeepSeek-R1
介绍如何在 CPU 上使用 llama.cpp 推理 671B 版本的 DeepSeek R1,以及实际效果。
阿里云操作系统控制台实战评测:提升云资源管理与监控效率
阿里云操作系统控制台是一款集成了可视化管理、问题分析和智能助手等功能的运维工具,适用于企业和个人用户。它通过统一界面监控和优化系统运行,结合AI与自动化技术,提升操作系统的使用效率和稳定性。用户无需专业运维知识即可完成系统维护和故障诊断。主要功能包括进程热度追踪、系统诊断等,提供直观的数据展示和详细的分析报告,帮助用户快速定位并解决问题。建议进一步完善操作文档和优化数据可视化效果,以提升用户体验。
33 0
龙蜥社区落地开源生态发展合作倡议,构建开放兼容的操作系统生态
通过共同努力,三个社区基于服务器操作系统场景,在操作系统内核等关键共性技术链统一方面达成了一致。
英特尔携手龙蜥,共筑未来操作系统 | 2024龙蜥大会
在2024龙蜥大会中,本次分享的主题是关于英特尔公司与龙蜥社区的合作成果和未来计划。 1.Inter与龙蜥携手共建社区 2.Inter Arch SIG近期内核贡献 3.Inter:龙蜥内核历年贡献总结 4.Inter:开源技术贡献 5.Inter与龙蜥社区实践展示 6.Inter+龙蜥:未来展望
加速推进 AI+OS 深度融合,打造最 AI 的服务器操作系统 | 2024龙蜥大会主论坛
本次方案的主题是加速推进 AI+OS 深度融合,打造最 AI 的服务器操作系统,从产业洞察、创新实践、发展建议三个方面,指出 AI 原生应用对操作系统提出更高要求,需要以应用为导向、以系统为核心进行架构创新设计,要打造最 AI 的服务器操作系统。 1. 产业洞察 2. 创新实践 3. 发展建议
圆桌会议:聚焦AI时代机遇下操作系统产业的进化与重构 | 2024龙蜥大会主论坛
2024龙蜥大会主论坛聚焦AI时代的操作系统产业进化与重构。专家们围绕开源社区建设、商业化衍生、替代方案及AI应用等议题展开讨论。中国工程院陈纯院士强调开源社区的重要性,阿里云蒋江伟提出操作系统的兼容性和包容性,AMD潘晓明表示将加强国际合作,中兴通讯刘东则探讨了操作系统与AI的深度融合。会议一致认为,龙蜥操作系统应抓住AI发展机遇,构建安全可靠的生态体系,推动国产操作系统走向国际化。
操作系统迁移技术
本次分享的主题是操作系统迁移方案,由阿里云路延文分享。 1. 迁移背景:CentOS停更危机 2. KeyarchOS迁移方案 3. 操作系统测试 4. 迁移评估
阿里云操作系统迁移最佳实践
本次分享的主题是社区操作系统迁移和阿里云操作系统迁移。由龙溪社区王喆分享。 1. 操作系统生命周期 2. 操作系统迁移方案 3. 操作系统迁移流程 4. 操作系统迁移评估 5. 一站式迁移运维平台SysOM 6. SMC操作系统迁移实践
105 2

热门文章

最新文章