LSF 集群全面监控!浅析 HPC 基于龙蜥操作系统的迁移替代解决方案

简介: 常青藤开源科技龙蜥社区完成基于龙蜥操作系统( Anolis OS )安装部署 HPCinsights 监控平台解决方案。

近日,北京常青藤开源科技有限公司(以下简称“常青藤开源科技”)与龙蜥社区完成基于龙蜥操作系统( Anolis OS )安装部署 HPCinsights 监控平台解决方案,进一步助力龙蜥操作系统在高性能计算领域的优化、提升。


芯片企业在芯片日常研发中,存在高性能计算(HPC) 集群资源平均利用率不高,同时伴随大量 pending 作业,以及作业平均等待时间较长等问题,对企业日常芯片设计整体进度造成不利影响。


HPCinsights 是一款对 HPC 集群进行监控和智能分析的软件,不仅具备常见的系统监控能力,也可以在作业资源分析、多维度资源统计和作业资源实时监控等方面,实现快速发现 HPC 集群存在的配置和使用问题,全面掌控集群资源状况,优化集群资源分配。

640.png

常青藤开源科技加入龙蜥社区后开展深入合作,基于龙蜥操作系统( Anolis OS )安装部署 HPCinsights 监控平台,实现对 LSF 集群资源调度使用情况进行全面监控和配置优化,从而提升芯片设计相关工作整体进度。通过对其 HPC 队列作业进行可视化分析,快速识别出集群使用的多个问题。HPCinsights 平台对 IC 设计计算任务进行统计、 查询、分析和资源监控,持续优化和改进 LSF 集群配置,集群资源利用率和作业平均等待时间得到较大提升,充分利用了现有服务器资源,并为后续芯片设计上云提供了数据支撑。


HPCinsights 软件产品和 Anolis OS 联合解决方案的完成,不仅解决了企业对国外产品高度依赖带来的 IT 成本和安全隐患影响,又可以在同等条件下获得到更好的技术支持和服务保障。在操作系统快速发展的支持下,摆脱对国外产品的依赖,使我们在信息安全防控上更加具有主动权。


龙蜥社区始终秉持着“中立开放”的原则继续诚邀各企业与龙蜥操作系统(Anolis OS),围绕兼容适配、技术合作、商业版发行等多角度进行逐步合作,欢迎各位合作伙伴来进行产品适配或安装部署解决方案等,如有适配需求,请联系:陈佳 jackie.cj@openanolis.org


「龙腾计划」自发布以来,已有超过百家企业签署 CLA 协议加入龙蜥社区,包括安全厂商格尔软件、海泰方圆,数据库厂商南大通用、巨杉数据库,中间件厂商东方通、中创中间件、宝兰德等,欢迎更多企业加入。

龙腾计划可参看:“龙腾计划”启动!邀请 500 家企业加入,与龙蜥社区一起拥抱无限生态

—— 完 ——

关于常青藤开源科技

常青藤开源科技成立于 2017 年,专注于 HPC (高性能计算)和开源解决方案,为国内芯片设计企业和制造业、金融、电信等行业客户提供领先的 HPC (高性能计算)解决方案和开源基础设施解决方案;及开源技术咨询、系统架构设计、操作系统安全补丁管理、自动化运维、系统软件定制和技术支持等相关服务。常青藤开源科技拥有多款自主研发的产品,为国内客户提供创新性产品和技术服务。


关于龙蜥社区

龙蜥社区(OpenAnolis)由企事业单位、高等院校、科研单位、非营利性组织、个人等在自愿、平等、开源、协作的基础上组成的非盈利性开源社区。龙蜥社区成立于 2020 年 9 月,旨在构建一个开源、中立、开放的 Linux 上游发行版社区及创新平台。

龙蜥社区成立的短期目标是开发龙蜥操作系统(Anolis OS)作为 CentOS 停服后的应对方案,构建一个兼容国际 Linux 主流厂商的社区发行版。中长期目标是探索打造一个面向未来的操作系统,建立统一的开源操作系统生态,孵化创新开源项目,繁荣开源生态。

目前,Anolis OS 8.4 已发布,支持 X86_64 、Arm64、LoongArch 架构,完善适配 Intel、兆芯、鲲鹏、龙芯等芯片,并提供全栈国密支持。

欢迎下载:

https://openanolis.cn/download

加入我们,一起打造面向未来的开源操作系统!

https://openanolis.cn


相关实践学习
CentOS 8迁移Anolis OS 8
Anolis OS 8在做出差异性开发同时,在生态上和依赖管理上保持跟CentOS 8.x兼容,本文为您介绍如何通过AOMS迁移工具实现CentOS 8.x到Anolis OS 8的迁移。
相关文章
|
2月前
|
缓存 人工智能 架构师
龙蜥社区走进中国农业大学,共探“AI+生命科学” 操作系统优化实践
“AI+生命科学”这一跨学科领域的巨大潜力与重要意义。
|
2月前
|
人工智能 安全 算法
|
1月前
|
Cloud Native 安全 Linux
龙蜥操作系统:CentOS 谢幕之后,国产云原生系统的崛起之路
龙蜥操作系统(Anolis OS)是 CentOS 停止维护后,由阿里云等企业联合发起的开源项目。它以双内核架构和全栈优化为核心,提供无缝替代 CentOS 的方案,兼容主流生态并针对云计算场景深度优化。其技术亮点包括 RHCK 和 ANCK 双内核、性能优化、全栈安全及国密算法支持。龙蜥适用于云原生基础设施、企业级应用部署及开发环境,社区已吸引 200 多家单位参与。未来规划涵盖 AI 框架优化、RISC-V 架构适配及桌面环境构建,正重新定义云时代的操作系统边界。
248 0
|
3月前
|
数据采集 人工智能 运维
深度探讨操作系统运维、软件选型等社区标准,龙蜥标准化 SIG MeetUp 圆满举办
围绕软件选型、操作系统运维、RISC-V 三个方向的社区标准进行了分享与讨论。
深度探讨操作系统运维、软件选型等社区标准,龙蜥标准化 SIG MeetUp 圆满举办
|
5月前
|
人工智能 并行计算 安全
用户实操:如何以龙蜥操作系统为底座在 CPU 上运行 DeepSeek-R1
介绍如何在 CPU 上使用 llama.cpp 推理 671B 版本的 DeepSeek R1,以及实际效果。
|
4月前
|
弹性计算 人工智能 运维
阿里云操作系统控制台实战评测:提升云资源管理与监控效率
阿里云操作系统控制台是一款集成了可视化管理、问题分析和智能助手等功能的运维工具,适用于企业和个人用户。它通过统一界面监控和优化系统运行,结合AI与自动化技术,提升操作系统的使用效率和稳定性。用户无需专业运维知识即可完成系统维护和故障诊断。主要功能包括进程热度追踪、系统诊断等,提供直观的数据展示和详细的分析报告,帮助用户快速定位并解决问题。建议进一步完善操作文档和优化数据可视化效果,以提升用户体验。
122 0

推荐镜像

更多