专访浪潮信息:AI 原生时代,浪潮信息引领服务器操作系统创新 全面贡献龙蜥社区

简介: 分享了关于 AI 原生化趋势下服务器操作系统进化的思考,以及浪潮信息在龙蜥社区开源贡献的思路、成果与未来技术发展规划。

编者按:近日,2024 龙蜥操作系统大会已于北京圆满举办。会上,龙蜥社区发布了“Anolis OS 23 生态衍生计划”、“CentOS 替代计划”及“AI 应用推广计划”三大计划,从产品、生态及应用维度为AI需求爆发主动布局,打造面向“云+ AI”的下一代服务器操作系统。作为龙蜥社区副理事长单位,浪潮信息宣布将推出商业衍生版,推进“停更无忧”行动计划,并持续增强操作系统对 AI 应用的支持。大会期间,CSDN 采访了龙蜥社区副理事长张东、浪潮信息系统软件产品部总经理苏志远,分享了关于 AI 原生化趋势下服务器操作系统进化的思考,以及浪潮信息在龙蜥社区开源贡献的思路、成果与未来技术发展规划。以下为采访全文:

16.png

浪潮信息:全方位贡献龙蜥社区,开源开放,构建多元异构算力

随着大模型技术不断成熟,各行业头部企业纷纷探索适合自身场景的模式与技术创新,其中应用场景的 AI 原生化被重点关注。据 Gartner 预测,到 2026 年超过  80% 的企业将使用生成式 AI 的 API 或模型,或在生产环境中部署支持生成式 AI 的应用,而在 2023 年初这一比例不到 5%。这对系统软件提出了新的要求。浪潮信息认为,面向 AI 原生的服务器操作系统,必须满足多元异构算力的支持、AI 原生编程模型及范式、性能与稳定性优化和 AI 原生安全的需求。


这四方面背后需要付出大量的技术研发工作,对此,浪潮信息提出了“以应用为导向,以系统设计为中心,建立多元异构算力融合、软硬协同优化”的技术发展路线。张东表示,浪潮信息将积极践行开源开放理念,通过“开放硬件+开源软件”引领产业发展,与社区共建加速 AI 创新落地。参与具有长期发展活力的成长型开源社区——龙蜥社区,正是浪潮信息实现这一规划的重要路径。

2022 年,浪潮信息正式加入龙蜥社区,随后与社区成立了浪潮信息龙蜥联合实验室,并以此为依托发挥软硬件技术积累和优势,在技术创新、标准制定、生态建设、运营推广等多个维度推动社区建设。


苏志远介绍,浪潮信息联合龙蜥社区建立了内核驱动基线,主导了安全联盟,并牵头系统安全、可信计算等技术 SIG 组。截至目前,浪潮信息是龙蜥社区理事单位中硬件驱动贡献最多、CVE 漏洞修复最多这两项记录的保持者,此外浪潮信息还贡献了首个主机安全防御项目(KSecure),牵头发布了硬件兼容性等社区标准 4 项,以及 eBPF 可信等安全技术白皮书 2 项。

浪潮信息基于龙蜥操作系统开发的商业衍生版云峦 KeyarchOS,在一云多芯、人工智能、虚拟化、云原生等方面都得到了增强,已实现规模化部署。截至目前,浪潮信息已推出 4 个商业版本及技术预览版,完成了 1000+ 软硬件适配。


此外,针对 CentOS 从去年到现在全面停更带来的系统迁移需求和各类问题,浪潮信息联合社区重磅推出了“停更无忧”行动计划,提供漏洞及 Bug 修复、故障定位与解决、安全加固等服务,以有效防范 CentOS 停服后可能出现的新型漏洞、恶意代码引发的信息泄露、业务中断以及勒索攻击等严重风险。

服务器操作系统的下一代:迎接智算时代巨型资源需求挑战,布局“云+AI”

在采访中,专家们也坦言,当前大模型技术多多少少都有“大力出奇迹”的意味,“万卡集群”甚至已成为大模型团队的标配。张东提到,大模型推理的规模化将使得 AI 算力需求更加膨胀,整个技术体系将迎来巨大的挑战,比如超 400G 高速网络成为标配、一台机器要配置 64 张加速卡、一个集群要上千万个计算核心等等,随之而来的系统管理复杂度将飙升。张东认为,未来面向 AI 场景的服务器操作系统管理“巨型资源”,在产品能力上还有很长的路要走。而在产品形态上,未来所有的应用都是智能体,操作系统本身也可以是一个智能体。对于未来技术方向,尚需全产业共同探索,而浪潮信息夯实当前的基础工作,则是探索的第一步。


今年龙蜥大会所推出的三大计划中,Anolis OS 23 将聚焦智能运维、面向 AI 基础设施的优化,以及多元异构算力数据中心的兼容性、可靠性、弹性管理能力的提升,在交付效率、可靠性、性能等方面都能满足应用场景需求。张东表示,浪潮信息基于 Anolis OS 23 的商业衍生版,将实现大模型等 AI 应用开箱即用。例如,KOS 通过从自编译到提供 AI 部署的软件包自动化部署,使得 200 节点的 AI 训练基础开发环境上线可用只需 20 分钟


该商业衍生版已在研制阶段,苏志远透露,这将是一个 AI Chip native 的操作系统版本,即在底层兼容各类新型芯片。浪潮信息正在和某芯片研发团队深度合作,实现驱动层、算子库、通讯库与云峦 KeyarchOS 天然兼容,并建立迭代更新协同机制,第一时间将这些更新同步到社区。


而在上层应用层面,浪潮信息已将十多年积累的语料库(相当于操作系统经验)有序贡献到了龙蜥社区。同时,浪潮信息也将大模型开发工具 EPAI 运行在 KeyarchOS 上,不仅实现操作系统对多元、多模态大模型的良好支撑,还要强化操作系统 Copilot 的能力。


本轮生成式 AI 的爆火让全行业再次迎来科技变革周期,并且这次变革会比移动与云计算变革更加剧烈。面向 AI 的服务器操作系统迎来新机,已经成为底层架构技术开发者的共识。作为龙蜥社区副理事长单位,浪潮信息在云峦 KeyarchOS 操作系统做的功能开发和性能优化都毫无保留的贡献到了龙蜥社区,这种对“源于开源,馈与开源”理念的坚持,是社区开源技术到商业化良性发展的一次力证。

—— 完 ——

相关文章
|
17天前
|
存储 人工智能 运维
|
19天前
|
存储 关系型数据库 MySQL
查询服务器CPU、内存、磁盘、网络IO、队列、数据库占用空间等等信息
查询服务器CPU、内存、磁盘、网络IO、队列、数据库占用空间等等信息
192 2
|
1月前
|
弹性计算 Ubuntu Linux
阿里云服务器公共镜像、社区镜像、自定义镜像、共享镜像、云市场镜像区别及选择参考
阿里云服务器镜像有公共镜像、自定义镜像、共享镜像、镜像市场、社区镜像可选,对于新手用户来说,不知道他们之间的区别,因此往往不知道如何选择,本文为大家介绍他们之间的区别以及选择参考。
305 12
|
1月前
|
运维 Oracle 关系型数据库
服务器数据恢复—浪潮服务器硬盘出现坏道的数据恢复案例
服务器数据恢复环境: 一台浪潮服务器中有一组由6块SAS硬盘组建的RAID。服务器上划分了1个卷,存放Oracle数据库文件。 服务器故障&检测: 服务器上有两个硬盘指示灯亮黄灯,RAID崩溃,服务器不可用。 将故障服务器中所有磁盘标记后取出。由硬件工程师检测故障服务器上的取出的6块硬盘是否存在硬件故障,经过检测发现变黄的指示灯所对应的2块硬盘存在坏道且SMART的错误冗余级别已经超过阈值。
|
16天前
|
机器学习/深度学习 人工智能 弹性计算
阿里云AI服务器价格表_GPU服务器租赁费用_AI人工智能高性能计算推理
阿里云AI服务器提供多种配置选项,包括CPU+GPU、CPU+FPGA等组合,支持高性能计算需求。本文汇总了阿里云GPU服务器的价格信息,涵盖NVIDIA A10、V100、T4、P4、P100等多款GPU卡,适用于人工智能、机器学习和深度学习等场景。详细价格表和实例规格见文内图表。
|
17天前
|
人工智能 Anolis 开发者
|
1月前
|
SQL 分布式计算 Hadoop
Hadoop-37 HBase集群 JavaAPI 操作3台云服务器 POM 实现增删改查调用操作 列族信息 扫描全表
Hadoop-37 HBase集群 JavaAPI 操作3台云服务器 POM 实现增删改查调用操作 列族信息 扫描全表
33 3
|
1月前
|
存储 数据采集 分布式计算
Hadoop-17 Flume 介绍与环境配置 实机云服务器测试 分布式日志信息收集 海量数据 实时采集引擎 Source Channel Sink 串行复制负载均衡
Hadoop-17 Flume 介绍与环境配置 实机云服务器测试 分布式日志信息收集 海量数据 实时采集引擎 Source Channel Sink 串行复制负载均衡
44 1
|
1月前
|
应用服务中间件 PHP Apache
PbootCMS提示错误信息“未检测到您服务器环境的sqlite3数据库扩展...”
PbootCMS提示错误信息“未检测到您服务器环境的sqlite3数据库扩展...”

热门文章

最新文章