“云+AI”浪潮下,阿里云&龙蜥携手打造智算时代最佳服务器操作系统

简介: AI 时代的来临,也推动着云计算发展迎来第三次浪潮。

编者按:随着 AI 时代推动云计算迎来第三次浪潮,借力"云+AI"趋势,阿里云携手龙蜥打造云上体验最佳的服务器操作系统 - Alibaba Cloud Linux/Anolis OS。在「飞天技术沙龙-CentOS 迁移替换专场」上,阿里云基础软件部产品总监张鹏程分享了《阿里云与龙蜥携手打造智算时代最佳服务器操作系统》,从阿里云和龙蜥的角度,详细介绍了在共建服务器操作系统这条路线上走过的历程,以及未来的发展方向。以下是本次分享原文:


 

(图/阿里云基础软件部产品总监张鹏程)

谈起阿里云的开源战略,我想先与大家一起回顾阿里开源历程。在这个过程中阿里云经历了使用、贡献、开拓三个阶段。首先开源是应用战略。阿里云在创业早期就大量使用开源软件,阿里云技术的发展根植于开源的沃土中,借助开源力量实现去 IOE 满足业务发展诉求,并通过学习研究国外优秀开源实践积累了更多技术研发力量。

其次开源成为技术战略。当阿里云具备一定的能力,尤其是在大规模互联网系统和云计算的研发中开始积累越来越多的技术经验,解决越来越多疑难杂症之后,也积极地将自己的实践以开源软件的形态回馈到社区,解决技术孤岛,并将阿里云内部沉淀的技术通过开源的方式推广成为行业标准。

如今开源是发展战略。随着阿里云越来越深入地参与到各行各业,携手合作伙伴共同建设数字新世界,开源也成为阿里云发展战略的重要部分。云的时代开创了新的软件开发模式和商业模式,云计算让操作系统、数据库、中间件类产品成为集业务技术一体的业务单元。云已经成为开源软件运行的最佳环境,开源也从小众的爱好者行为发展成为基础软件的源头活水。因而在基础软件领域的开拓与开源,成为近几年来阿里云开源的重点。

既然基础软件领域的开源共建已成为阿里开源的重心,因此阿里云明确了一个新兴方向和四大战略领域,形成“1+4”开源战略,持续加大在开源社区建设与研发上的投入。

一个新兴方向是 AI 模型开源社区。魔搭社区成立初衷就是通过开源开放、共建社区生态的方式,让 AI 开发使用更简单。魔搭社区践行模型即服务(Model as a Service)新理念,提供多类优质 AI 模型以及模型调优、训练、部署等一体化服务,旨在降低 AI 模型应用门槛。经过一年多的发展,魔搭成为国内规模最大、最活跃的 AI 模型开源社区,开发者数量超过 280 万,累计开源开放了 2300 多个优质 AI 模型,模型下载量超过 1 亿。魔搭社区也将继续帮助开发者将 AI 模型转化为生产力,持续推动 AI 领域的开源生态建设。

四大战略领域分别是操作系统、云原生、数据库、大数据在操作系统领域,阿里云联合产业伙伴共同发起的龙蜥社区,已成长为国内领先的操作系统开源社区。目前合作伙伴超过 800 家,基于龙蜥技术路线的衍生操作系统已达 12个,部署规模超过 600 万,累计服务用户超过 80 万。在云原生领域,阿里云拥有国内最全面的云原生开源贡献,覆盖分布式应用架构、分布式应用治理、容器调度等多个重要领域,开源了完整的分布式框架和组件,帮助开发者解决分布式应用的落地难题。在数据库领域,阿里云核心产品 PolarDB 数据库的 PostgreSQL 版和分布式版已经开源。在大数据领域,Flink 是当下被广泛使用的开源大数据计算引擎之一。基于其“流批一体”技术,越来越多的企业选择 Flink 应用于自身的业务场景。

阿里云是开源的受益者,也是积极贡献者。阿里云将持续拥抱开源生态,持续投入 AI、云原生、数据库、大数据、操作系统等领域的开源工作,持续提升开发者服务和企业创新支持,为开源创新提速,与开源生态同行。

AI 时代的来临,也推动着云计算发展迎来第三次浪潮。

在云计算技术诞生初期,创立初始就在互联网上面向公众提供服务的企业自然而然地开始使用云服务,他们的需求造就了云计算产业的第一次浪潮。随着云计算技术逐渐成熟,一批传统企业也开始基于信息技术发展成果开启数字化转型,并引发了云计算产业的第二次浪潮。而今天,生成式 AI 技术的飞速发展又对云计算行业起到了极大的推动作用,使行业即将迎来第三次大跨越。

在这种划时代的发展机遇下,阿里云坚持以飞天云计算操作系统为核心,依托自研创新的云基础设施,致力于服务产业数字化和智能化。在这其中,服务器操作系统作为飞天的底座,承上启下发挥着不可或缺的关键作用,这也是阿里云会在操作系统领域坚持数十年长期投入的原因。

阿里云在操作系统上长期投入的初心,总结为三点,解决业务发展问题、实现关键技术突破、促进计算产业变革业务发展中最突出的诉求是实现大规模复杂算力场景稳定、可靠、高效运行,这需要操作系统在复杂算力场景下发挥出稳定、安全、性能、成本的综合竞争力。关键技术的突破会集中体现在三次浪潮叠加下软硬协同创新突破,在一云多芯、云+AI的发展模式下,需要操作系统连接软硬件上下游协同创新。计算产业的变革离不开产业生态的协同和自主演进路线的发展,通过开源社区可以有效连接供给侧和需求侧力量,聚力共建自主可控的技术体系,实现可持续发展。

正是意识到开源社区对于操作系统发展的决定性作用,阿里云坚持长期投入,携手产业伙伴共建龙蜥社区,共促生态协同发展。

2009 年,阿里便开启操作系统自研探索,通过大规模实践形成深厚积累,随着一云多芯的发展需要,阿里云在 2020 年联合产业伙伴共同发起成立了龙蜥社区,恰逢其时在 CentOS 停服替代中社区也发挥了关键作用,促进科技自立自强。如今,龙蜥已完成根社区建设布局,走出一条基于分层分类、独立演进的技术路线,逐步解决操作系统开源供应链等安全可控问题。

在龙蜥社区的发展过程中,阿里云致力于构建开放中立的社区治理体系,促进社区技术成果规模化应用,并携手上下游生态伙伴共同规划社区技术路线。

如今,龙蜥社区开放中立治理理念已成为现实,社区成为国内独具特色的多厂商治理模式合作型开源操作系统社区,得益于治理模式的成功,龙蜥已经成为我国活跃贡献机构最多、最多样化的社区,在云智融合浪潮下迈向高质量发展阶段。

在智能计算快速发展的时代背景下,服务器操作系统产业迎来新发展格局,在云+AI 的催化剂下,我们有机会聚力实现产业升级三步走,实现国产生态自主演进、引领云+AI 技术潮流、实现基础软件换道超车,同时承担起更重要的产业责任,促进自主生态可持续发展、商业开源生态双循环、防止产业发展踏空。


阿里云会持续投入龙蜥社区建设和贡献,继续坚持共建、共享、共治、共赢发展理念,用开放创新谱写国产操作系统和基础软件的新未来。


预测未来的最好方式是创造未来,让我们聚力龙蜥,共同打造中国操作系统黄金年代。


精彩视频回放、课件获取:

本次演讲直播回放及技术 PPT已上线,欢迎点击下方链接观看~

回放链接:

https://openanolis.cn/video/#1114869210846130212

技术 PPT :关注龙蜥公众号【OpenAnolis 龙蜥】,回复“龙蜥课件”获取。

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
15天前
|
存储 人工智能 运维
|
1月前
|
存储 弹性计算 运维
阿里云国际Windows操作系统迁移教程
阿里云国际Windows操作系统迁移教程
|
2月前
|
人工智能 运维 安全
世界级大模型群,进化阿里云服务器操作系统新范式
世界级大模型群,进化阿里云服务器操作系统新范式
|
15天前
|
人工智能 安全 Linux
|
28天前
|
弹性计算 开发框架 .NET
阿里云服务器购买教程及云服务器地域、实例、操作系统、带宽等参数选择指南
对于初次购买阿里云服务器的用户来说,想使用阿里云服务器搭建网站或者运行APP、小程序等项目,第一步就是要先购买阿里云服务器,下面小编以图文形式给大家介绍一下阿里云服务器的购买流程,以及购买过程中如何云服务器地域、实例、带宽等关键配置和选择这些参数的一些注意事项,以供参考。
|
1月前
|
运维 Oracle 关系型数据库
服务器数据恢复—浪潮服务器硬盘出现坏道的数据恢复案例
服务器数据恢复环境: 一台浪潮服务器中有一组由6块SAS硬盘组建的RAID。服务器上划分了1个卷,存放Oracle数据库文件。 服务器故障&检测: 服务器上有两个硬盘指示灯亮黄灯,RAID崩溃,服务器不可用。 将故障服务器中所有磁盘标记后取出。由硬件工程师检测故障服务器上的取出的6块硬盘是否存在硬件故障,经过检测发现变黄的指示灯所对应的2块硬盘存在坏道且SMART的错误冗余级别已经超过阈值。
|
15天前
|
人工智能 Anolis 开发者
|
2月前
|
机器学习/深度学习 人工智能 运维