释放云算力 繁荣云生态|2023龙蜥操作系统大会
贾正华在分享中介绍了 Alibaba Cloud Linux 通过在稳定性、安全、性能、服务支持上持续建设,为用户提供更好的云上操作系统体验,发展成为阿里云上部署规模最大的操作系统。同时面向未来AI智算场景,Alibaba Cloud Linux 希望通过提供开箱即用的 AI 容器镜像,为用户的 AI 应用场景,提供一个易用性、稳定性、安全性、性能都更好的运行环境。
低延迟高密度的云原生系统|2023龙蜥操作系统大会
云原生是新一代云计算的主要形态,其中用户应用具有低延迟响应的核心需求,云平台具有高密度部署的核心需求。为满足上述需求,面临着复杂工作流调度、高密高并发启动、低冲突混合部署、动态瓶颈消除的技术难题。该报告介绍了微服务工作流高效调度、容器运行时及启动优化、共享资源隔离管控、QoS 快速恢复等方面所进行的系列研究,有效地解决了上述难题。
浪潮信息副总裁Donny Zhang致辞|2023龙蜥操作系统大会阿里云分论坛
云计算是改变整个产业生态的重要力量,随着新应用类型的不断出现,它的位置仍然举足轻重,特别是在人工智能这样的一个时代,大算力、大数据、高吞吐、低带宽的网络的需求越来越大。操作系统在整个云计算基础设施里面起到了非常核心的作用,阿里云作为国内云计算方面的领军企业,有雄厚的技术和经验积累,并把在基础软件操作系统方面的一些积累贡献给了龙蜥社区。经过三年发展,龙蜥社区已成为国内领先的操作系统开源根社区,它通过开源、开放的模式来发展下一代操作系统。浪潮信息作为国内最主要的算力基础设施供应商,联合阿里云及其他的合作伙伴,共同把社区建设成中国最好的操作系统社区,未来也将成为国际最重要的操作系统社区之一。
云原生转型之路的多系统运维|龙蜥社区系统运维MeetUp
企业面向几百个转型中间态的系统,通过建设统一对象模型,对异源同域的数据进行解析丰富处理,实现多维数据自主关联。算法和机器学习为复杂的体系提供了动态问题感知和预测的能力。在问题发生后基于根因推荐、同源分析等措施快速故障定界并开始应急处置,保障业务的连续性是首要之责,数智化观测为排障和系统调优提供有效的决策能力。
技术分享:Nydus 容器镜像加速服务 | 龙蜥大讲堂32期
主要向大家介绍 Scalable IOV(SIOV)相关的基本概念和软件框架,并针对现有的 Anolis 中集成的 SIOV out-of-tree 的实现方案展开讨论。与此同时,因为 SIOV 会涉及到 IOMMU、SVA 和 ENQCMD 等技术,所以我们也会分别介绍相关技术在裸机和虚拟机环境的软件实现方式。另外,借此机会也会向大家介绍目前上游社区对 SIOV 相关技术重构的背景和需求,以及新框架的设计思路和现状。
如何测试硬件设备与龙蜥操作系统的兼容性?|龙蜥大讲堂12期
硬件生态是一个操作系统的重要基石。但是硬件种类众多,各种各样的服务器和板卡外设,这些硬件设备与龙蜥操作系统(Anolis OS)各个发行版的兼容性如何?如何评估?龙蜥操作系统的潜在用户如何查询自己的硬件设备与龙蜥操作系统的兼容性?这次就和大家聊一聊龙蜥社区硬件兼容性 SIG 的主要工作,包括龙蜥社区硬件兼容性列表、硬件兼容性申请流程以及硬件兼容性测试套件 ancert 用法等。
解读集群镜像“开箱即用”神器——sealer!| 龙蜥大讲堂第 11 期
集群镜像把整个集群看成一台服务器,把 k8s 看成云操作系统,实现整个集群的镜像化打包和交付,为企业级软件提供一种“开箱即用”的应用封装技术。以行业 ISV为例,集群镜像帮助企业解决了分布式软件的部署一致性难题、降低了交付出错率,最终指数级降低分布式软件的交付成本。受 docker 等容器技术的启发,集群镜像将单机应用封装技术,上升到分布式集群维度,最终实现分布式软件的高效交付(build、share、run)。
企业级存储与操作系统的协同设计
随着数字经济的发展,数据即资源已经成为共识,其与土地、劳动力、技术、资本并成为五大基础资源,在数据基础设施中,存储平台扮演了核心角色。数据基础设施在多场景化、数据巨量化、多态化等方面对存储提出了越来越多的挑战和要求。孟宪伟通过本次演讲就企业级存储当前面临的挑战,面向极致可靠、极致可用、极致性能、极致安全四个方面,分享和探讨了企业级存储与操作系统协同设计的现状和未来。
龙蜥社区走进Intel MeetUp 理事杨继国致辞
Intel 是龙蜥社区首批理事成员单位,多次参加技术委员会和运营委员会的工作,创建并维护 Intel 架构兴趣小组,将 Intel 的新平台、新特性、新优化都贡献并集成到龙蜥社区发行版中,使得广大平台用户能第一时间在龙蜥操作系统上获得对新平台的支持,进而使得龙蜥操作系统在全球范围内的操作系统发行版本中走在前列。 龙蜥社区自成立以来吸引了众多业界生态伙伴以及广大开源开发者的广泛参与。我觉得以下两方面特别重要: 第一点是不同领域的生态伙伴的加入,整个生态结构更加多样和完整。龙蜥社区生态伙伴已超过两百家,涵盖了不同的领域,生态更加丰富健壮。 第二点是广泛的开发者参与,社区更具生命力和活力。龙蜥社区已经建立了多个技术方向的特殊兴趣小组,不断吸引着广大开发者加入到社区,推动社区在各个技术领域上的创新。
Intel 新平台虚拟化技术演讲
李肖瑶介绍了未来 Intel 在虚拟化技术方面的新功能。新功能可以分为两类,一类为需要做虚拟化支持的新功能,即由 hypervisor 将新功能正确地虚拟化给虚拟机,使得虚拟化系统可以使用,如 CET、AMX、Arch LBR、PKS、UI。另一类为针对虚拟化的新功能,由 hypervisor 支持使用来增强 hypervisor 的能力或安全性,如 SVA、SIOV、TDX、 Bus Lock Detection、 Notify VM exit、IPI virtualization。
英特尔®资源调配技术(英特尔®RDT)与业务混布
崔龙一开始介绍了多核心服务器上,由于资源共享带来的云上服务 QoS 波动,以及 Intel RDT特性对于内存带宽和 L3 cach e用量的监测和分配技术对于保证 QoS 的保障作用 ,intel RDT 特性在上游 Kernel 的支持情况。接着详细介绍了如何通过 pqos 和 Kernel resctrl 接口使用 Intel RDT。同时还以 speccpu 为例,说明了不同负载,对资源的敏感程度差异较大。最后介绍了一系列 Intel RDT 在实际业务混部中部署的实例。
Serverless Computing的技术架构
上海交通大学计算机系教授陈全带来《Serverless Computing的技术架构》主题分享。Serverless Computing 也称为服务器无感知计算或者无服务器计算,在云原生时代起到了重要作用。在本报告中,陈全从技术特点、分层结构、未来展望等三个方面对其进行了简要介绍。首先,介绍了Serverless Computing在云平台中的定位与技术特色,并讨论了其面临的主要挑战。随后,探讨了现有各类Serverless Computing平台的抽象分层结构,包括:虚拟化层、封装层、系统层等;并对各层现在所采用的的各类技术方案进行了分类与总结。最后,对Serverless Computing未来的通用化、高效化、智能化的发展趋势进行了展望。
Coolbpf 的应用实践
eBPF 技术探索 SIG 推出的 Coolbpf 是一站式 eBPF 开发编译平台,目的是让大家更快速的入门和进行开发,不用关注太多环境搭建问题。大家了解最多的是Coolbpf 是用来开发编译的,那么基于它之上的应用有什么呢?阿里云高级技术专家、龙蜥系统运维SIG Owner、龙蜥eBPF技术探索 SIG Maintainer 毛文安带来《Coolbpf 的应用实践》分享,与现场嘉宾针对 eBPF SIG 的 Coolbpf 项目,从它的原理和设计实现层面进行了阐述,具体介绍了远程云编译和低版本内核运行 eBPF 的技术原理。最后,通过一个具体网络抖动案例,展示了 Coolbpf 在业务观测和抖动发现上的具体应用实践过程。
Compliance As Code理念与龙蜥社区安全加固最佳实践介绍
6 月 11 日 ~ 12 日,龙蜥社区联合 Linux 中国,在北京召开的开放原子全球开放峰会现场组织 LUG 线下沙龙活动,与大家一同聊聊开源、聊聊 Linux 、聊聊社区当中的那些最新的技术。
机密计算与龙蜥社区云原生机密计算 SIG 详细介绍
6 月 11 日 ~ 12 日,龙蜥社区联合 Linux 中国,在北京召开的开放原子全球开放峰会现场组织 LUG 线下沙龙活动,与大家一同聊聊开源、聊聊 Linux 、聊聊社区当中的那些最新的技术。
开源人说第二期——《从开源中来,到开源中去》先导预告
《开源人说》为阿里云开发者社区与InfoQ 联合出品的一档精品开源视频栏目。栏目围绕四大开源领域:云原生、操作系统、数据库、大数据&AI,介绍优秀的开源软件背后的故事,记录传播技术人追求极致和开放共享的精神。第二期主题《从开源中来,到开源中去》,围绕龙蜥操作系统开源故事,以及开放、丰富、多元、健壮的社区生态,讲述龙蜥是如何从Linux开源而来,CentOS替换出发,捐赠开放原子基金会,到开源中去,最后落地千行百业中去产生实际价值的故事。我们希望有更多人了解到开源人背后的故事和付出,也希望可以影响更多人参与到开源的事业中。专题地址:https://developer.aliyun.com/topic/opensourcefolkstalk
阿里云总监课第三期第三节:Linux开源存储技术
课程讲师:吴忠杰(储道)课程纲要:a) Linux存储软件概述b) 内核存储软件堆栈c) 用户态存储软件栈下载PPT链接:https://yq.aliyun.com/download/2999
基于Anolis OS的DCU环境部署|龙蜥大讲堂第140期
围绕 DCU 在 Anolis OS 环境部署做详细介绍,包括 DCU 产品介绍/DCU 在龙蜥社区的兼容性适配流程/DCU 环境的部署流程,最后就部署过程做演示。
Mooncake 大模型开源生态体系建设与产业应用实践|龙蜥MeetUp
介绍了大模型推理架构Mooncake。该架构通过创新的KVCache中心设计,显著提升了Kimi智能助手的推理吞吐和成本效率,已引起业界广泛关注。近期,清华大学与阿里云等多家企业宣布共建Mooncake项目,旨在构建高性能推理框架的开源生态。阿里云与清华大学共同探索了大模型资源池化技术的工业应用,推动推理实例共享与缓存池化层标准化,实现高效分布式资源解耦,提升大模型长上下文推理性能。目前Mooncake已在vLLM/SGLang等多个推理框架集成,并在多家企业落地。
如何打造开放领先的可观测性数据底座|龙蜥MeetUp
乘云数字提出了构建可观测性数据底座的理念,以实现数据融合和自由开发应用。通过统一数据模型和统一组织构建的思路进行设计指导,全面拥抱 OpenTelemetry,确保了与业界生态的紧密接轨。
零侵扰数据能力,构建可观测性智能体的基石|龙蜥MeetUp
从以 GPT 为代表的大模型出现之后,用 AI 实现 Ops 解决运维困境的梦想看起来实现近在咫尺,但 AIOps 发展的核心瓶颈是数据。现阶段的运维体系存在大量的数据盲区、数据孤岛、数据关联等问题,运维诊断更多的是依靠经验、猜测、直觉和灵感,而不是依靠数据。
组装式 OS 可靠性增强组件实践|龙蜥MeetUp
越来越多的场景对可靠性有更高的要求,如基站、卫星、工业网关、智能汽车等,而当前 Linux 聚焦资源管理机制的实现,不重点关注资源使用策略导致的异常,其主要提供了硬件的可靠性处理,整体上没有体系化的管理手段。同时对于操作系统而言,可组装的定制功能将能在不同的场景下最大化功能价值。面对可靠性增强的需求和挑战,中兴通讯进行了组装式 OS 可靠性增强组件实践,充分覆盖系统各类亚健康事件,并进行对应策略处理,尽可能保障系统的可靠运行,同时提供必要的维测信息,方便后续故障定位。设计上采用可组装思路,利用 ftrace、kprobes 及 eBPF 技术进行功能解耦,可以很好地满足多场景下 OS 可靠性增强需求。
龙蜥社区系统运维联盟主席冯富秋致辞|龙蜥MeetUp
龙蜥社区系统运维联盟主席冯富秋表示龙蜥社区系统运维联盟作为运维技术创新的前沿阵地,承载着双重使命:第一通过强化联盟与各成员单位间的协同合作,打造出运维能力跃升新引擎;第二,致力于制定并推广运维产业标准,为用户提供一盏明灯,让他们清晰洞悉市场运维水准的现状与未来趋势。同时,他也详细介绍了联盟当前的工作进展,强调通过联盟,牵引国内系统运维健康、有序、领先的发展。
龙蜥社区技术委员会副主席苏志远:浪潮信息与龙蜥实现共赢
浪潮信息系统软件产品部总经理、龙蜥社区技术委员会副主席苏志远讲述了浪潮信息如何在一年时间从理事单位晋升为副理事长单位,分享双方在AI、安全层面的最新合作成果。
PAS工具分享 - FrameScope与RTRadar
云计算服务的主营业务之一便是资源售卖,云厂商会采购不同平台、不同型号的服务器,通过池化技术整合机器资源,再将不同规格的资源弹性售卖给开发者。对开发者而言,是否能够在这众多的云服务器产品中选择出能运行目标程序最佳性能的产品,同时能够在此基础上进一步优化程序性能从而充分利用云资源的性能,是提升上云性价比的第一要务,而FrameScope可以协助用户快速应对上述场景。在应用性能评估中,事务执行延迟是重要指标之一,随着分布式架构的广泛应用,厂商可通过分布式链路跟踪技术(例如Dapper)将延迟瓶颈定位到单节点上(物理机、虚拟机、容器),然而深入分析单节点上复杂的事务延迟时,现有工具往往显得不足。针对以上问题,阿里云自研了一套工具,通过采集事务关键事件以及内核系统事件,重建事务执行过程、分析依赖关系、量化各影响因素对整体延迟的贡献占比,从而定位延迟瓶颈。
阿里云 Confidential Al 最佳实践
为缓解用户对 AI 模型上云产生的隐私与合规问题,阿里云 Confidential AI(CAI)实现了一种覆盖模型数据生命周期的端到端通用框架,揭示了机密计算在 AI 系统安全方面的重要价值。未来,CAI 将利用远程证明体系提供基于软件供应链的可验证代码透明度,为用户提供独立验证 CAI 隐私和安全保证的能力。
阿里云操作系统迁移最佳实践
针对 OS 迁移升级,龙蜥社区及其理事长单位阿里云均推出了相应的一站式解决方案。通过迁移平台提供的操作系统迁移能力,覆盖操作系统迁移全流程,确保广大用户高效、有保障的升级到龙蜥/阿里云操作系统。
龙蜥社区漏洞管理治理策略与实践
开源软件漏洞治理是构建龙蜥操作系统安全基石的重要一环。本次分享聚焦龙蜥社区的安全漏洞管理体系及其治理策略,包括漏洞情报感知收集、威胁分析与风险评估、漏洞修复及公告披露等流程。同时简单介绍社区在漏洞治理协作上的初步实践,探讨社区漏洞治理未来的优化方向。
Intel® oneAPI 在龙蜥社区里面的支持情况分享|龙蜥大讲堂116期
了解完整的 Intel® oneAPI 软件栈,Intel® oneAPI 软件栈在 Anolis OS 上的实例化的情况,以及 Intel® oneAPI 在龙蜥社区落地的情况进展。Step by step 的学习如何在 Intel Arc770 显卡上通过 Intel® oneAPI 运行 Qwen2 大语言模型。
安全漏洞、eBPF、机密计算、商用密码等技术分享|龙蜥大讲堂113期
龙蜥社区安全漏洞治理策略及漏洞全生命周期等,了解如何通过eBPF强大的数据采集能力和先进的异常检测算法,来提升容器异常检测系统的准确性和效率,了解机密计算技术是如何保护计算时数据安全,如何使用商密算法来解决常见的安全问题。
龙蜥技术委员会主席杨勇致辞|飞天技术沙龙-CentOS 迁移替换专场
在这个关键时刻,企业面临的挑战远不止现有系统的迁移,更要有前瞻性地考虑,那就是选用何种操作系统来支撑未来业务的拓展,确保 IT 基础设施的持续稳健运行。CentOS 停服事件迫使企业深入审视服务器操作系统的长远稳定使用,同时需要妥善解决当前业务平稳过渡。龙蜥社区致力于为广大用户提供一站式迁移解决方案,因此,社区在 CentOS 替换、一云多芯,包括国产化算力、AI 都有成果落地。
龙蜥操作系统
龙蜥社区(OpenAnolis)是面向国际的 Linux 服务器操作系统开源根社区及创新平台,秉承“平等、开放、协作、创新”的原则,理事会由阿里云、统信软件、龙芯、Arm 、Intel 等 24 家国内外头部企业共同组成,有超过 1000 家来自芯片厂商、软件厂商、整机厂商、操作系统厂商等覆盖操作系统全产业链的合作伙伴参与生态共建。