Alibaba Cloud Linux 资源隔离及混部技术
2020年11月5日,OpenAnolis社区(Anolis is not just Linux System)联合Open Infrastructure基金会举办了首场线下meetup,围绕「Cloud Native Infrastructures」主题,各路大牛相聚北京阿里中心。本次活动共计8大议题。来自阿里云、蚂蚁集团、Intel、中国移动、红帽等公司的技术专家围绕内核、容器及虚拟化等云原生基础设施技术展开探讨,解析相关开源技术内幕及社区进展,分享企业落地及实践经验。讲师及内容介绍阿里云高级技术专家庞训磊分享《Alibaba Cloud Linux 资源隔离及混部技术》。Alibaba Cloud Linux资源隔离技术是阿里巴巴经济体的规模化混合部署方案所强依赖的关键技术,是历经多年“双十一”大考的重要落地技术。庞训磊分享了围绕内核中的调度、内存和IO这三大子系统,系统性的讲述Alibaba Cloud Linux内核部分的核心特性实践,探讨了云场景下大规模应用混合部署。
Alibaba Dragonwell:如何基于Anolis的企业级Java应用规模化实践?
云栖大会龙蜥专场论坛有9大主题、14位大咖亲临现场畅聊、分享,为龙蜥社区打 Call、上手龙蜥 OS 沉浸式体验.......来自开源社区领袖、高校专家学者、社区合作伙伴、开源技术专家等 14 位重磅嘉宾坐而论道,《OpenAnolis 龙蜥操作系统开源社区技术创新白皮书》正式发布!本场论坛特邀嘉宾 SegmentFault 思否 COO,开源社副执行长江波为整场论坛主持。云栖系列视频已经上线,欢迎观看:云栖大会龙蜥专场论坛 。讲师及内容介绍阿里云高级技术专家郁磊分享《Alibaba Dragonwell:如何基于Anolis的企业级Jave应用规模化实践?》。郁磊表示,选择阿里巴巴 Dragonwell、Eclipse Temurin 两款发行版,有专业团队,超大规模的十年服务经验,帮助大家进行 Java 企业计算。有 7×24 小时的电话/钉钉支持应急支撑,还有定期的升级推送、迁移服务、根因定位和交付。
多核场景下的 Linux 调度器现状和未来|龙蜥MeetUp
分析了多核场景下Linux调度器的挑战与机遇:优化进程唤醒时随核数增加而递增的idle CPU搜索开销;改进默认时间片调度,使其感知进程工作集、线程数据共享等指标,推进同进程线程组在相同LLC domain唤醒以减少跨核缓存失效;探讨了内核调度器支持的用户态BPF自定义调度与AI结合的潜力,即AI预测进程需求辅助BPF生成智能调度策略。
AI 场景安全防护:基于 eBPF 的勒索病毒、挖矿病毒检测与防御机制|龙蜥MeetUp
分析了AI产业面临的数据、算力与系统安全威胁(如勒索病毒、挖矿病毒)。提出了解决方案:基于eBPF-LSM技术结合勒索病毒行为分析,实现基于诱饵的防御,保障数据完整性与保密性;基于eBPF+kprobe技术结合挖矿病毒动静态特征,实现检测与防御,防止算力滥用;旨在为AI场景构建坚实可靠的安全防线。
调测容器实践|龙蜥MeetUp
况明富提出了将调测工具打包到一个容器内,以容器的方式完成调试环境的"一键式"部署。 调试容器部署后,即可在调测容器内对业务容器或主机系统上的目标的调测,所有的调测活动都可以在此调测容器中进行,使用完后清理此调测容器即可,这样也可避免对主机环境产生污染。这种基于容器的调试方式和策略不仅提高了问题诊断的速度和效率,同时也减少了对生产环境的影响,体现了中兴通讯在容器技术和运维实践方面的先进理念和技术实力。
SysOM 健康度和 Livetrace 的评测方法探索|龙蜥MeetUp
Livetrace 作为一种先进的操作系统级性能分析方法,能够通过不断地监测操作系统、容器运行环境以及应用程序等多个层次的性能指标,深入揭示整体性能瓶颈。借助 Livetrace,软件的性能管理更加稳健,性能表现的可预测性得到显著提升。
组装式 OS 可靠性增强组件实践|龙蜥MeetUp
越来越多的场景对可靠性有更高的要求,如基站、卫星、工业网关、智能汽车等,而当前 Linux 聚焦资源管理机制的实现,不重点关注资源使用策略导致的异常,其主要提供了硬件的可靠性处理,整体上没有体系化的管理手段。同时对于操作系统而言,可组装的定制功能将能在不同的场景下最大化功能价值。面对可靠性增强的需求和挑战,中兴通讯进行了组装式 OS 可靠性增强组件实践,充分覆盖系统各类亚健康事件,并进行对应策略处理,尽可能保障系统的可靠运行,同时提供必要的维测信息,方便后续故障定位。设计上采用可组装思路,利用 ftrace、kprobes 及 eBPF 技术进行功能解耦,可以很好地满足多场景下 OS 可靠性增强需求。
PAS工具分享 - FrameScope与RTRadar
云计算服务的主营业务之一便是资源售卖,云厂商会采购不同平台、不同型号的服务器,通过池化技术整合机器资源,再将不同规格的资源弹性售卖给开发者。对开发者而言,是否能够在这众多的云服务器产品中选择出能运行目标程序最佳性能的产品,同时能够在此基础上进一步优化程序性能从而充分利用云资源的性能,是提升上云性价比的第一要务,而FrameScope可以协助用户快速应对上述场景。在应用性能评估中,事务执行延迟是重要指标之一,随着分布式架构的广泛应用,厂商可通过分布式链路跟踪技术(例如Dapper)将延迟瓶颈定位到单节点上(物理机、虚拟机、容器),然而深入分析单节点上复杂的事务延迟时,现有工具往往显得不足。针对以上问题,阿里云自研了一套工具,通过采集事务关键事件以及内核系统事件,重建事务执行过程、分析依赖关系、量化各影响因素对整体延迟的贡献占比,从而定位延迟瓶颈。
龙蜥社区漏洞管理治理策略与实践
开源软件漏洞治理是构建龙蜥操作系统安全基石的重要一环。本次分享聚焦龙蜥社区的安全漏洞管理体系及其治理策略,包括漏洞情报感知收集、威胁分析与风险评估、漏洞修复及公告披露等流程。同时简单介绍社区在漏洞治理协作上的初步实践,探讨社区漏洞治理未来的优化方向。
车载操作系统信息安全架构
随着汽车产业智能化、网联化发展,其安全性与隐私保护方面的问题也日益凸显。 车载操作系统作为汽车产业智能化核心,安全更是重中之重。中兴通讯打造的 safetylinux 操作系统,提出了包括安全启动、安全通信、安全存储、安全诊断和入侵检测等要素在内的车载操作系统信息安全架构,为汽车产业的信息安全保驾护航。
加速推进 AI+OS 深度融合,打造最 AI 的服务器操作系统 | 2024龙蜥大会主论坛
操作系统如何满足 AI 应用场景需求?未来发展趋势如何?2024 龙蜥操作系统大会上,龙蜥社区副理事长张东分享了题为《智算引领 系统创新》的主题演讲,指出 AI 原生应用对操作系统提出更高要求,需要以应用为导向、以系统为核心进行架构创新设计,要打造最 AI 的服务器操作系统。
龙蜥技术委员会主席杨勇致辞|飞天技术沙龙-CentOS 迁移替换专场
在这个关键时刻,企业面临的挑战远不止现有系统的迁移,更要有前瞻性地考虑,那就是选用何种操作系统来支撑未来业务的拓展,确保 IT 基础设施的持续稳健运行。CentOS 停服事件迫使企业深入审视服务器操作系统的长远稳定使用,同时需要妥善解决当前业务平稳过渡。龙蜥社区致力于为广大用户提供一站式迁移解决方案,因此,社区在 CentOS 替换、一云多芯,包括国产化算力、AI 都有成果落地。
基于Intel RDT平台技术的系统资源隔离能力提升|龙蜥大讲堂103期
介绍 Intel RDT 发展概述;RDT 与 NRI 在 Koordinator 混部框架中的开发进展与未来规划。
低延迟高密度的云原生系统|2023龙蜥操作系统大会
云原生是新一代云计算的主要形态,其中用户应用具有低延迟响应的核心需求,云平台具有高密度部署的核心需求。为满足上述需求,面临着复杂工作流调度、高密高并发启动、低冲突混合部署、动态瓶颈消除的技术难题。该报告介绍了微服务工作流高效调度、容器运行时及启动优化、共享资源隔离管控、QoS 快速恢复等方面所进行的系列研究,有效地解决了上述难题。
携手共创,谱写龙蜥操作系统新篇章|2023龙蜥操作系统
龙蜥社区与统信软件一直携手并进,共同致力于构建一个更加繁荣、健康的龙蜥社区生态。作为龙蜥社区的副理事长单位,统信软件参与了龙蜥社区19个SIG组,并在内核、安全、迁移工具、产品测试等SIG组作为主要维护者和贡献者,为龙蜥社区的发展贡献了大量的技术和资源。
中兴通讯携手龙蜥社区,共创繁荣生态 | 2023龙蜥操作系统大会
本次大会上,中兴通讯|新支点等 3 家企业凭借对社区开源生态建设的卓越贡献,升级为龙蜥社区“新晋副理事长单位”,中兴通讯操作系统技术总工徐立锋与浪潮信息副总裁 DonnyZhang、Intel 技术总监杨继国上台接受授牌,共同开启“同心共行·共建龙蜥”的新里程道路。与此同时,为表彰中兴通讯在 2023 年在龙蜥社区中投入的显著成果,中兴通讯操作系统技术总工徐立锋获得「2023 年度龙蜥社区卓越贡献奖」,并在大会现场进行了颁奖。除此之外,中兴通讯也开设了分论坛和专区。
开放原子开源基金会孙文龙致辞|2023龙蜥操作系统大会
自 2020 年以来,龙蜥社区集聚产业力量,为开源操作系统发展,全球开源操作系统生态的繁荣做出了突出贡献,也欣喜地见证了龙蜥社区发展壮大的历程。
2023龙蜥操作系统大会主论坛-聚力生态 · 共筑未来
生态为本,技术为根,国产操作系统发展壮大的根本在于建立一个长期主义的生态体系,打造真正具备生命力的操作系统。该主论坛将深入解析龙蜥在“云+AI”方向持续探索的创新成果和生态布局,使与会者领略技术跃迁,展示平等、开放、共赢、繁荣的龙蜥生态,携手伙伴、用户和开发者共筑产业可持续发展的未来。讲师/嘉宾简介院士、高校教授、技术专家等
2023·LLUG :简单聊聊 BPF | 深圳站
Linux 中国的核心贡献者 Locez 为参会者分享了 BPF 的背景,帮助大家理解什么是 BPF,并通过一些现场的示例,帮助开发者了解 BPF 的能力范畴。
云场景下运维的核心痛点及解决方案研讨|龙蜥社区系统运维 MeetUp
阿里云系统服务负责人冯富秋主持了主题为《云场景下运维的核心痛点及解决方案研讨》的圆桌讨论,来自清华大学博士,云杉网络研发 VP 向阳,谐云科技 CTO 苌程,乘云数字公司创始人度远,乐维创始人丁振兴,龙蜥社区系统运维 SIG Maintainer 张毅,观测云系统工程师张文杰,擎创科技可观测产品总监何晶,浙江大学城市学院教授李飞参加了讨论,嘉宾就运维的痛点、突破点和价值点三个方向的议题展开了热烈的讨论。
云原生技术在容器方面的应用|龙蜥大讲堂54期
CXL 作为下一代高带宽低延迟的互联协议,即将被广泛应用在数据中心之中。本次活动主要介绍了 CXL 的基础概念和规范,当前 Linux 内核和硬件厂商 Intel 对于 CXL 的支持,以及龙蜥社区对于 CXL 的规划。
龙蜥对Intel下一代芯片SPR的支持及Anolis 23 产品规划介绍 | 龙蜥大讲堂50期
龙蜥社区对 Intel 平台的支持一直领先于业界,紧随 Intel 研发节奏,基于 Intel Arch SIG 第一时间完成对 SPR 产品全面的支持,助力龙蜥用户以开箱即用的方式,享用新技术特性。本次例会我们会详细介绍龙蜥社区对 SPR 平台特性的支持,包括但不限于性能、安全、虚拟化、加速器等方面。另外本次例会将对外分享 Anolis 23 产品规划,广大社区用户可以提前一览 Anolis 23 系统特性及之后的版本策略,提前布局业务系统。
SysOM 操作系统运维平台的介绍和使用方法|龙蜥大讲堂42期
通过本次讲解,可以了解到操作系统相关运维知识,包括监控,宕机分析,系统诊断,安全等相关专业知识,了解 SysOM 操作系统运维平台的部署方法,以及使用方法,能够通过部署 SysOM 平台,对自己的操作系统进行系统级别的运维和诊断。
plugsched : Linux 内核调度器子系统热升级|龙蜥大讲堂18期
plugsched 是 Linux 内核调度器子系统热升级的 SDK,它可以实现在不重启系统、应用的情况下动态替换调度器子系统,毫秒级 downtime 。plugsched 可以对生产环境中的内核调度特性动态的进行增、删、改,以满足不同场景或应用的需求,且支持回滚。
使用高性能网络协议栈 SMC-R 透明加速 TCP 应用 | 龙蜥大讲堂15期
TCP 协议作为当前使用最为广泛的网络协议,场景遍布移动通信、数据中心等。对于数据中心场景,通过弹性 RDMA 实现高性能网络协议 SMC-R,透明替换应用 TCP 协议,实现应用网络透明加速。本次直播分享当前内核协议栈的局限,SMC-R 基于共享内存的网络协议栈原理、如何使用 SMC-R 透明加速 TCP socket 应用以及 SMC-R 在龙蜥社区的工作和未来展望。
下一代计算架构下操作系统的挑战
随着摩尔定律的放缓,使得整体算力从依赖制程的提升,走向大规模分布式异构计算。异构计算资源池化、内存池化与扩展等新型计算架构开始应用,面对新一代计算架构给当前系统带来的挑战。王彦伟在本次分享中首先对以数据为中心的计算架构进行了探讨,并对资源池化、计算资源远程映射、高速互连机制等关键技术进行了详细介绍,尝试分析了上述架构对操作系统提出的新需求及挑战。
企业级存储与操作系统的协同设计
随着数字经济的发展,数据即资源已经成为共识,其与土地、劳动力、技术、资本并成为五大基础资源,在数据基础设施中,存储平台扮演了核心角色。数据基础设施在多场景化、数据巨量化、多态化等方面对存储提出了越来越多的挑战和要求。孟宪伟通过本次演讲就企业级存储当前面临的挑战,面向极致可靠、极致可用、极致性能、极致安全四个方面,分享和探讨了企业级存储与操作系统协同设计的现状和未来。
龙蜥社区走进Intel MeetUp 理事杨继国致辞
Intel 是龙蜥社区首批理事成员单位,多次参加技术委员会和运营委员会的工作,创建并维护 Intel 架构兴趣小组,将 Intel 的新平台、新特性、新优化都贡献并集成到龙蜥社区发行版中,使得广大平台用户能第一时间在龙蜥操作系统上获得对新平台的支持,进而使得龙蜥操作系统在全球范围内的操作系统发行版本中走在前列。 龙蜥社区自成立以来吸引了众多业界生态伙伴以及广大开源开发者的广泛参与。我觉得以下两方面特别重要: 第一点是不同领域的生态伙伴的加入,整个生态结构更加多样和完整。龙蜥社区生态伙伴已超过两百家,涵盖了不同的领域,生态更加丰富健壮。 第二点是广泛的开发者参与,社区更具生命力和活力。龙蜥社区已经建立了多个技术方向的特殊兴趣小组,不断吸引着广大开发者加入到社区,推动社区在各个技术领域上的创新。
联通基于龙蜥操作系统的实践
联通软件研究院副总架构师肖微做了《联通基于龙蜥操作系统的实践》主题演讲,分享内容主要包含三个方面:第一个是联通对于操作系统的现状和诉求,第二个是联通在龙蜥社区里面的一些工作和联通内部基于龙蜥操作系统的一个实践情况,第三个是联通对于整个操作系统未来工作的一些展望和技术的诉求。 “操作系统向下管理硬件、向上管理应用软件,因此操作系统是一个非常好的生态,所以不仅仅只是联通,操作系统的工作需要整个产业进行协同。联通做这操作系统的创新也是希望和龙蜥社区,以及整个产业链一起,共同打造一个非常好的生态。龙蜥社区中立、开放的运营理念和分层分类的标准化的技术理念,作为社区成员非常认可,作为用户也是非常赞扬,希望一起共同把社区和操作系统做好。”
龙蜥操作系统
龙蜥社区(OpenAnolis)是面向国际的 Linux 服务器操作系统开源根社区及创新平台,秉承“平等、开放、协作、创新”的原则,理事会由阿里云、统信软件、龙芯、Arm 、Intel 等 24 家国内外头部企业共同组成,有超过 1000 家来自芯片厂商、软件厂商、整机厂商、操作系统厂商等覆盖操作系统全产业链的合作伙伴参与生态共建。