多核场景下的 Linux 调度器现状和未来|龙蜥MeetUp
分析了多核场景下Linux调度器的挑战与机遇:优化进程唤醒时随核数增加而递增的idle CPU搜索开销;改进默认时间片调度,使其感知进程工作集、线程数据共享等指标,推进同进程线程组在相同LLC domain唤醒以减少跨核缓存失效;探讨了内核调度器支持的用户态BPF自定义调度与AI结合的潜力,即AI预测进程需求辅助BPF生成智能调度策略。
Confidential AI:基于机密计算的 AI 推理安全与隐私保护方案|龙蜥MeetUp
针对AI在医疗、金融等敏感领域应用带来的数据隐私与模型安全推理问题,介绍了基于机密计算技术的Confidential AI解决方案。解析了如何在机密计算环境中实现端到端安全推理,涵盖加密模型部署、端到端通信安全、系统数据落盘加密保护等关键技术,旨在为行业提供可复用的安全推理框架。
Co-Sight:基于多 Agent 动态规划与分层反思的下一代 AI 决策系统|龙蜥MeetUp
探讨了AI技术应用于复杂任务时,传统大语言模型(LLM)在动作决策和多步推理上的局限性。构建具备自主规划与动态纠偏能力的智能体系统成为关键挑战。中兴通讯介绍了其Co-Sight框架,该框架通过多Agent协同架构(Plan-Actor-Memory)实现任务降维,结合实时上下文精炼消除冗余,并依托分层反思系统生成奖惩信号以动态优化DAG执行路径。其核心创新在于关注点分离与闭环反思机制。在GAIA评测中,Co-Sight以72.73%综合得分超越Google DeepMind与OpenAI,在复杂多步任务(L2级)中稳定性显著领先。
高效可靠的处理器微体系结构性能测量技术
在Arm成熟的软硬件生态支持下,Arm架构处理器走进数据中心。应用的跨平台迁移及处理器设计研发均依赖于处理器微体系结构的性能数据,准确、可靠的性能测量是性能工程的重要基础。本次演讲围绕性能测量,着重分享了两项工作。第一项工作是关于如何高效地复用硬件性能计数器进行可靠测量,此项工作主要针对现有工具在复用硬件性能计数器测量时存在的低效行为,通过研究Linux内核性能事件的调度机制,提出一种自适应的性能事件分组方法提高性能计数器的复用效率。第二项工作是关于Arm架构处理器实时内存带宽的通用测量方法,Arm架构的灵活性赋予了各硬件厂商定制处理器的能力。此项工作探索了Arm架构下实时内存带宽测量通用方案的可能性。
为RTP-LLM提供Arm CPU后端,助力Arm AI软件生态持续发展
随着大语言模型(LLM)的普及与应用,AI计算需求快速增长。许多LLM模型运行在基于GPU的硬件上,而随着Arm架构不仅在边缘设备,而且在数据中心领域也愈发流行,如何让RTP-LLM(实时推理框架)有效支持Arm CPU平台变得尤为重要。通过优化LLM在Arm平台的推理性能,可以进一步提升功耗效率和模型部署的灵活性。
OS 升级迭代与向前向后兼容问题
操作系统升级迭代过程中,如何保障不影响用户的业务系统,如何让“更新"对用户透明,又能持续增强系统的能力。本次 MeetUp 上,方德分享了他们的方案。
车载操作系统信息安全架构
随着汽车产业智能化、网联化发展,其安全性与隐私保护方面的问题也日益凸显。 车载操作系统作为汽车产业智能化核心,安全更是重中之重。中兴通讯打造的 safetylinux 操作系统,提出了包括安全启动、安全通信、安全存储、安全诊断和入侵检测等要素在内的车载操作系统信息安全架构,为汽车产业的信息安全保驾护航。
圆桌会议:聚焦AI时代机遇下操作系统产业的进化与重构 | 2024龙蜥大会主论坛
中国工程院院士陈纯,中国开源软件推进联盟副主席刘澎,阿里巴巴集团合伙人、阿里云基础设施事业部总经理蒋江伟,中兴通讯中心研究院副院长刘东等五位嘉宾,现场进行了主题为“聚焦AI时代机遇下操作系统产业的进化与重构”的产业圆桌讨论,结合龙蜥社区和龙蜥操作系统(Anolis OS)的近期动态,深入探讨了开源操作系统的发展历史与挑战,AI 与操作系统的融合创新和协同发展等话题。
专有云CentOS迁移替换实践分享|飞天技术沙龙-CentOS迁移替换专场
阿里云高级技术专家谢家森围绕用户上云/迁云、自动化迁移管理平台技术开发以及 OS 迁移产品化流程等方面展开详细介绍。他表示,得益于操作系统团队提供的技术优化能力,以及成熟的迁移技术工具,阿里云和龙蜥社区为用户提供成熟和稳定的迁移方案,帮助大家从 CentOS 7/8 迁移到 Alibaba Cloud Linux /Anolis OS。
云上体验最佳的服务器操作系统 - Alibaba Cloud Linux | 飞天技术沙龙-CentOS 迁移替换专场
从 Alinux 的产生背景、产品优势以及云上用户使用 Alinux 享受的技术红利等方面详细进行了介绍。同时,通过国内某社交平台、某快递企业、某手机客户大数据业务 3 大案例,成功助力客户实现弹性扩容能力提升、性能提升、降本增效。
低延迟高密度的云原生系统|2023龙蜥操作系统大会
云原生是新一代云计算的主要形态,其中用户应用具有低延迟响应的核心需求,云平台具有高密度部署的核心需求。为满足上述需求,面临着复杂工作流调度、高密高并发启动、低冲突混合部署、动态瓶颈消除的技术难题。该报告介绍了微服务工作流高效调度、容器运行时及启动优化、共享资源隔离管控、QoS 快速恢复等方面所进行的系列研究,有效地解决了上述难题。
浪潮信息副总裁Donny Zhang致辞|2023龙蜥操作系统大会阿里云分论坛
云计算是改变整个产业生态的重要力量,随着新应用类型的不断出现,它的位置仍然举足轻重,特别是在人工智能这样的一个时代,大算力、大数据、高吞吐、低带宽的网络的需求越来越大。操作系统在整个云计算基础设施里面起到了非常核心的作用,阿里云作为国内云计算方面的领军企业,有雄厚的技术和经验积累,并把在基础软件操作系统方面的一些积累贡献给了龙蜥社区。经过三年发展,龙蜥社区已成为国内领先的操作系统开源根社区,它通过开源、开放的模式来发展下一代操作系统。浪潮信息作为国内最主要的算力基础设施供应商,联合阿里云及其他的合作伙伴,共同把社区建设成中国最好的操作系统社区,未来也将成为国际最重要的操作系统社区之一。
全面进化一云多芯分论坛-2023龙蜥操作系统大会
一云多芯是云化数据中心为用户提供异构硬件资源能力的关键技术,用一套云操作系统来管理不同架构的硬件服务器集群。本技术专题将联合龙蜥社区理事单位,社区成员,以及国产化芯片厂商,介绍在通用,异构计算场景,龙蜥社区如何在操作系统,编译器,基础软件生态等各方面对底层各种芯片架构提供支持。讲师/嘉宾简介技术专家
Arm 架构下性能优化经验分享 | 龙蜥社区走进 Arm MeetUp
从实用角度解读如何在 Arm 平台上进行业务软件的性能测评、分析及优化,涵盖负载配置模式的选择、波动因素的消除、宏观经验调优及多层配合(应用层、系统层及微架构层)的深度性能优化,充分挖掘底层基于 Arm 架构硬件的性能潜力。
Intel 机密计算技术 SGX 及其与 Anolis OS 适配介绍 | 龙蜥大讲堂51期
介绍 SGX 软件栈,主要包括 SDK 和平台软件(PSW)/(数据中心认证原语)DCAP。
eBPF Hardware Offloading | 龙蜥大讲堂53期
在如今 CPU 算力非常宝贵的场景下,eBPF 程序如果能卸载到硬件去执行,那将会带来非常大的收益。 以前我们都专注于 eBPF 在跟踪、诊断、网络及安全上的应用,本次王璞老师将在eBPF 的指令架构以及如何实现 eBPF 的硬件卸载等方面给我们带来很不一样的技术分享。
SysOM 操作系统运维平台的介绍和使用方法|龙蜥大讲堂42期
通过本次讲解,可以了解到操作系统相关运维知识,包括监控,宕机分析,系统诊断,安全等相关专业知识,了解 SysOM 操作系统运维平台的部署方法,以及使用方法,能够通过部署 SysOM 平台,对自己的操作系统进行系统级别的运维和诊断。
利用 micro-VM 快照机制对 FaaS 冷启动加速的探索与实践 | 龙蜥大讲堂36期
本次双周会会进一步讨论 SIG 组件引入的规范,同时由 Intel 资深云计算软件架构师介绍 Intel 在 micro-vm 快速启动的探索,听众可以获取云原生函数计算场景下,实例快速置备、快速启动的解决方案。
龙蜥社区软件包集成流程 | 龙蜥大讲堂29期
龙蜥社区欢迎广大开发者积极贡献软件包到 Anolis OS 中,集成过程需要遵循相应的软件包仓库结构和规则。本次直播帮助龙蜥社区软件开发人员熟悉新增软件包的集成流程。
如何测试硬件设备与龙蜥操作系统的兼容性?|龙蜥大讲堂12期
硬件生态是一个操作系统的重要基石。但是硬件种类众多,各种各样的服务器和板卡外设,这些硬件设备与龙蜥操作系统(Anolis OS)各个发行版的兼容性如何?如何评估?龙蜥操作系统的潜在用户如何查询自己的硬件设备与龙蜥操作系统的兼容性?这次就和大家聊一聊龙蜥社区硬件兼容性 SIG 的主要工作,包括龙蜥社区硬件兼容性列表、硬件兼容性申请流程以及硬件兼容性测试套件 ancert 用法等。
龙蜥云原生社区发展 & kata 社区共建
阿里云资深技术专家、龙蜥云原生 SIG 成员刘奖,蚂蚁集团高级技术专家、龙蜥云原生 SIG Maintainer 彭涛为现场嘉宾带来《龙蜥云原生社区发展 & kata 社区共建》主题分享。 刘奖和大家一起探讨了在云原生技术和应用飞速发展的历史机遇下,龙蜥社区支持云原生技术、应用与商业的相关思考。他首先介绍了云原生技术的发展及典型软件架构,接着从云原生技术发展和操作系统自身演进两个方面提出构建“龙蜥云原生操作系统”的必要性和必然性。也分享了龙蜥云原生未来系统架构的构建思路,从一个传统的 OS 支撑 K8S 发行版,到利用容器化的思想构建云原生 OS 的发行版;并重点讲述龙蜥云原生在 OS系统构建的进展,即站在云原生容器化 OS 的思路上,输出Anolis Cloud Native Suite(ACNS),其中会包括容器优化的 OS,以及云原生运行时、节点管控、云原生网络与存储。 彭涛则分享了龙蜥云原生社区与上游社区之间的关系,并以 Kata 社区为主要案例,龙蜥云原生作为链接上游 kata 与下游用户的桥梁,以产品化方式输出给用户使用,并将关键特性贡献到上游社区
龙蜥云原生 SIG 未来建设
阿里云产品专家、龙蜥云原生SIG Contributor黄韶宇在现场为嘉宾分享了《龙蜥云原生 SIG 未来建设》主题演讲。阐述了龙蜥云原生 SIG 的定位和产出:“龙蜥云原生领域的圆桌会议提供者和组件发行版 owner”和“面向开发者的优秀能力组件和面向用户的易用、好用、接地气的云原生发行版和场景化解决方案”。回顾了龙蜥云原生 SIG 的工作,在成立的 4 个月的时间里,龙蜥云原生 SIG 补齐了龙蜥社区里面云原生能力基础并引入了 10 个组件,同时也建立了一些社区的规则,而最重要的关键节点是发布了龙蜥云原生 SIG 的产品 ACNS,提供了高效便捷、安全稳定、强大丰富的云原生套件。最后描述了云原生 SIG 中开发者和用户的相互推动关系,表达了对于开发者和用户的强烈渴望,希望有更多的参与者一起建立繁荣、强大的社区。
基于 kata 的 Serverless 产品体系建设
联通数科云原生技术架构师王琦做了《基于kata的Serverless产品体系建设》主题演讲。介绍了联通云基于Kata进行的 Serverless 产品体系的建设。首先介绍了通过国家政策为牵引,联通云深化自主研发和创新能力,聚焦无服务器技术和 kata 相结合,基于联通云双引擎基座建设 Serverless 产品体系,助力联通乃至央国企应用快速上云。然后通过一个 Serverless k8s 具体产品深入讲解了技术架构设计与场景化的需求,以及在对 Kata 进行选型时候所考虑的几个方面内容和优化方式。最后分享了在国内百花齐放的硬件厂商的大环境下, Serverless 和 Kata 结合多种异构 CPU ,通过无服务器技术屏蔽底层硬件差异的一个展望。
浪潮信息在龙蜥社区的开源实践
浪潮信息以“平台共建、联合创新、繁荣生态”为目标,协同龙蜥社区打造一套完善的操作系统产业生态链,建设并打造技术创新中心、标准制定中心、生态认证中心,推动操作系统产业发展创新。
机密计算与龙蜥社区云原生机密计算 SIG 详细介绍
6 月 11 日 ~ 12 日,龙蜥社区联合 Linux 中国,在北京召开的开放原子全球开放峰会现场组织 LUG 线下沙龙活动,与大家一同聊聊开源、聊聊 Linux 、聊聊社区当中的那些最新的技术。
内存缺陷检测技术以及在中兴内部的工程应用实践
龙蜥社区开发者服务(devFree)MeetUp 内存缺陷检测技术以及在中兴内部的工程应用实践 讲师/嘉宾简介: 程圣宇:中兴通讯操作系统工具平台经理
Cloud Hypervisor or Cloud Native Hypervisor
2020年11月5日,OpenAnolis社区(Anolis is not just Linux System)联合Open Infrastructure基金会举办了首场线下meetup,围绕「Cloud Native Infrastructures」主题,各路大牛相聚北京阿里中心。本次活动共计8大议题。来自阿里云、蚂蚁集团、Intel、中国移动、红帽等公司的技术专家围绕内核、容器及虚拟化等云原生基础设施技术展开探讨,解析相关开源技术内幕及社区进展,分享企业落地及实践经验。讲师及内容介绍Intel 系统软件部云原生基础设施软件研发经理朱江云介绍Cloud Hypervisor诞生的缘起,从其架构和特性的介绍,我们可以看到Cloud Hypervisor是一款为云原生打造的虚拟机管理器。Clou Hypervisor技术委员会成员刘奖分享了云原生基础设施对于Kata Containers和Cloud Hypervisor在理论和实践上的根本诉求,给了大家进一步的思考和启发。
Alibaba Cloud Linux 资源隔离及混部技术
2020年11月5日,OpenAnolis社区(Anolis is not just Linux System)联合Open Infrastructure基金会举办了首场线下meetup,围绕「Cloud Native Infrastructures」主题,各路大牛相聚北京阿里中心。本次活动共计8大议题。来自阿里云、蚂蚁集团、Intel、中国移动、红帽等公司的技术专家围绕内核、容器及虚拟化等云原生基础设施技术展开探讨,解析相关开源技术内幕及社区进展,分享企业落地及实践经验。讲师及内容介绍阿里云高级技术专家庞训磊分享《Alibaba Cloud Linux 资源隔离及混部技术》。Alibaba Cloud Linux资源隔离技术是阿里巴巴经济体的规模化混合部署方案所强依赖的关键技术,是历经多年“双十一”大考的重要落地技术。庞训磊分享了围绕内核中的调度、内存和IO这三大子系统,系统性的讲述Alibaba Cloud Linux内核部分的核心特性实践,探讨了云场景下大规模应用混合部署。
如何系统化搭建超智融合算力架构|龙蜥大讲堂第139期
联科集团加入龙蜥社区多年,一直与龙蜥保持深度合作,其超智融合算力管理平台 CHESS 与 Anolis OS 的完成了兼容适配认证。联科集团联席合伙人付鸿雁结合联科集团 25 年深耕高性能计算的经验,系统化解析超智融合算力中心的搭建路径,实现整套集群从芯片、存储、网络到操作系统、算力调度、系统运维完成超算和智算真正的融合。
调测容器实践|龙蜥MeetUp
况明富提出了将调测工具打包到一个容器内,以容器的方式完成调试环境的"一键式"部署。 调试容器部署后,即可在调测容器内对业务容器或主机系统上的目标的调测,所有的调测活动都可以在此调测容器中进行,使用完后清理此调测容器即可,这样也可避免对主机环境产生污染。这种基于容器的调试方式和策略不仅提高了问题诊断的速度和效率,同时也减少了对生产环境的影响,体现了中兴通讯在容器技术和运维实践方面的先进理念和技术实力。
SysOM 健康度和 Livetrace 的评测方法探索|龙蜥MeetUp
Livetrace 作为一种先进的操作系统级性能分析方法,能够通过不断地监测操作系统、容器运行环境以及应用程序等多个层次的性能指标,深入揭示整体性能瓶颈。借助 Livetrace,软件的性能管理更加稳健,性能表现的可预测性得到显著提升。
龙蜥操作系统
龙蜥社区(OpenAnolis)是面向国际的 Linux 服务器操作系统开源根社区及创新平台,秉承“平等、开放、协作、创新”的原则,理事会由阿里云、统信软件、龙芯、Arm 、Intel 等 24 家国内外头部企业共同组成,有超过 1000 家来自芯片厂商、软件厂商、整机厂商、操作系统厂商等覆盖操作系统全产业链的合作伙伴参与生态共建。