英特尔®资源调配技术(英特尔®RDT)与业务混布
崔龙一开始介绍了多核心服务器上,由于资源共享带来的云上服务 QoS 波动,以及 Intel RDT特性对于内存带宽和 L3 cach e用量的监测和分配技术对于保证 QoS 的保障作用 ,intel RDT 特性在上游 Kernel 的支持情况。接着详细介绍了如何通过 pqos 和 Kernel resctrl 接口使用 Intel RDT。同时还以 speccpu 为例,说明了不同负载,对资源的敏感程度差异较大。最后介绍了一系列 Intel RDT 在实际业务混部中部署的实例。
手机内核稳定性的治理与实践
我们了解的 Linux 稳定性都是基于 x86 和 Arm 服务器上的,然而在手机上的系统稳定性,也值得我们去一探究竟。魅族科技高级工程师、龙蜥系统运维SIG Contributor 白浩文与嘉宾一起谈一谈《手机内核稳定性的治理与实践》。他首先简要介绍了稳定性问题的来源,以及开发过程。重点举例介绍了运行时动态检测的一些方法以及相关原理。在实践中,魅族手机在开发阶段引入了一些新的特性来提高捕捉内存异常的概率,其中也包括从上游龙蜥社区引入的改进特性。为了全方位监控和解决稳定性问题,魅族也在智能化分析问题和提升效能方面做了相应工作。最后,还作了简要的总结和阐述所面临的一些挑战。
联通基于龙蜥操作系统的实践
联通软件研究院副总架构师肖微做了《联通基于龙蜥操作系统的实践》主题演讲,分享内容主要包含三个方面:第一个是联通对于操作系统的现状和诉求,第二个是联通在龙蜥社区里面的一些工作和联通内部基于龙蜥操作系统的一个实践情况,第三个是联通对于整个操作系统未来工作的一些展望和技术的诉求。 “操作系统向下管理硬件、向上管理应用软件,因此操作系统是一个非常好的生态,所以不仅仅只是联通,操作系统的工作需要整个产业进行协同。联通做这操作系统的创新也是希望和龙蜥社区,以及整个产业链一起,共同打造一个非常好的生态。龙蜥社区中立、开放的运营理念和分层分类的标准化的技术理念,作为社区成员非常认可,作为用户也是非常赞扬,希望一起共同把社区和操作系统做好。”
Serverless Computing的技术架构
上海交通大学计算机系教授陈全带来《Serverless Computing的技术架构》主题分享。Serverless Computing 也称为服务器无感知计算或者无服务器计算,在云原生时代起到了重要作用。在本报告中,陈全从技术特点、分层结构、未来展望等三个方面对其进行了简要介绍。首先,介绍了Serverless Computing在云平台中的定位与技术特色,并讨论了其面临的主要挑战。随后,探讨了现有各类Serverless Computing平台的抽象分层结构,包括:虚拟化层、封装层、系统层等;并对各层现在所采用的的各类技术方案进行了分类与总结。最后,对Serverless Computing未来的通用化、高效化、智能化的发展趋势进行了展望。
详谈龙蜥社区一站式构建平台 ABS | 龙蜥大讲堂 86 期
直播内容: 1)主要介绍软件包构建、镜像构建、内核源码构建、云原生构建 4 大构建服务。 2)ABS 未来规划。 听众受益: 了解龙蜥社区官方构建平台 ABS,熟悉 Anolis OS 软件包、镜像构建流程。 适合人群: 从事操作系统开发,有软件包、镜像构建需求的开发者。 讲师介绍: 单凯伦,龙蜥社区基础设施 Contributor,主要负责基础设施协作工程体系的开发工作,包括社区构建服务平台 ABS、资源服务平台龙蜥实验室、社区官网、测试服务平台 T-One、Bugzilla、邮件列表等。
IAA 加速热迁移方案介绍
IAA 加速器是 Intel SPR 平台携带的用于压缩/解压缩的硬件加速器。刘源详细介绍了 IAA 加速器软件栈, IAA 加速热迁移方案以及 IAA 高效的处理任务、 IAA 压缩无需内存拷贝等技术。
libvirt 虚拟机热迁移流程简介 |龙蜥大讲堂81期
直播主题:libvirt 虚拟机热迁移流程简介 直播时间:2023 年 05 月 31 日(周三)16:00-17:00 直播内容: libvirt 是用于管理虚拟机的开源项目,是各大基于 OpenStack 二次开发的云平台管理底层 qemu-kvm 虚拟机的核心组件,而热迁移作为虚拟机管理中较为常用的功能,其在稳定性和效率关乎云平台的整体使用体验,本次分享主要讲解虚拟机热迁移在 libvirt 项目中的主要流程及迁移参数作用和影响。 听众受益: 了解 libvirt 虚拟机热迁移整体流程,迁移方式及关键迁移参数作用及影响。 适合人群: 云计算研发人员。 讲师介绍: 李东世,浪潮数据云计算高级研发工程师,负责浪潮数据云平台核心功能开发及维护,主导底层虚拟化相关功能开发、问题定位处理。
libvirt 虚拟机热迁移流程简介
直播主题:libvirt 虚拟机热迁移流程简介 直播时间:2023 年 05 月 31 日(周三)16:00-17:00 直播内容: libvirt 是用于管理虚拟机的开源项目,是各大基于 OpenStack 二次开发的云平台管理底层 qemu-kvm 虚拟机的核心组件,而热迁移作为虚拟机管理中较为常用的功能,其在稳定性和效率关乎云平台的整体使用体验,本次分享主要讲解虚拟机热迁移在 libvirt 项目中的主要流程及迁移参数作用和影响。 听众受益: 了解 libvirt 虚拟机热迁移整体流程,迁移方式及关键迁移参数作用及影响。 适合人群: 云计算研发人员。 讲师介绍: 李东世,浪潮数据云计算高级研发工程师,负责浪潮数据云平台核心功能开发及维护,主导底层虚拟化相关功能开发、问题定位处理。
Cloud Hypervisor or Cloud Native Hypervisor
2020年11月5日,OpenAnolis社区(Anolis is not just Linux System)联合Open Infrastructure基金会举办了首场线下meetup,围绕「Cloud Native Infrastructures」主题,各路大牛相聚北京阿里中心。本次活动共计8大议题。来自阿里云、蚂蚁集团、Intel、中国移动、红帽等公司的技术专家围绕内核、容器及虚拟化等云原生基础设施技术展开探讨,解析相关开源技术内幕及社区进展,分享企业落地及实践经验。讲师及内容介绍Intel 系统软件部云原生基础设施软件研发经理朱江云介绍Cloud Hypervisor诞生的缘起,从其架构和特性的介绍,我们可以看到Cloud Hypervisor是一款为云原生打造的虚拟机管理器。Clou Hypervisor技术委员会成员刘奖分享了云原生基础设施对于Kata Containers和Cloud Hypervisor在理论和实践上的根本诉求,给了大家进一步的思考和启发。
开源操作系统社区和生态
观看其他分论坛内容阿里云开发者大会主论坛大数据与AI一体化开发平台视觉AI开发平台及其行业应用云原生数据库:一站式数据服务前沿人工智能技术与算法实践从1到∞ :极致原生安全云原生技术与最佳实践钉应用开发:人人都是工程师基础设施的云上管控应用开发的云基础设施优化开源操作系统社区和生态泛云生态人才培养合作智能开发与高效运维RISC-V技术趋势与芯片应用实践AIoT云端一体加速设备智能
具身智能场景下端到端确定性挑战与思考|龙蜥MeetUp
探讨了具身智能系统,其核心在于构建紧密耦合的“感知-融合-决策-执行”闭环,使机器能实时理解并作用于物理世界。指出实现面临的主要挑战:需达成高实时性、强鲁棒性的多模态感知融合,并进行高效动态决策与控制。该演讲以智能机器人为核心示例,聚焦基于Ubuntu + ROS2构建的主流机器人操作系统生态,探讨了OS在具身智能中的关键角色及其面临的端到端确定性问题。
AArch64架构调用链性能数据采集原理
调用链 (Callchain) 是软硬件事件上下文信息之一,对性能优化和故障排具有非常重要的作用。如著名的火焰图 (Flamegraph) 就是对调用链信息汇总统计和可视化的结果。但是在调用链收集的过程中,工程师往往因为不了解底层的采集原理导致调用链收集不完整,采集开销不可控等问题。本议题核心介绍了在AArch64架构下调用链采集的原理,比较它们之间的不同和阐述适用场景。同时对Linux内核态和eBPF调用链采集做了一些简单介绍。
Intel® oneAPI 在龙蜥社区里面的支持情况分享|龙蜥大讲堂116期
了解完整的 Intel® oneAPI 软件栈,Intel® oneAPI 软件栈在 Anolis OS 上的实例化的情况,以及 Intel® oneAPI 在龙蜥社区落地的情况进展。Step by step 的学习如何在 Intel Arc770 显卡上通过 Intel® oneAPI 运行 Qwen2 大语言模型。
obdiag:一款OceanBase 数据库诊断的利器
了解OceanBase分布式数据库及其诊断现状,快速洞悉obdiag作为OceanBase敏捷诊断工具的项目价值及其设计与实现,提前知晓obdiag未来规划。
阿里云操作系统迁移最佳实践|飞天技术沙龙-CentOS 迁移替换专场
Alibaba Cloud Linux /Anolis OS 兼容 CentOS 生态,因此能够很丝滑的进行迁移替换。无论是对企业的运维人员,还是对企业操作系统的使用者来说,相对简化了它的维护成本。王喆还通过 SMC 操作系统迁移实践带用户深入了解,不仅阐述了原地迁移方案的独特优势,还针对不同的迁移场景,逐步剖析了整个迁移流程,力求使复杂的操作变得直观易懂,实现了真正的“白屏化”体验。
Intel 平台新特性助力龙蜥 OS 云计算 | 龙蜥大讲堂101期
了解英特尔最新平台 Sapphire Rapids 和 Emerald Rapids 引入的新特性。介绍英特尔在龙蜥 OS 中的新特性支持,尤其是新特性对虚拟化场景的支持。
Alibaba Cloud Linux 解锁云算力 - 软硬协同构建云上最佳操作系统体验
分享如何通过 Alibaba Cloud Linux 做南向和北向的协同,解锁阿里云的底层算力,以及 Alibaba Cloud Linux 和龙蜥社区的关系,以及如何基于芯片做全栈协同设计和优化。最后,李三红做了 C/C++ 编译器套件+Java 解读。
释放云算力 繁荣云生态|2023龙蜥操作系统大会
贾正华在分享中介绍了 Alibaba Cloud Linux 通过在稳定性、安全、性能、服务支持上持续建设,为用户提供更好的云上操作系统体验,发展成为阿里云上部署规模最大的操作系统。同时面向未来AI智算场景,Alibaba Cloud Linux 希望通过提供开箱即用的 AI 容器镜像,为用户的 AI 应用场景,提供一个易用性、稳定性、安全性、性能都更好的运行环境。
打造多元算力基座,助力生态共建共赢 | 2023龙蜥操作系统大会
作为专业从事服务器、终端整机产品的研发生产、方案设计及实施服务的科技企业,浪潮与统信软件携手共筑产业生态,双方紧密合作,围绕产品共同助力打造核心竞争力与可持续发展能力。未来,双方将继续在技术研发、生态联合、品牌市场、服务体系等方面深化合作,打造中国基础软硬件生态合作新标杆。
云智融合浪潮之下,打造中国操作系统黄金时代 | 2023龙蜥操作系统大会
在云智融合的跨时代浪潮下,阿里云坚持 1+4 开源战略,坚持核心技术的攻关,鼎力支持龙蜥操作系统社区发展,携手产业力量,共同打造中国操作系统的黄金时代。
全面进化一云多芯分论坛-2023龙蜥操作系统大会
一云多芯是云化数据中心为用户提供异构硬件资源能力的关键技术,用一套云操作系统来管理不同架构的硬件服务器集群。本技术专题将联合龙蜥社区理事单位,社区成员,以及国产化芯片厂商,介绍在通用,异构计算场景,龙蜥社区如何在操作系统,编译器,基础软件生态等各方面对底层各种芯片架构提供支持。讲师/嘉宾简介技术专家
浪潮信息分论坛-2023龙蜥操作系统大会
面对智算时代多元异构的计算场景,本论坛顺应软硬协同、开源开放的趋势,围绕操作系统等全栈软件,分享前沿技术、共谋算力发展。讲师/嘉宾简介技术专家
就在明天!2023龙蜥操作系统大会盛大启幕!欢迎关注
2023 龙蜥操作系统大会(OpenAnolis Conference)由开放原子开源基金会指导,龙蜥社区主办,阿里云、浪潮信息、Arm、Intel、中兴通讯、统信软件等24家理事单位共同承办,主题为“云智融合·共筑未来”,陈左宁院士、梅宏院士、陈纯院士、王恩东院士、北航网安学院刘建伟院长、阿里巴巴集团副总裁蒋江伟等一众大咖倾情加盟,聚焦产业趋势、生态合作、人才发展、技术创新等,是集聚政、产、学、研等多方力量打造的年度盛会。首届龙蜥大会将云集全球技术专家和行业大咖,邀请超300家企业和逾千位开发者,共赴本年度聚焦产业升级的岁末盛典,使与会者洞悉行业机遇,把握产业脉动,领略技术跃迁,聆听生态蝶变。
基于龙蜥操作系统Arm架构下软件迁移和优化案例分享|龙蜥社区走进Arm MeetUp
介绍 Arm 架构下常用性能分析工具,结合龙蜥操作系统分享软件移植的注意事项和实际优化案例,从而帮助大家了解 Arm 架构下软件移植、优化过程中的常见问题和优化思路。
Arm 架构下性能指标收集与分析方法|龙蜥社区走进Arm MeetUp
介绍了 Arm 指令集以及微架构下 PMU (通用性能监控单元) 的主要特性以及通过 SPE (统计分析扩展) 进行性能分析的基本方法。
码题诗创始人:高效使用 Arm 服务器的现状、诉求与未来|龙蜥社区走进Arm MeetUp
从工具生态的现状梳理、Arm 生态中各方的诉求分析,推导出未来的工具应该怎样建设才能高效使用 Arm 服务器。
eBPF 与网络可观测性研究 | 龙蜥社区系统运维MeetUp
eBPF 在网络可观测上具有安全灵活、实时追踪等优点,通过运行时加载 DataKit 探针能实现对网络流量的实时分析和统计;基于网络协议的分析,能够为链路系统提供系统侧的 Span 补充。最终在观测云统一可观测平台上展示出请求数、响应时间、错误率等关键指标。
云观测场景下的 Trace 全量存储技术研究 | 龙蜥社区系统运维 MeetUp
乘云数字 DataBuff 产品线架构师狂魔分享了《云观测场景下的 Trace 全量存储技术研究》主题演讲。在分享上提到,DataBuff 正在构建以“ Trace、Metric、Log、Topo、eBPF Flow” 观测五件套为数据原材料的一体化观测平台,Trace 是一体化观测的核心要素,是拓扑驱动现代 AIOps 分析的关键,有着不可替代的地位。当前,业界大多可观测性软件厂商无法解决“Trace 全量存储”的技术难题,大量丢弃客户的交易链数据是普遍现象,在安全合规、故障回溯、算力成本等方面均受到了巨大挑战。乘云数字专门开发了一款 “TraceX 调用链全量存储系统”,面向可观测分析场景、尤其适合大规模交易系统、云原生容器场景,帮助系统实现全量化存储调用链数据。TraceX 能够有效的降低 Tracing 数据的存储成本、提升分析效率,真正达到降本增效的目的。通过 TraceX 辅助一体化观测系统构建应用系统的空间地图,实现故障定位的按图索骥不丢痕,真正解决客户的业务问题。
cni 与混合云场景容器网络 hybridnet 核心技术分享 | 龙蜥大讲堂35期
hybridnet 是一款面向混合云场景的 Kubernetes 容器网络解决方案。它可以帮助用户在物理机和虚拟机的异构环境之上,构建一层 underlay + overlay 的统一网络平面。
龙蜥社区软件包集成流程 | 龙蜥大讲堂29期
龙蜥社区欢迎广大开发者积极贡献软件包到 Anolis OS 中,集成过程需要遵循相应的软件包仓库结构和规则。本次直播帮助龙蜥社区软件开发人员熟悉新增软件包的集成流程。
使用高性能网络协议栈 SMC-R 透明加速 TCP 应用 | 龙蜥大讲堂15期
TCP 协议作为当前使用最为广泛的网络协议,场景遍布移动通信、数据中心等。对于数据中心场景,通过弹性 RDMA 实现高性能网络协议 SMC-R,透明替换应用 TCP 协议,实现应用网络透明加速。本次直播分享当前内核协议栈的局限,SMC-R 基于共享内存的网络协议栈原理、如何使用 SMC-R 透明加速 TCP socket 应用以及 SMC-R 在龙蜥社区的工作和未来展望。
如何测试硬件设备与龙蜥操作系统的兼容性?|龙蜥大讲堂12期
硬件生态是一个操作系统的重要基石。但是硬件种类众多,各种各样的服务器和板卡外设,这些硬件设备与龙蜥操作系统(Anolis OS)各个发行版的兼容性如何?如何评估?龙蜥操作系统的潜在用户如何查询自己的硬件设备与龙蜥操作系统的兼容性?这次就和大家聊一聊龙蜥社区硬件兼容性 SIG 的主要工作,包括龙蜥社区硬件兼容性列表、硬件兼容性申请流程以及硬件兼容性测试套件 ancert 用法等。
企业级存储与操作系统的协同设计
随着数字经济的发展,数据即资源已经成为共识,其与土地、劳动力、技术、资本并成为五大基础资源,在数据基础设施中,存储平台扮演了核心角色。数据基础设施在多场景化、数据巨量化、多态化等方面对存储提出了越来越多的挑战和要求。孟宪伟通过本次演讲就企业级存储当前面临的挑战,面向极致可靠、极致可用、极致性能、极致安全四个方面,分享和探讨了企业级存储与操作系统协同设计的现状和未来。
龙蜥系统运维 SIG 和 eBPF 技术探索 SIG介绍
eBPF & Linux 稳定性专场是由龙蜥系统运维 SIG 和 eBPF 技术探索 SIG 协办,开场主持人毛文安为大家介绍了这两个 SIG 的情况。为大家分享这两大 SIG 的愿景和目标,以及当前 SIG 的重点项目情况和 SIG 的下一步规划。也欢迎大家在龙蜥官网 SIG 组查看详情。
龙蜥操作系统
龙蜥社区(OpenAnolis)是面向国际的 Linux 服务器操作系统开源根社区及创新平台,秉承“平等、开放、协作、创新”的原则,理事会由阿里云、统信软件、龙芯、Arm 、Intel 等 24 家国内外头部企业共同组成,有超过 1000 家来自芯片厂商、软件厂商、整机厂商、操作系统厂商等覆盖操作系统全产业链的合作伙伴参与生态共建。