云原生转型之路的多系统运维|龙蜥社区系统运维MeetUp
企业面向几百个转型中间态的系统,通过建设统一对象模型,对异源同域的数据进行解析丰富处理,实现多维数据自主关联。算法和机器学习为复杂的体系提供了动态问题感知和预测的能力。在问题发生后基于根因推荐、同源分析等措施快速故障定界并开始应急处置,保障业务的连续性是首要之责,数智化观测为排障和系统调优提供有效的决策能力。
eBPF Hardware Offloading | 龙蜥大讲堂53期
在如今 CPU 算力非常宝贵的场景下,eBPF 程序如果能卸载到硬件去执行,那将会带来非常大的收益。 以前我们都专注于 eBPF 在跟踪、诊断、网络及安全上的应用,本次王璞老师将在eBPF 的指令架构以及如何实现 eBPF 的硬件卸载等方面给我们带来很不一样的技术分享。
技术分享:Nydus 容器镜像加速服务 | 龙蜥大讲堂32期
主要向大家介绍 Scalable IOV(SIOV)相关的基本概念和软件框架,并针对现有的 Anolis 中集成的 SIOV out-of-tree 的实现方案展开讨论。与此同时,因为 SIOV 会涉及到 IOMMU、SVA 和 ENQCMD 等技术,所以我们也会分别介绍相关技术在裸机和虚拟机环境的软件实现方式。另外,借此机会也会向大家介绍目前上游社区对 SIOV 相关技术重构的背景和需求,以及新框架的设计思路和现状。
龙蜥社区软件包集成流程 | 龙蜥大讲堂29期
龙蜥社区欢迎广大开发者积极贡献软件包到 Anolis OS 中,集成过程需要遵循相应的软件包仓库结构和规则。本次直播帮助龙蜥社区软件开发人员熟悉新增软件包的集成流程。
Intel 新平台虚拟化技术演讲
李肖瑶介绍了未来 Intel 在虚拟化技术方面的新功能。新功能可以分为两类,一类为需要做虚拟化支持的新功能,即由 hypervisor 将新功能正确地虚拟化给虚拟机,使得虚拟化系统可以使用,如 CET、AMX、Arch LBR、PKS、UI。另一类为针对虚拟化的新功能,由 hypervisor 支持使用来增强 hypervisor 的能力或安全性,如 SVA、SIOV、TDX、 Bus Lock Detection、 Notify VM exit、IPI virtualization。
龙蜥云原生 SIG 未来建设
阿里云产品专家、龙蜥云原生SIG Contributor黄韶宇在现场为嘉宾分享了《龙蜥云原生 SIG 未来建设》主题演讲。阐述了龙蜥云原生 SIG 的定位和产出:“龙蜥云原生领域的圆桌会议提供者和组件发行版 owner”和“面向开发者的优秀能力组件和面向用户的易用、好用、接地气的云原生发行版和场景化解决方案”。回顾了龙蜥云原生 SIG 的工作,在成立的 4 个月的时间里,龙蜥云原生 SIG 补齐了龙蜥社区里面云原生能力基础并引入了 10 个组件,同时也建立了一些社区的规则,而最重要的关键节点是发布了龙蜥云原生 SIG 的产品 ACNS,提供了高效便捷、安全稳定、强大丰富的云原生套件。最后描述了云原生 SIG 中开发者和用户的相互推动关系,表达了对于开发者和用户的强烈渴望,希望有更多的参与者一起建立繁荣、强大的社区。
基于 ContainerOS 应用的实践经验
统信软件研发主管、龙蜥容器优化 OS SIG Maintainer 王磊分享《基于ContainerOS应用的实践经验》主题演讲。ContainerOS 会加速云原生建设,提供更轻、更稳定、更便捷的云底座 OS。系统只保留了系统运行的软件包和容器运行依赖的软件包,使系统更轻更薄;系统关键目录采用只读权限,不再提供 yum 等软件包管理方式,所有应用都以容器镜像方式运行,使系统更稳定安全;在一个云原生的集群里以一个整体系统镜像为原子进行更新和升级,确保集群内每个节点的软件包版本都是一致固化的,使系统升级更简单。更多内容可以关注龙蜥云原生 LifseaOS 和统信云原生操作系统。
Java 云原生能力重磅升级:开启高性能和可观测的新时代
英特尔亚太研发有限公司高级应用工程师金钟晖、阿里云智能云原生应用平台高级开发工程师魏嘉带来《Java 云原生能力重磅升级:开启高性能和可观测的新时代》主题分享。 在可观测领域介绍了 Continuous Profiling 对于应用的意义以及价值;系统性能分析和高级语言(JVM)性能分析的差别和性能分析类型分类;JFR 和 Async-Profiling 的优势和优缺点,Arms 和 Dragonwell 团队在 Continuous Profiling 领域的合作以及产品情况;Continuous 带来的难点以及解决办法:利用 SegmentTree 从 O(n) 到O(Log(n)) 的查询优化。 在计算领域介绍了在 Java 领域进行高性能计算,特别是如何充分利用当前硬件进行高效向量化运算面临的挑战,以及阿里巴巴和英特尔应对这些挑战做的努力。目前阿里巴巴和英特尔共同投入了相关的专家,着力于把 VectorAPI 移植到 Dragonwell11 上。不久业界就可以用到 OpenJDK11 兼容增强的 Dragonwell11+VectorAPI 的解决方案。从而在提高 CPU 运算效率的同时有效解决了在 Java 领域使用向量化计算所带来的挑战,极大地提升了 Java 云原生计算能力。
Compliance As Code理念与龙蜥社区安全加固最佳实践介绍
Compliance As Code理念与龙蜥社区安全加固最佳实践介绍 讲师/嘉宾简介: 李艺林:OpenAnolis社区 OS安全技术SIG Maintainer
详解龙蜥社区国密生态体系
6 月 11 日 ~ 12 日,龙蜥社区联合 Linux 中国,在北京召开的开放原子全球开放峰会现场组织 LUG 线下沙龙活动,与大家一同聊聊开源、聊聊 Linux 、聊聊社区当中的那些最新的技术。
龙蜥社区基础设施SIG Maintainer 详解开发者服务平台 devFree
6 月 11 日 ~ 12 日,龙蜥社区联合 Linux 中国,在北京召开的开放原子全球开放峰会现场组织 LUG 线下沙龙活动,与大家一同聊聊开源、聊聊 Linux 、聊聊社区当中的那些最新的技术。
“芯”有灵“蜥”——英特尔与龙蜥社区共建云原生时代开源全栈生态
云栖大会龙蜥专场论坛有9大主题、14位大咖亲临现场畅聊、分享,为龙蜥社区打 Call、上手龙蜥 OS 沉浸式体验.......来自开源社区领袖、高校专家学者、社区合作伙伴、开源技术专家等 14 位重磅嘉宾坐而论道,《OpenAnolis 龙蜥操作系统开源社区技术创新白皮书》正式发布!本场论坛特邀嘉宾 SegmentFault 思否 COO,开源社副执行长江波为整场论坛主持。云栖系列视频已经上线至龙蜥社区官网,欢迎观看:云栖大会龙蜥专场论坛。活动主题及内容《“芯”有灵“蜥”——英特尔与龙蜥社区共建云原生时代开源全栈生态》分享。杨继国表示,英特尔作为首批14 家理事单位之一参与到社区里去,相关技术专家和运营人员皆全方位参与到龙蜥社区的开发和推广中,是 Intel Arch SIG、AI SIG、商密软件栈 SIG 的创建者和维护者。此外,筹建中的 SIG,包括持久内存,还有 OS 基本库优化。讲师介绍Intel 技术总监——杨继国
组装式 OS 可靠性增强组件实践|龙蜥MeetUp
越来越多的场景对可靠性有更高的要求,如基站、卫星、工业网关、智能汽车等,而当前 Linux 聚焦资源管理机制的实现,不重点关注资源使用策略导致的异常,其主要提供了硬件的可靠性处理,整体上没有体系化的管理手段。同时对于操作系统而言,可组装的定制功能将能在不同的场景下最大化功能价值。面对可靠性增强的需求和挑战,中兴通讯进行了组装式 OS 可靠性增强组件实践,充分覆盖系统各类亚健康事件,并进行对应策略处理,尽可能保障系统的可靠运行,同时提供必要的维测信息,方便后续故障定位。设计上采用可组装思路,利用 ftrace、kprobes 及 eBPF 技术进行功能解耦,可以很好地满足多场景下 OS 可靠性增强需求。
PAS工具分享 - FrameScope与RTRadar
云计算服务的主营业务之一便是资源售卖,云厂商会采购不同平台、不同型号的服务器,通过池化技术整合机器资源,再将不同规格的资源弹性售卖给开发者。对开发者而言,是否能够在这众多的云服务器产品中选择出能运行目标程序最佳性能的产品,同时能够在此基础上进一步优化程序性能从而充分利用云资源的性能,是提升上云性价比的第一要务,而FrameScope可以协助用户快速应对上述场景。在应用性能评估中,事务执行延迟是重要指标之一,随着分布式架构的广泛应用,厂商可通过分布式链路跟踪技术(例如Dapper)将延迟瓶颈定位到单节点上(物理机、虚拟机、容器),然而深入分析单节点上复杂的事务延迟时,现有工具往往显得不足。针对以上问题,阿里云自研了一套工具,通过采集事务关键事件以及内核系统事件,重建事务执行过程、分析依赖关系、量化各影响因素对整体延迟的贡献占比,从而定位延迟瓶颈。
AArch64架构调用链性能数据采集原理
调用链 (Callchain) 是软硬件事件上下文信息之一,对性能优化和故障排具有非常重要的作用。如著名的火焰图 (Flamegraph) 就是对调用链信息汇总统计和可视化的结果。但是在调用链收集的过程中,工程师往往因为不了解底层的采集原理导致调用链收集不完整,采集开销不可控等问题。本议题核心介绍了在AArch64架构下调用链采集的原理,比较它们之间的不同和阐述适用场景。同时对Linux内核态和eBPF调用链采集做了一些简单介绍。
阿里云 Confidential Al 最佳实践
为缓解用户对 AI 模型上云产生的隐私与合规问题,阿里云 Confidential AI(CAI)实现了一种覆盖模型数据生命周期的端到端通用框架,揭示了机密计算在 AI 系统安全方面的重要价值。未来,CAI 将利用远程证明体系提供基于软件供应链的可验证代码透明度,为用户提供独立验证 CAI 隐私和安全保证的能力。
OS 升级迭代与向前向后兼容问题
操作系统升级迭代过程中,如何保障不影响用户的业务系统,如何让“更新"对用户透明,又能持续增强系统的能力。本次 MeetUp 上,方德分享了他们的方案。
龙蜥社区漏洞管理治理策略与实践
开源软件漏洞治理是构建龙蜥操作系统安全基石的重要一环。本次分享聚焦龙蜥社区的安全漏洞管理体系及其治理策略,包括漏洞情报感知收集、威胁分析与风险评估、漏洞修复及公告披露等流程。同时简单介绍社区在漏洞治理协作上的初步实践,探讨社区漏洞治理未来的优化方向。
加速推进 AI+OS 深度融合,打造最 AI 的服务器操作系统 | 2024龙蜥大会主论坛
操作系统如何满足 AI 应用场景需求?未来发展趋势如何?2024 龙蜥操作系统大会上,龙蜥社区副理事长张东分享了题为《智算引领 系统创新》的主题演讲,指出 AI 原生应用对操作系统提出更高要求,需要以应用为导向、以系统为核心进行架构创新设计,要打造最 AI 的服务器操作系统。
新手训练营——使用操作系统智能助手OS Copilot轻松运维与编程
云端问道-第 7 期邀请了阿里云操作系统架构师林演介绍《用操作系统智能助手 OS Copilot, 轻松运维与编程》,主要介绍 OS Copilot 的产品架构、优势、功能及使用方法。
obdiag:一款OceanBase 数据库诊断的利器
了解OceanBase分布式数据库及其诊断现状,快速洞悉obdiag作为OceanBase敏捷诊断工具的项目价值及其设计与实现,提前知晓obdiag未来规划。
龙蜥衍生版KeyarchOS国密应用、eBPF安全技术实践介绍|龙蜥大讲堂107期
了解浪潮信息KeyarchOS操作系统在商密方面的技术实现,以及可以使用的支持商密算法的底层加密库和加解密工具。了解eBPF技术在入侵行为检测、违规行为拦截等安全技术方面的实际应用。
Intel Linux 内核测试套件-LKVS介绍 | 龙蜥大讲堂104期
分享Intel内核测试组开发并维护的LKVS(Linux内核测试套件),介绍套件的发展、特性、用法以及当前在最新Intel服务器CPU上的热门属性,及其使用和验证方法。
这是一段关于龙蜥成长的故事,更是一个发展中国自己的根社区的故事
经过三年跨越式发展,龙蜥云集800家全产业链合作伙伴,实现600万台装机量,填补服务器开源操作系统中国根社区空白……这是一段关于龙蜥成长的故事,更是一个发展中国自己的根社区的故事。
"芯""蜥"相通 融合创新 -- 携手阿里云 释放Intel平台算力
首先介绍了 Intel 第四代至强可扩展处理器(代号 Sapphire Rapids,SPR)以及刚发布不久的第五代至强可扩展处理器(代号 EMR)的核心特性,包括 AMX、QAT、DSA、IAA、TDX 等。然后总结了英特尔与阿里云在 OpenAnolis 社区的合作推进这些特性使能的成果, 通过双方的努力,大部分新功能已在阿里云上启用并落地。 最后,介绍了在阿里云 ECS g8i 实例上利用新特性的三个最佳实践,以此展示新特性可以带来多么令人印象深刻的提升。
阿里云倚天在时空智能服务上的规模化应用 --千寻位置核心业务迁移实录
介绍了千寻位置迁移倚天处理器 ECS 实例的背景,并对迁移过程中涉及的准备工作、迁移步骤以及迁移过程中的注意事项进行了详细的分析说明,同时就迁移后的成本降低给出了具体测算。通过千寻位置核心业务迁移实践的分享,希望能够帮助更多的用户享受倚天处理器带来的高性价比红利。
释放云算力 繁荣云生态|2023龙蜥操作系统大会
贾正华在分享中介绍了 Alibaba Cloud Linux 通过在稳定性、安全、性能、服务支持上持续建设,为用户提供更好的云上操作系统体验,发展成为阿里云上部署规模最大的操作系统。同时面向未来AI智算场景,Alibaba Cloud Linux 希望通过提供开箱即用的 AI 容器镜像,为用户的 AI 应用场景,提供一个易用性、稳定性、安全性、性能都更好的运行环境。
浪潮信息副总裁Donny Zhang致辞|2023龙蜥操作系统大会阿里云分论坛
云计算是改变整个产业生态的重要力量,随着新应用类型的不断出现,它的位置仍然举足轻重,特别是在人工智能这样的一个时代,大算力、大数据、高吞吐、低带宽的网络的需求越来越大。操作系统在整个云计算基础设施里面起到了非常核心的作用,阿里云作为国内云计算方面的领军企业,有雄厚的技术和经验积累,并把在基础软件操作系统方面的一些积累贡献给了龙蜥社区。经过三年发展,龙蜥社区已成为国内领先的操作系统开源根社区,它通过开源、开放的模式来发展下一代操作系统。浪潮信息作为国内最主要的算力基础设施供应商,联合阿里云及其他的合作伙伴,共同把社区建设成中国最好的操作系统社区,未来也将成为国际最重要的操作系统社区之一。
打造多元算力基座,助力生态共建共赢 | 2023龙蜥操作系统大会
作为专业从事服务器、终端整机产品的研发生产、方案设计及实施服务的科技企业,浪潮与统信软件携手共筑产业生态,双方紧密合作,围绕产品共同助力打造核心竞争力与可持续发展能力。未来,双方将继续在技术研发、生态联合、品牌市场、服务体系等方面深化合作,打造中国基础软硬件生态合作新标杆。
龙蜥操作系统
龙蜥社区(OpenAnolis)是面向国际的 Linux 服务器操作系统开源根社区及创新平台,秉承“平等、开放、协作、创新”的原则,理事会由阿里云、统信软件、龙芯、Arm 、Intel 等 24 家国内外头部企业共同组成,有超过 1000 家来自芯片厂商、软件厂商、整机厂商、操作系统厂商等覆盖操作系统全产业链的合作伙伴参与生态共建。