多核场景下的 Linux 调度器现状和未来|龙蜥MeetUp
分析了多核场景下Linux调度器的挑战与机遇:优化进程唤醒时随核数增加而递增的idle CPU搜索开销;改进默认时间片调度,使其感知进程工作集、线程数据共享等指标,推进同进程线程组在相同LLC domain唤醒以减少跨核缓存失效;探讨了内核调度器支持的用户态BPF自定义调度与AI结合的潜力,即AI预测进程需求辅助BPF生成智能调度策略。
Perf Arm SPE介绍与使用
SPE是Armv8.2引入一种性能剖析机制,可以提供更加细节的CPU运行时采样信息。本次分享主要介绍如何在倚天710平台上利用Arm SPE特性定位伪共享问题、分析内存访问、分析指令延时以及监控访存延时等功能。
阿里巴巴生态应用在Arm平台性能优化实践
Arm作为最为普遍使用的架构,吸引了广大开发者的兴趣。最近阿里巴巴生态核心应用在Arm平台上部署后显示较大的性能差异,通过分析发现主要是CPU前端瓶颈,因此我们在JVM层面进行了针对性优化,提出的代码压缩、热代码集中分配等技术方案在落地后进一步完善性能,给后续更大规模的部署提供了信心;同时,Arm平台也拥有丰富的性能分析工具,比如CoreSight提供了指令流分析的能力,基于这些信息阿里云发现了JVM中编译阈值对profile采集准确性的影响,针对性调整后达到了更佳的性能效果。
场景化镜像平台技术解读|2023龙蜥操作系统大会
场景化镜像平台是龙蜥社区推出的统一镜像制作平台,提供容器镜像、虚拟机镜像的 CI、CD 全流程支持。平台分为 【镜像制品】、【制品中心】两个模块。镜像制品向用户开放社区已发布的镜像,用户在镜像制品中可查看镜像描述、镜像下载等;制品中心展示镜像 CI/CD 流程,在 Pipeline 流水线中可追溯构建、测试、安全扫描、发布等每一步流程。镜像平台地址:https://cr.openanolis.cn。
面向智算场景的 RISC-V 处理器 IP|龙蜥MeetUp
作为RISC-V架构的先行者与领导者,SiFive介绍了其覆盖从超低功耗到高性能计算需求的创新、高度可定制RISC-V处理器IP核解决方案。该议题探讨了RISC-V在高性能服务器领域的突破潜力及其对传统架构的挑战;聚焦了RISC-V与AI技术的深度融合,解析了其作为高效能AI加速器控制核心或定制化AI计算单元的优势,展望了其在智能化浪潮中的核心作用。
AI 场景安全防护:基于 eBPF 的勒索病毒、挖矿病毒检测与防御机制|龙蜥MeetUp
分析了AI产业面临的数据、算力与系统安全威胁(如勒索病毒、挖矿病毒)。提出了解决方案:基于eBPF-LSM技术结合勒索病毒行为分析,实现基于诱饵的防御,保障数据完整性与保密性;基于eBPF+kprobe技术结合挖矿病毒动静态特征,实现检测与防御,防止算力滥用;旨在为AI场景构建坚实可靠的安全防线。
基于龙蜥操作系统Arm架构下软件迁移和优化案例分享|龙蜥社区走进Arm MeetUp
介绍 Arm 架构下常用性能分析工具,结合龙蜥操作系统分享软件移植的注意事项和实际优化案例,从而帮助大家了解 Arm 架构下软件移植、优化过程中的常见问题和优化思路。
基于龙蜥操作系统与Arm倚天服务器开发的EasyYitian阿里云迁移工具介绍
EasyYitian 是阿里云为支持倚天迁移专门打造的工具平台,包括软件兼容性扫描、环境兼容性分析、跨架构编译构建预制镜像、性能调优分析,是集工具、优化镜像、迁移指南为一体的统一平台,解决倚天迁移过程的难点和痛点,助力客户快速完成业务迁移到倚天,为倚天迁移提供全量支持。
eBPF 加载过程解析与 eBPF 加速容器网络的原理分析 | 龙蜥大讲堂第 57 期
eBPF(extended Berkeley Packet Filter) 是一种可以在 Linux 内核中运行用户编写的程序,而不需要修改内核代码或加载内核模块的技术。简单说,eBPF 让 Linux 内核变得可编程化了。本次分享从原理上分析了它的加载工作过程,解释了它如何保证系统运行稳定以及它能加速网络的原因。
基于英特尔®DL Boost技术的 AI 性能优化
黄文欢介绍了基于英特尔®深度学习加速(Intel®DL Boost)技术的 AI 性能优化相关内容。首先介绍了英特尔®AVX-512 及深度学习加速技术在各代英特尔®至强®处理器上的演进,包括第一代深度学习加速技术 VNNI;第二代®深度学习加速技术 BFloat16;及下一代深度学习加速技术 AMX。接下来,和大家一起分享了这些深度学习加速技术在龙蜥社区 AI SIG 中的应用及带来的性能提升,包括对深度学习框架 TensorFlow 和 PyTorch 的优化,及用于模型压缩的优化工具 INC。最后介绍了下一代至强可扩展处理器 Sapphire Rapids 上 AMX 技术,并分享了其理论性能提升及相关应用场景。
龙蜥大讲堂第69期 - 阿里云 ECS 八代 SPR 实例上使用 Intel AMX 特性加速 AI 类业务的实践
69期-阿里云 ECS 八代 SPR 实例上使用 Intel AMX 特性加速 AI 类业务的实践
如何系统化搭建超智融合算力架构|龙蜥大讲堂第139期
联科集团加入龙蜥社区多年,一直与龙蜥保持深度合作,其超智融合算力管理平台 CHESS 与 Anolis OS 的完成了兼容适配认证。联科集团联席合伙人付鸿雁结合联科集团 25 年深耕高性能计算的经验,系统化解析超智融合算力中心的搭建路径,实现整套集群从芯片、存储、网络到操作系统、算力调度、系统运维完成超算和智算真正的融合。
基于 LLM Agent 的智能诊断机器人|龙蜥MeetUp
陈诗雁介绍了系统运维的现状和难点、智能对话机器人的发展、大模型在系统运维的应用、基于大模型智能体的诊断机器人设计,并演示了 SysOM 智能诊断机器人。智能机器人和运维平台是相辅相成的关系,运维平台的诊断能力成就了智能机器人解决实际问题的能力,智能机器人帮助运维平台更好地发挥和展示运维能力。
Alibaba Cloud Linux 解锁云算力 - 软硬协同构建云上最佳操作系统体验
分享如何通过 Alibaba Cloud Linux 做南向和北向的协同,解锁阿里云的底层算力,以及 Alibaba Cloud Linux 和龙蜥社区的关系,以及如何基于芯片做全栈协同设计和优化。最后,李三红做了 C/C++ 编译器套件+Java 解读。
统信软件“3+3+6”CentOS替换解决方案 | 2023龙蜥操作系统大会
CentOS系统停更,给各行业现有业务系统的稳定持续运行带来了巨大的不确定性。为应对CentOS的停更,保障各行业业务系统的持续运行,统信软件可为用户提供远程支持、现场支持、培训服务、顾问咨询、系统定制等一系列服务支持。不仅能够满足用户快速响应、及时处理和修复问题的要求,还可以按照用户的个性化需求提供订制服务,满足不同用户在各种复杂业务场景下的需求。
数智创新——新时代下ERP的全新价值 | 2023龙蜥操作系统大会
数智化转型是一个综合、复杂、循序渐进的长期过程,企业通过数智化转型实现产品与业务的创新、组织和管理变革,全面提升核心竞争力。用友与统信软件作为战略伙伴,在生态适配和商业创新上深度合作,共建全栈式一体化解决方案,共同助力企业数智化转型与升级。
龙蜥社区高级顾问致辞|2023龙蜥操作系统大会
面向未来,我们要大力推广软件开源事业,让软件成为新时代发展的强大引擎。要深化社区或者共同体的建设,希望国家给予更多的政策引导,社会各界和更多的伙伴加入,高校和院所能更好地培养人才,同时共同推动包括 OpenAnolis 在内的软件开源生态繁荣,打造千行百业坚实的计算基底。
全面建设安全生态分论坛-2023龙蜥操作系统大会
数据时代,安全为先。如何保障系统安全、数据安全、如何构建开源软件安全生态,正成为当今用户关注的焦点。本次分论坛由龙蜥安全委员会组织,旨在推动开源安全领域的实践分享、技术创新及安全生态建设,共同探讨和交流系统安全、网络安全、数据安全及威胁响应等议题。分论坛还设置了圆桌互动环节,邀请了来自国内外知名厂商的多位专家学者,共同探讨大数据大模型时代下机密计算技术的挑战、机遇和未来发展。讲师/嘉宾简介企业技术专家
就在明天!2023龙蜥操作系统大会盛大启幕!欢迎关注
2023 龙蜥操作系统大会(OpenAnolis Conference)由开放原子开源基金会指导,龙蜥社区主办,阿里云、浪潮信息、Arm、Intel、中兴通讯、统信软件等24家理事单位共同承办,主题为“云智融合·共筑未来”,陈左宁院士、梅宏院士、陈纯院士、王恩东院士、北航网安学院刘建伟院长、阿里巴巴集团副总裁蒋江伟等一众大咖倾情加盟,聚焦产业趋势、生态合作、人才发展、技术创新等,是集聚政、产、学、研等多方力量打造的年度盛会。首届龙蜥大会将云集全球技术专家和行业大咖,邀请超300家企业和逾千位开发者,共赴本年度聚焦产业升级的岁末盛典,使与会者洞悉行业机遇,把握产业脉动,领略技术跃迁,聆听生态蝶变。
Arm 架构下性能优化经验分享 | 龙蜥社区走进 Arm MeetUp
从实用角度解读如何在 Arm 平台上进行业务软件的性能测评、分析及优化,涵盖负载配置模式的选择、波动因素的消除、宏观经验调优及多层配合(应用层、系统层及微架构层)的深度性能优化,充分挖掘底层基于 Arm 架构硬件的性能潜力。
下一代数据中心互联协议CXL及在龙蜥的规划 | 龙蜥大讲堂第 58 期
CXL 作为下一代高带宽低延迟的互联协议,即将被广泛应用在数据中心之中。本次活动主要介绍了 CXL 的基础概念和规范,当前 Linux 内核和硬件厂商 Intel 对于 CXL 的支持,以及龙蜥社区对于 CXL 的规划。
云原生技术在容器方面的应用|龙蜥大讲堂54期
CXL 作为下一代高带宽低延迟的互联协议,即将被广泛应用在数据中心之中。本次活动主要介绍了 CXL 的基础概念和规范,当前 Linux 内核和硬件厂商 Intel 对于 CXL 的支持,以及龙蜥社区对于 CXL 的规划。
datop——用在冷热内存识别和跨 numa 访存有多优秀?|龙蜥大讲堂第10期
了解 datop 热点开发初衷,以及对比业界现有内存冷热扫描方案的优势,为参会者对 datop 这种轻量普适性的冷热内存扫描工具使用带来更深入的了解。
下一代计算架构下操作系统的挑战
随着摩尔定律的放缓,使得整体算力从依赖制程的提升,走向大规模分布式异构计算。异构计算资源池化、内存池化与扩展等新型计算架构开始应用,面对新一代计算架构给当前系统带来的挑战。王彦伟在本次分享中首先对以数据为中心的计算架构进行了探讨,并对资源池化、计算资源远程映射、高速互连机制等关键技术进行了详细介绍,尝试分析了上述架构对操作系统提出的新需求及挑战。
基于 kata 的 Serverless 产品体系建设
联通数科云原生技术架构师王琦做了《基于kata的Serverless产品体系建设》主题演讲。介绍了联通云基于Kata进行的 Serverless 产品体系的建设。首先介绍了通过国家政策为牵引,联通云深化自主研发和创新能力,聚焦无服务器技术和 kata 相结合,基于联通云双引擎基座建设 Serverless 产品体系,助力联通乃至央国企应用快速上云。然后通过一个 Serverless k8s 具体产品深入讲解了技术架构设计与场景化的需求,以及在对 Kata 进行选型时候所考虑的几个方面内容和优化方式。最后分享了在国内百花齐放的硬件厂商的大环境下, Serverless 和 Kata 结合多种异构 CPU ,通过无服务器技术屏蔽底层硬件差异的一个展望。
Java 云原生能力重磅升级:开启高性能和可观测的新时代
英特尔亚太研发有限公司高级应用工程师金钟晖、阿里云智能云原生应用平台高级开发工程师魏嘉带来《Java 云原生能力重磅升级:开启高性能和可观测的新时代》主题分享。 在可观测领域介绍了 Continuous Profiling 对于应用的意义以及价值;系统性能分析和高级语言(JVM)性能分析的差别和性能分析类型分类;JFR 和 Async-Profiling 的优势和优缺点,Arms 和 Dragonwell 团队在 Continuous Profiling 领域的合作以及产品情况;Continuous 带来的难点以及解决办法:利用 SegmentTree 从 O(n) 到O(Log(n)) 的查询优化。 在计算领域介绍了在 Java 领域进行高性能计算,特别是如何充分利用当前硬件进行高效向量化运算面临的挑战,以及阿里巴巴和英特尔应对这些挑战做的努力。目前阿里巴巴和英特尔共同投入了相关的专家,着力于把 VectorAPI 移植到 Dragonwell11 上。不久业界就可以用到 OpenJDK11 兼容增强的 Dragonwell11+VectorAPI 的解决方案。从而在提高 CPU 运算效率的同时有效解决了在 Java 领域使用向量化计算所带来的挑战,极大地提升了 Java 云原生计算能力。
详谈龙蜥社区一站式构建平台 ABS | 龙蜥大讲堂 86 期
直播内容: 1)主要介绍软件包构建、镜像构建、内核源码构建、云原生构建 4 大构建服务。 2)ABS 未来规划。 听众受益: 了解龙蜥社区官方构建平台 ABS,熟悉 Anolis OS 软件包、镜像构建流程。 适合人群: 从事操作系统开发,有软件包、镜像构建需求的开发者。 讲师介绍: 单凯伦,龙蜥社区基础设施 Contributor,主要负责基础设施协作工程体系的开发工作,包括社区构建服务平台 ABS、资源服务平台龙蜥实验室、社区官网、测试服务平台 T-One、Bugzilla、邮件列表等。
经验分享!Linux 内核宕机介绍和简单分析思路 | 龙蜥大讲堂 77 期
直播主题:Linux 内核宕机介绍和简单分析思路直播时间:2023 年 05 月 16 日(周二)16:00-17:00直播内容:首先简要介绍宕机发生的场景、原因,基于现有的阿里云运维经验和 SysOM 宕机中心,讲解可以排查的思路和经验。听众受益:了解 Linux 内核宕机的原因、发生情况和简单的分析思路和应对方式。适合人群:研发工程师、运维工程师。讲师介绍:刘馨蔚,龙蜥社区系统运维 SIG Contributor ,硕士毕业于北京大学信息工程学院计算机应用技术专业。研究领域为未来基础网络架构、传输控制算法等。目前负责内核宕机检测和自动分析工作,是 SysOM 宕机中心和内存诊断核心开发者。
Kata Containers When Virtualization Meets Clond-Native
2020年11月5日,OpenAnolis社区(Anolis is not just Linux System)联合Open Infrastructure基金会举办了首场线下meetup,围绕「Cloud Native Infrastructures」主题,各路大牛相聚北京阿里中心。本次活动共计8大议题。来自阿里云、蚂蚁集团、Intel、中国移动、红帽等公司的技术专家围绕内核、容器及虚拟化等云原生基础设施技术展开探讨,解析相关开源技术内幕及社区进展,分享企业落地及实践经验。讲师介绍及主题蚂蚁集团资深技术专家、Kata Containers架构委员会成员王旭做《Kata Containers: When Virtualization Meets Cloud-Native》主题分享。
操作系统开源及产业发展:如何落地开源技术?
云栖大会龙蜥专场论坛有9大主题、14位大咖亲临现场畅聊、分享,为龙蜥社区打 Call、上手龙蜥 OS 沉浸式体验.......来自开源社区领袖、高校专家学者、社区合作伙伴、开源技术专家等 14 位重磅嘉宾坐而论道,《OpenAnolis 龙蜥操作系统开源社区技术创新白皮书》正式发布!本场论坛特邀嘉宾 SegmentFault 思否 COO,开源社副执行长江波为整场论坛主持。云栖系列视频已经上线,欢迎观看:云栖大会龙蜥专场论坛。讲师及内容介绍此次论坛有来自阿里云技术战略、特邀主持陈绪/统信软件 CTO、龙蜥社区副理事长张磊/阿里云操作系统技术总监、龙蜥社区技术委员会主席杨勇/清华大学计算机科学与技术副教授陈渝/Intel 技术总监杨继国/中科方德高级副总裁龚文,精彩讨论:操作系统开源及产业发展:如何落地开源技术?
智算新生态:异构 AI 算力底座如何驱动大模型全场景落地?
大模型正从“参数竞赛”转向“应用落地”,算力的性能、成本与工程效率成为关键瓶颈。本圆桌邀请阿里云、中兴、沐曦、浪潮等企业专家,探讨三大关键:如何通过软硬协同释放异构算力效能?SGLang与开源社区如何降低部署门槛?在 AI 运维与垂直行业中如何构建稳定、弹性且低成本的推理方案?最终推动AI从技术突破走向产业落地。
具身智能场景下端到端确定性挑战与思考|龙蜥MeetUp
探讨了具身智能系统,其核心在于构建紧密耦合的“感知-融合-决策-执行”闭环,使机器能实时理解并作用于物理世界。指出实现面临的主要挑战:需达成高实时性、强鲁棒性的多模态感知融合,并进行高效动态决策与控制。该演讲以智能机器人为核心示例,聚焦基于Ubuntu + ROS2构建的主流机器人操作系统生态,探讨了OS在具身智能中的关键角色及其面临的端到端确定性问题。
大语言模型的优化及基于Intel® Extension for Transformers 的部署实践
大语言模型的优化及基于Intel® Extension for Transformers 的部署实践
云上体验最佳的服务器操作系统 - Alibaba Cloud Linux | 飞天技术沙龙-CentOS 迁移替换专场
从 Alinux 的产生背景、产品优势以及云上用户使用 Alinux 享受的技术红利等方面详细进行了介绍。同时,通过国内某社交平台、某快递企业、某手机客户大数据业务 3 大案例,成功助力客户实现弹性扩容能力提升、性能提升、降本增效。
Intel Linux 内核测试套件-LKVS介绍 | 龙蜥大讲堂104期
分享Intel内核测试组开发并维护的LKVS(Linux内核测试套件),介绍套件的发展、特性、用法以及当前在最新Intel服务器CPU上的热门属性,及其使用和验证方法。
这是一段关于龙蜥成长的故事,更是一个发展中国自己的根社区的故事
经过三年跨越式发展,龙蜥云集800家全产业链合作伙伴,实现600万台装机量,填补服务器开源操作系统中国根社区空白……这是一段关于龙蜥成长的故事,更是一个发展中国自己的根社区的故事。
龙蜥操作系统
龙蜥社区(OpenAnolis)是面向国际的 Linux 服务器操作系统开源根社区及创新平台,秉承“平等、开放、协作、创新”的原则,理事会由阿里云、统信软件、龙芯、Arm 、Intel 等 24 家国内外头部企业共同组成,有超过 1000 家来自芯片厂商、软件厂商、整机厂商、操作系统厂商等覆盖操作系统全产业链的合作伙伴参与生态共建。