Spark SQL向量化执行引擎框架Gluten-Velox在AArch64使能和优化
Apache Spark是当前流行的开源数据处理引擎,Spark SQL为用户提供可靠的查询计算解决方案。近期,Gluten项目作为基于Apache Arrow的原生SQL引擎正式亮相,旨在增强Spark SQL计算性能。与此同时,多个向量化SQL引擎和更加活跃的开源社区也纷纷涌现。其中Velox项目尤为引人注目,它提供了向量化数据库加速库。本议题简要介绍了Gluten-Velox框架的概况和原理,同步Gluten-Velox社区在AArch64平台上的使能状态,并通过一个 Velox的优化案例,展示此Spark SQL向量化执行引擎框架在AArch64上的潜力。
Linux 应用运行抖动的背后 | 龙蜥大讲堂25期
抖动是影响业务性能的一大类问题,通过深入理解 Linux 应用运行过程的抖动原因,来协助系统及应用进行优化。同时介绍怎么 SysAK 工具对问题进行监控和诊断。
第17课:Spring Boot2.0 实战Docker容器Linux与架构原理
直播内容:第17课:Spring Boot2.0实战Docker容器Linux内容摘要:Docker是最流行的开源容器引擎,Go语言开发,在互联网大规模集群、云计算、微服务等架构中广泛使用。本次课程一起学习Docker容器架构原理、如何基于Linux系统实战实战Docker容器,打包、发布、运行Java Spring Boot2.0应用。讲师:徐雷(点击关注专家,掌握一手干货)阿里云栖Java技术专场讲师2018阿里云大学讲师,与阿里P9叶翔主讲《阿里巴巴MongoDB高级实战课程》《阿里巴巴MongoDB认证》讲师阿里巴巴MongoDB大会讲师2017翻译《MongoDB实战》第2版吉林大学计算机学士,上海交通大学硕士直播地址:Java技术进阶群3000人大群进群方式:钉钉扫码入群
Alibaba Cloud Linux 与倚天软硬结合,加速数据智能创新
根据 IDC 报告统计,通过云满足客户业务的需求,已经大大超过了传统管理基础设施。ECS 作为阿里云的比较关键的产品和服务,需要用自身产品能力满足不同类型的市场需求。吴天议主要分享了基于龙蜥社区 Anolis OS,阿里云采用倚天芯片与 CIPU 构建的面向云原生神龙计算体系架构,如何满足未来智能化的应用的需求。
手机内核稳定性的治理与实践
我们了解的 Linux 稳定性都是基于 x86 和 Arm 服务器上的,然而在手机上的系统稳定性,也值得我们去一探究竟。魅族科技高级工程师、龙蜥系统运维SIG Contributor 白浩文与嘉宾一起谈一谈《手机内核稳定性的治理与实践》。他首先简要介绍了稳定性问题的来源,以及开发过程。重点举例介绍了运行时动态检测的一些方法以及相关原理。在实践中,魅族手机在开发阶段引入了一些新的特性来提高捕捉内存异常的概率,其中也包括从上游龙蜥社区引入的改进特性。为了全方位监控和解决稳定性问题,魅族也在智能化分析问题和提升效能方面做了相应工作。最后,还作了简要的总结和阐述所面临的一些挑战。
中移动算力网络中的云原生虚拟化
中国移动信息技术中心 PaaS 架构师魏宝辉分享了《中移动算力网络中的云原生虚拟化》技术演讲。他对中国移动算力网络的基本布局规划做了简要介绍,算力网络是以算为中心、网为根基的新型信息基础设施 。通过技术升级实现算力无处不在、网络无所不达、智能无所不及的愿景。 在多样性算力的开发过程中,对云原生技术栈的需求愈发突显,开发团队多,发布调试频繁,对 k8s 集群环境需求量大,但是算力资源有限,开发环境的供给速度,跟不上业务的发展速度。中国移动信息技术中心通过 kubevirt 的云原生虚拟化技术,结合 gitops,云 ide 等工具体系,打造了自动化交付的全功能开发环境。在技术上采用了 vm in pod 的模式,并将 k8s 集群放入 pod 内。有效突破了物理机供给 k8s 集群紧张的情况,实现了用 8 台物理主机交付 170 多个开发集群。这种高效的自动化交付能力,也通过云原生虚拟化技术屏蔽了底层的硬件差异,以标准化的 k8s 交付方式,满足开发者的集群使用需求,提升算力资源的利用率,释放更大的算力价值。
Linux基础内容学习方法和概述
课程介绍:如何成为网络安全工程师?不知道该如何入门?本课程通过四个模块的知识学习,让您能够对网络安全相关基础技术有一个全面的了解和掌握,主要内容包括:IT基础技术、网络安全基础概念、网络安全渗透技术基础及Web应用安全基础。主要的学习方式包括在线直播、图文和在线实验进行学习。如果您是一位对网络安全感兴趣的大学生,我们还会根据您学习过程的参与情况,与线下考试情况,给您推荐实习或就业机会,快快来参与吧。系列课程Linux基础内容学习方法和概述(本节)用户管理和文件管理网络基础学习方法和概述局域网、路由技术 常见网络应用层协议和工具 MySQL数据库学习方法和概述 MySQL对象与应用和运维技术 Web应用基础学习方法和概述Web服务和应用实践网络安全学习方法、背景和发展密码学概述和关键算法密码学常见应用身份与访问控制概述、相关技术和常见威胁网络层和主机层常见漏洞和攻击 应用层和数据层常见漏洞和攻击渗透测试概述和相关工具概述信息收集和漏洞扫描技术 网络层主要攻击 、流量捕获技术和初识Netcat 主机层主要攻击 、口令破解和权限提升 OWASP Top 10 概述 、初识SQL注入、XSS和文件上传常见 Web 漏洞解析Web安全工具DVWA部署 、暴力破解和命令注入实操XSS 、 文件包含和文件上传实操SQL回显注入 、 SQL盲注和CSRF实操网络层和主机层安全防护技术基础Web应用层和数据层安全防护技术基础讲师介绍:唐俊飞:铭学在线创始人,网络安全行业知名讲师、CISSP、阿里云安全ACP、CISP、中国信息安全测评中心授权培训师资质(CISI)、 CSA(云安全联盟)大中华区授权培训师资质、阿里云MVP。16年网络信息安全以及培训领域从业经验,具有较强的网络安全管理、技术、咨询和培训实战项目经验,曾就职于:运营商、上市安全企业等。主要讲授CISSP(国际注册信息系统安全专家认证)、CISP(国家注册信息安全人员认证)、信息安全管理、渗透测试、等级保护、网络安全防护体系、云安全等课程资深讲师,培训人数20余万人次。张弛:梆梆安全安全服务团队负责人,致力于移动安全领域研究,目前主要负责移动应用渗透测试、安全培训体系建设、web渗透测试等工作。在职期间参与过重大活动保障、2019年护网行动作为攻击队参与护网行动等,通过自主学习获得了CISP、等保测评师等资格证书。目前在公司担任区域技术经理,深化移动安全的研究以及物、车联网方向的研究。张宁:梆梆安全高级培训讲师,在web安全和移动安全领域拥有数年渗透经验。在金融行业渗透测试有着丰富经验,目前为华夏银行,中信银行等多家银行服务过,也曾作为讲师为CCTV7,中原银行,金谷银行进行安全科普,漏洞挖掘等培训。适用人群:对网络安全感兴趣的在校大学生、网络安全初学者、希望掌握安全基础技术的IT在职者你能学到:网络安全相关的基本概念、基础渗透技术、基础防护技术等
Linux 性能调优产品KeenTune快速入门
6 月 11 日 ~ 12 日,龙蜥社区联合 Linux 中国,在北京召开的开放原子全球开放峰会现场组织 LUG 线下沙龙活动,与大家一同聊聊开源、聊聊 Linux 、聊聊社区当中的那些最新的技术。
全网首档操作系统探访体验栏目“龙蜥+超级探访”震撼上线!看国产 OS 如何乘风破浪
如何联合开源技术与国际社区形成双向互动,消除 CentOS 策略变更带来的影响?“全网首档操作系统探访体验节目”《龙蜥+超级探访》重磅上线!统信软件既是实现开源和商业互补协作的成功典范,又是身先士卒引领伙伴投身开源的“大队长”,也是龙蜥+超级探访首期走进的企业。且看龙蜥社区联合行业内生态伙伴何实现从技术创新到商业变现的跨越。
2023龙蜥操作系统大会
据《国产服务器操作系统发展报告(2023)》称,在云与AI深度融合的技术浪潮之下,服务器操作系统产业正处于升级迭代的关键时期。该主论坛将聚焦服务器操作系统产业 2.0 时代背景,集领域专家学者、联盟协会领导、企业领军人物等,深度解读国产操作系统的过去与未来。讲师/嘉宾简介专家学者、联盟协会领导、企业领军人物
智算新范式:基于 Anolis OS 构建 Confidential AI Agent — OpenClaw-CC 隐私保护实践|龙蜥大讲堂144期
近日,英特尔中国高级工程师朱运阁与龙蜥社区云原生机密计算 SIG Contributor 赖堃共同带来了《智算新范式:构建 Confidential AI Agent》的主题分享。他们基于Intel® TDX(可信域扩展)技术与龙蜥社区开源生态,深度解析了 OpenClaw-CC 项目的架构设计与落地实践,展示了一套从硬件根信任到应用层隔离的全栈机密计算解决方案,为您系统化拆解如何构建“可用不可见”的机密智能体。
释放硬件潜能,激活软件生态 《龙蜥+超级探访》第二期走进 Intel
作为龙蜥社区的创始理事单位,以及全球最大的半导体芯片制造商,英特尔为龙蜥提供先进的硬件优化技术,是开源社区创新技术孵化合作的完美典范,也是本期《龙蜥+超级探访》走进的企业。本次访谈邀请了英特尔副总裁、英特尔软件和先进技术事业部总经理李映,英特尔技术总监、龙蜥社区理事杨继国,阿里云服务器操作系统产品经理贾正华,阿里云高级技术专家、龙蜥社区英特尔 Arch SIG Maintainer 丁宁,阿里云 Higress & MSE 云原生网关产品负责人耿蕾蕾等 5 位业界专家,深度解读在操作系统产业面向 AI 升级换代的历史节点上,英特尔如何联手龙蜥布局“云+AI”的未来?在双向奔赴的合作历程中,龙蜥与英特尔如何完美搭配将创新技术孵化至成熟产品,进而服务关键业务场景?
libvirt 虚拟机热迁移流程简介 |龙蜥大讲堂81期
直播主题:libvirt 虚拟机热迁移流程简介 直播时间:2023 年 05 月 31 日(周三)16:00-17:00 直播内容: libvirt 是用于管理虚拟机的开源项目,是各大基于 OpenStack 二次开发的云平台管理底层 qemu-kvm 虚拟机的核心组件,而热迁移作为虚拟机管理中较为常用的功能,其在稳定性和效率关乎云平台的整体使用体验,本次分享主要讲解虚拟机热迁移在 libvirt 项目中的主要流程及迁移参数作用和影响。 听众受益: 了解 libvirt 虚拟机热迁移整体流程,迁移方式及关键迁移参数作用及影响。 适合人群: 云计算研发人员。 讲师介绍: 李东世,浪潮数据云计算高级研发工程师,负责浪潮数据云平台核心功能开发及维护,主导底层虚拟化相关功能开发、问题定位处理。
阿里云亮出 Agent 基础设施全景图,ANOLISA 要做每一个 Agent 的运行底座
ANOLISA 是打造的 Agent 系统管家。它的使命是:打造更高效、更安全的 Agent Native 环境。
解读《2025龙蜥社区操作系统白皮书》,这四大亮点值得关注
当 Agent 在服务器上真正运行时,操作系统该如何应对?《2025 龙蜥操作系统开源社区白皮书》对AI、一云多芯、安全可信等九大技术方向、双产品线演进路线、各行业落地案例做了详细展示。
共建大模型推理生态:Mooncake、KTransformers 与 SGLang
Mooncake 是一个以 KVCache 为中心、面向解耦场景设计的分布式大模型推理架构,通过零拷贝传输、多网卡池化与链路优化、弹性扩展与高效内存利用等技术,助力 SGLang 实现了 KVCache 的高效跨节点传输与共享,显著提升了推理性能。KTransformers 是一个 CPU/GPU 混合的大模型异构推理框架,基于 AVX/AMX 指令集,实现了 NVFP4、FP8、BF16 等原生精度 MoE kernel,支持了高效的原生精度推理;同时,使用专家级流水线进行流式预填充,通过 SGLang 的 GPU MoE Kernel 实现了 layerwise prefill 架构,大幅提升长上下文场景的吞吐与延迟表现。本次分享将聚焦于 Mooncake 和 KTransformers 的架构设计、关键技术特性、最新进展,以及与 SGLang 的集成实践和应用效果。
一个高效可扩展的 Agentic RL 框架
近期,强化学习的任务形态正从以reasoningtask为主,逐步演进为更复杂的Agentictask。这类任务引入了agentframework,更加复杂的数据生成流程与稳定性挑战,对RL训练框架提出了全新要求。本次演讲将聚焦slime框架,系统介绍其针对AgenticRL场景所做的一系列关键优化设计,包括灵活的rollout机制、解耦的agent接入方式、高效的并行与同步策略等,全面展示slime如何显著提升AgenticRL训练的scalability。
C 转 Rust 的 AI 自动化方法
C 语言是非内存安全开发语言,在主流 Linux 操作系统中 C 语言代码占比超 70%,其中内核中的 C 语言代码超 90%。谷歌报告显示,超过 70% 高危漏洞源于内存安全问题。OpenSSF 也提出通过替换非内存安全的语言来消除内存安全漏洞是根本方法。统信服务器产线架构师张海东分享了《C 转 Rust 的 AI 自动化方法》,结合 AI 大模型 ,提出了一种 C 语言项目转换为 Rust 语言的一种可行性方法,提高系统关键组件的安全性,消除内存安全问题。
从 EPD 到 SGLang-Omni:图像密集场景推理加速实践与下一代全模态推理架构演进
本次分享展示EPD在图像密集请求(4–8张/次)下的优化:1 QPS时比非分离部署延迟低约6–8倍,高QPS下吞吐增约2倍;解析EPD解耦架构如何以组件弹性扩展与异构部署避免Prefill节点成倍扩容。并聚焦SGLang面向Omni多模态的系统演进,阐述如何将LLM推理扩展到文本、图像、音频、视频多模态IO,以及Processor拆分、数据流与调度、多阶段推理协同等关键设计与实践。
ROLL:面向大规模 AgenticRL 的异步解耦与异构算力调度实践
本次分享将介绍阿里巴巴自研强化学习框架ROLL及其针对AgenticRL异构负载的深度优化方案。重点解读如何通过异构硬件亲和性调度、细粒度异步编排以及状态感知的按需弹性部署,攻克大规模场景下的通信与计算瓶颈。目前,ROLL已在三千卡集群、千亿参数MoE模型上实现了生产级的极致吞吐;此外,我们将探讨ROLL与Mooncake存算分离架构结合的未来演进,进一步释放大规模RL后训练的潜力。
AI 场景安全防护:基于 eBPF 的勒索病毒、挖矿病毒检测与防御机制|龙蜥MeetUp
分析了AI产业面临的数据、算力与系统安全威胁(如勒索病毒、挖矿病毒)。提出了解决方案:基于eBPF-LSM技术结合勒索病毒行为分析,实现基于诱饵的防御,保障数据完整性与保密性;基于eBPF+kprobe技术结合挖矿病毒动静态特征,实现检测与防御,防止算力滥用;旨在为AI场景构建坚实可靠的安全防线。
Co-Sight:基于多 Agent 动态规划与分层反思的下一代 AI 决策系统|龙蜥MeetUp
探讨了AI技术应用于复杂任务时,传统大语言模型(LLM)在动作决策和多步推理上的局限性。构建具备自主规划与动态纠偏能力的智能体系统成为关键挑战。中兴通讯介绍了其Co-Sight框架,该框架通过多Agent协同架构(Plan-Actor-Memory)实现任务降维,结合实时上下文精炼消除冗余,并依托分层反思系统生成奖惩信号以动态优化DAG执行路径。其核心创新在于关注点分离与闭环反思机制。在GAIA评测中,Co-Sight以72.73%综合得分超越Google DeepMind与OpenAI,在复杂多步任务(L2级)中稳定性显著领先。
基于内核剖析的故障分析和智能运维实践 | 龙蜥大讲堂75期
通过阿里云大量的运维经验, 云应用复杂的问题单纯从应用自身或者的内核的已有指标难以定位。都需要深入内核的深入分析,作为阿里巴巴操作系统部门系统服务团队,我们提供阿里巴巴全集团内核故障的诊断分析和修复服务,并对阿里云内核疑难问题提供兜底服务,我们基于历史处理过的所有内核故障做系统性梳理和总结,进行大量深入内核的运维探索并贡献到龙蜥社区。
具身智能场景下端到端确定性挑战与思考|龙蜥MeetUp
探讨了具身智能系统,其核心在于构建紧密耦合的“感知-融合-决策-执行”闭环,使机器能实时理解并作用于物理世界。指出实现面临的主要挑战:需达成高实时性、强鲁棒性的多模态感知融合,并进行高效动态决策与控制。该演讲以智能机器人为核心示例,聚焦基于Ubuntu + ROS2构建的主流机器人操作系统生态,探讨了OS在具身智能中的关键角色及其面临的端到端确定性问题。
Confidential AI:基于机密计算的 AI 推理安全与隐私保护方案|龙蜥MeetUp
针对AI在医疗、金融等敏感领域应用带来的数据隐私与模型安全推理问题,介绍了基于机密计算技术的Confidential AI解决方案。解析了如何在机密计算环境中实现端到端安全推理,涵盖加密模型部署、端到端通信安全、系统数据落盘加密保护等关键技术,旨在为行业提供可复用的安全推理框架。
OCP GPU RAS规范解读|龙蜥大讲堂
本次演讲重点介绍面向大规模数据中心的GPU RAS能力建设要求,包括大规模数据中心集成过程中遇到的痛点问题,GPU RAS功能及管理要求、GPU系统级故障注入、错误报告及调试转储等内容。
Virtio 的技术趋势与 DPU 实践|龙蜥大讲堂第16期
Virtio 背景、技术规范与关键技术以及 Virtio 技术在 DPU 中的实践应用。DPU Virtio 硬化给数据中心基础设施加速带来的收益与产品优势。
SIMD 指令集在 OpenJDK 中的现状与未来|龙蜥大讲堂 14 期
通过本次讲座,Java 开发者可以进一步地了解到一些 Java 代码背后的行为,特别是与 CPU 硬件相关的性能优化,进而理解如何使用 SIMD 指令集进一步提升 Java 代码的性能。同时,听众能大概了解 SVE 这一最新的 Arm SIMD 指令集架构。
Cloud Hypervisor or Cloud Native Hypervisor
2020年11月5日,OpenAnolis社区(Anolis is not just Linux System)联合Open Infrastructure基金会举办了首场线下meetup,围绕「Cloud Native Infrastructures」主题,各路大牛相聚北京阿里中心。本次活动共计8大议题。来自阿里云、蚂蚁集团、Intel、中国移动、红帽等公司的技术专家围绕内核、容器及虚拟化等云原生基础设施技术展开探讨,解析相关开源技术内幕及社区进展,分享企业落地及实践经验。讲师及内容介绍Intel 系统软件部云原生基础设施软件研发经理朱江云介绍Cloud Hypervisor诞生的缘起,从其架构和特性的介绍,我们可以看到Cloud Hypervisor是一款为云原生打造的虚拟机管理器。Clou Hypervisor技术委员会成员刘奖分享了云原生基础设施对于Kata Containers和Cloud Hypervisor在理论和实践上的根本诉求,给了大家进一步的思考和启发。
Agent 时代下的全局 KVCache 管理架构演进
本演讲聚焦Agent场景下KVCache的存储需求和带来的挑战,梳理了KVCache管理模式的演进路径。重点介绍了SGLang生态中的Hf3fsMetadataServer(MiniManager),以及阿里云即将开源的企业级全局KVCache管理系统—-TairKVCacheManager。该系统已实现对Mooncake的原生支持,为Agent时代的大模型推理提供稳定高效的KVCache存储支持。
SysOM 健康度和 Livetrace 的评测方法探索|龙蜥MeetUp
Livetrace 作为一种先进的操作系统级性能分析方法,能够通过不断地监测操作系统、容器运行环境以及应用程序等多个层次的性能指标,深入揭示整体性能瓶颈。借助 Livetrace,软件的性能管理更加稳健,性能表现的可预测性得到显著提升。
全面深度云原生化分论坛-2023龙蜥操作系统大会
本话题将介绍龙蜥操作系统在云原生领域的深入探索和场景优化,展示其针对云原生所做的全面优化以及强大特性,邀请龙蜥社区的用户介绍这些特性在各自领域的落地情况。通过讲解基础软件的优化方法和案例,为听众提供关于如何在云原生场景下提高性能、安全性和稳定性的建议。同时我们也会邀请学术界大拿,为大家带来云原生领域前沿的探索信息。讲师/嘉宾简介技术专家
基于 io_uring 和双 virtqueue 队列的 virtio-blk 数据通路加速方案
阿里云智能集团研发工程师孟繁瑞分享了《基于 io_uring 和双 virtqueue 队列的 virtio-blk 数据通路加速方案》。孟繁瑞提到,阿里云操作系统团队联合 CIPU、盘古等团队,基于 io_uring 的直通能力和 vring pair 的队列设计,改造了 virtio-blk 内核驱动,赋予了用户态程序直接构造 virtio-blk 命令的能力,不仅拓展了 virtio-blk 设备的功能边界,也为基于此技术的后端存储解决方案带来了更大的灵活性和扩展性,为公有云、分布式存储等场景提供了较好的弹性、可并发性和大吞吐能力。目前,这些特性已经合入了 ANCK-5.10 和 ANCK-6.6 中,即将随业务灰度上线。
为RTP-LLM提供Arm CPU后端,助力Arm AI软件生态持续发展
随着大语言模型(LLM)的普及与应用,AI计算需求快速增长。许多LLM模型运行在基于GPU的硬件上,而随着Arm架构不仅在边缘设备,而且在数据中心领域也愈发流行,如何让RTP-LLM(实时推理框架)有效支持Arm CPU平台变得尤为重要。通过优化LLM在Arm平台的推理性能,可以进一步提升功耗效率和模型部署的灵活性。
场景化镜像平台技术解读|2023龙蜥操作系统大会
场景化镜像平台是龙蜥社区推出的统一镜像制作平台,提供容器镜像、虚拟机镜像的 CI、CD 全流程支持。平台分为 【镜像制品】、【制品中心】两个模块。镜像制品向用户开放社区已发布的镜像,用户在镜像制品中可查看镜像描述、镜像下载等;制品中心展示镜像 CI/CD 流程,在 Pipeline 流水线中可追溯构建、测试、安全扫描、发布等每一步流程。镜像平台地址:https://cr.openanolis.cn。
CCF理事长梅宏致辞|2023龙蜥操作系统大会
近日,由开放原子开源基金会指导,龙蜥社区主办,阿里云、浪潮信息、Arm、Intel、中兴通讯、统信软件等 24 家理事单位共同承办的,主题为“云智融合·共筑未来”的 2023 龙蜥操作系统大会圆满结束。中央网信办信息化发展局负责同志出席并致辞,中国工程院院士、原副院长陈左宁,中国科学院院士、CCF 理事长、北京大学教授梅宏,中国工程院院士、浙江大学信息学部主任陈纯,清华大学教授、青海大学校长史元春,中国 Linux 先行者宫敏,北航网安学院院长、教授刘建伟,开放原子开源基金会理事长孙文龙,阿里巴巴集团副总裁、阿里云基础设施事业部总经理蒋江伟等一众领导、院士、专家、高管重磅亮相,与现场 300 多家企业,逾千名开发者,分享龙蜥社区在提升中国开源软件影响力和国际贡献率的思考,探讨云智融合浪潮下如何协同打造中国操作系统黄金时代。
龙蜥操作系统
龙蜥社区(OpenAnolis)是面向国际的 Linux 服务器操作系统开源根社区及创新平台,秉承“平等、开放、协作、创新”的原则,理事会由阿里云、统信软件、龙芯、Arm 、Intel 等 24 家国内外头部企业共同组成,有超过 1000 家来自芯片厂商、软件厂商、整机厂商、操作系统厂商等覆盖操作系统全产业链的合作伙伴参与生态共建。