Intel QAT 加速的数据压缩和 TLS 加解密技术 | 龙蜥大讲堂 102 期
介绍Intel QAT技术,包括QAT是什么、QAT有哪些功能、QAT应用场景以及QAT的价值,并通过数据压缩加速以及SSL加解密加速两个应用进一步说明QAT的用法。
Arm 架构下性能优化经验分享 | 龙蜥社区走进 Arm MeetUp
从实用角度解读如何在 Arm 平台上进行业务软件的性能测评、分析及优化,涵盖负载配置模式的选择、波动因素的消除、宏观经验调优及多层配合(应用层、系统层及微架构层)的深度性能优化,充分挖掘底层基于 Arm 架构硬件的性能潜力。
Gartner 2023 可观测性魔力象限解读和启示 | 龙蜥社区系统运维 MeetUp
围绕 Gartner 关于 APM 和可观测性魔力象限谈了谈他的一些想法。据 2023 年最新的可观测性魔力象限报告显示,目前,其已受到社会各界广泛关注,市场空间占比也很大,而入选魔力象限可分为“技术”和“非技术”两项指标。接着,他详细介绍了 Leader 象限供应商的特点、Visionaries 象限供应商的前瞻性、Niche Players 象限解决了用户哪些痛点等。最后总结了可观测性的发展趋势。
阿里云亮出 Agent 基础设施全景图,ANOLISA 要做每一个 Agent 的运行底座
ANOLISA 是打造的 Agent 系统管家。它的使命是:打造更高效、更安全的 Agent Native 环境。
面向智算场景的 RISC-V 处理器 IP|龙蜥MeetUp
作为RISC-V架构的先行者与领导者,SiFive介绍了其覆盖从超低功耗到高性能计算需求的创新、高度可定制RISC-V处理器IP核解决方案。该议题探讨了RISC-V在高性能服务器领域的突破潜力及其对传统架构的挑战;聚焦了RISC-V与AI技术的深度融合,解析了其作为高效能AI加速器控制核心或定制化AI计算单元的优势,展望了其在智能化浪潮中的核心作用。
Co-Sight:基于多 Agent 动态规划与分层反思的下一代 AI 决策系统|龙蜥MeetUp
探讨了AI技术应用于复杂任务时,传统大语言模型(LLM)在动作决策和多步推理上的局限性。构建具备自主规划与动态纠偏能力的智能体系统成为关键挑战。中兴通讯介绍了其Co-Sight框架,该框架通过多Agent协同架构(Plan-Actor-Memory)实现任务降维,结合实时上下文精炼消除冗余,并依托分层反思系统生成奖惩信号以动态优化DAG执行路径。其核心创新在于关注点分离与闭环反思机制。在GAIA评测中,Co-Sight以72.73%综合得分超越Google DeepMind与OpenAI,在复杂多步任务(L2级)中稳定性显著领先。
龙蜥社区系统运维联盟主席冯富秋致辞|龙蜥MeetUp
龙蜥社区系统运维联盟主席冯富秋表示龙蜥社区系统运维联盟作为运维技术创新的前沿阵地,承载着双重使命:第一通过强化联盟与各成员单位间的协同合作,打造出运维能力跃升新引擎;第二,致力于制定并推广运维产业标准,为用户提供一盏明灯,让他们清晰洞悉市场运维水准的现状与未来趋势。同时,他也详细介绍了联盟当前的工作进展,强调通过联盟,牵引国内系统运维健康、有序、领先的发展。
浪潮信息KeyarchOS机密计算实践及解决方案|龙蜥大讲堂108期
了解操作系统及服务器整体解决方案规划、建议;了解如果通过KeyarchOS使能服务器的机密计算能力,并快速构建一个机密计算应用。
"芯""蜥"相通 融合创新 -- 携手阿里云 释放Intel平台算力
首先介绍了 Intel 第四代至强可扩展处理器(代号 Sapphire Rapids,SPR)以及刚发布不久的第五代至强可扩展处理器(代号 EMR)的核心特性,包括 AMX、QAT、DSA、IAA、TDX 等。然后总结了英特尔与阿里云在 OpenAnolis 社区的合作推进这些特性使能的成果, 通过双方的努力,大部分新功能已在阿里云上启用并落地。 最后,介绍了在阿里云 ECS g8i 实例上利用新特性的三个最佳实践,以此展示新特性可以带来多么令人印象深刻的提升。
CSI 与 open-local 核心技术分享 | 龙蜥大讲堂30期
介绍 kubernetes CSI 技术原理,并以 open-local 为代表介绍本地存储上解决方案,以及高性能存储 dpdk 在 open-local 中的应用。
SIMD 指令集在 OpenJDK 中的现状与未来|龙蜥大讲堂 14 期
通过本次讲座,Java 开发者可以进一步地了解到一些 Java 代码背后的行为,特别是与 CPU 硬件相关的性能优化,进而理解如何使用 SIMD 指令集进一步提升 Java 代码的性能。同时,听众能大概了解 SVE 这一最新的 Arm SIMD 指令集架构。
龙蜥社区走进Intel MeetUp 社区理事长马涛致辞
Intel 在龙蜥社区围绕 Intel 芯片等方面的工作,我认为主要有以下 3 个比较重要的特点: 第一个是全面性。龙蜥社区在整个场景方面是非常丰富的,无论是云原生、机密计算、应用加速等等。这些丰富的场景以及如何在这些场景下去围绕操作系统、Intel 的芯片来进行场景化、定制化的加速是龙蜥的核心的技术。 第二 Intel 在龙蜥社区参与的很多工作是非常深入的。针对刚才提到的场景,Intel 在龙蜥社区做了非常多的定制和优化。所以说龙蜥在如何使用 Intel 芯片去加速应用,让应用跑得更快、更稳和更好等方面是积累丰富的经验。 第三 Intel 在龙蜥社区做出的很多工作也是在全球领域非常领先的。 所以总结来看, Intel 在龙蜥社区贡献的三个关键词是:全面、深入和领先。
Agent 时代下的全局 KVCache 管理架构演进
本演讲聚焦Agent场景下KVCache的存储需求和带来的挑战,梳理了KVCache管理模式的演进路径。重点介绍了SGLang生态中的Hf3fsMetadataServer(MiniManager),以及阿里云即将开源的企业级全局KVCache管理系统—-TairKVCacheManager。该系统已实现对Mooncake的原生支持,为Agent时代的大模型推理提供稳定高效的KVCache存储支持。
基于 io_uring 和双 virtqueue 队列的 virtio-blk 数据通路加速方案
阿里云智能集团研发工程师孟繁瑞分享了《基于 io_uring 和双 virtqueue 队列的 virtio-blk 数据通路加速方案》。孟繁瑞提到,阿里云操作系统团队联合 CIPU、盘古等团队,基于 io_uring 的直通能力和 vring pair 的队列设计,改造了 virtio-blk 内核驱动,赋予了用户态程序直接构造 virtio-blk 命令的能力,不仅拓展了 virtio-blk 设备的功能边界,也为基于此技术的后端存储解决方案带来了更大的灵活性和扩展性,为公有云、分布式存储等场景提供了较好的弹性、可并发性和大吞吐能力。目前,这些特性已经合入了 ANCK-5.10 和 ANCK-6.6 中,即将随业务灰度上线。
基于Anolis OS的DCU环境部署|龙蜥大讲堂第140期
围绕 DCU 在 Anolis OS 环境部署做详细介绍,包括 DCU 产品介绍/DCU 在龙蜥社区的兼容性适配流程/DCU 环境的部署流程,最后就部署过程做演示。
组装式 OS 可靠性增强组件实践|龙蜥MeetUp
越来越多的场景对可靠性有更高的要求,如基站、卫星、工业网关、智能汽车等,而当前 Linux 聚焦资源管理机制的实现,不重点关注资源使用策略导致的异常,其主要提供了硬件的可靠性处理,整体上没有体系化的管理手段。同时对于操作系统而言,可组装的定制功能将能在不同的场景下最大化功能价值。面对可靠性增强的需求和挑战,中兴通讯进行了组装式 OS 可靠性增强组件实践,充分覆盖系统各类亚健康事件,并进行对应策略处理,尽可能保障系统的可靠运行,同时提供必要的维测信息,方便后续故障定位。设计上采用可组装思路,利用 ftrace、kprobes 及 eBPF 技术进行功能解耦,可以很好地满足多场景下 OS 可靠性增强需求。
中兴通讯操作系统产品部副部长蒋学鑫致辞|龙蜥MeetUp
作为本次大会的承办单位,中兴通讯持续为联盟的运作提供了资金、服务和技术的支持,在操作系统运维领域积极参与共建,为联盟成员做好服务,助力联盟健康发展。同时,中兴通讯也是龙蜥社区副理事长单位,秉承开发合作,共创共赢的理念积极参与社区建设,力争打造国内社区生态底座,促进社区繁荣发展。
场景化镜像平台技术解读|2023龙蜥操作系统大会
场景化镜像平台是龙蜥社区推出的统一镜像制作平台,提供容器镜像、虚拟机镜像的 CI、CD 全流程支持。平台分为 【镜像制品】、【制品中心】两个模块。镜像制品向用户开放社区已发布的镜像,用户在镜像制品中可查看镜像描述、镜像下载等;制品中心展示镜像 CI/CD 流程,在 Pipeline 流水线中可追溯构建、测试、安全扫描、发布等每一步流程。镜像平台地址:https://cr.openanolis.cn。
龙蜥社区 & kindling社区联合发布:北极星指标体系构建|龙蜥社区系统运维MeetUp
分享了关于排障北极星指标理论的独到见解。尽管在传统的可观测性领域,涵盖了 tracing、metrics、logging等要素,但依然存在一些无法观测到的盲区。这些盲区的存在使得我们在故障排除过程中常常感到困惑。由于 Linux 内核的复杂性,即使是专家们也常常受限于某一特定领域,例如网络、存储、CPU 调度等。因此,故障排查的挑战在于,虽然问题表面看起来可能出现在某一领域,但根本原因可能却隐藏在另一个领域。这意味着解决故障通常需要集结来自多个领域的专家,而这也导致了 1-5-10 等迅速恢复业务的问题难以解决和实施。 为了解决这一问题,Kindling 社区与龙蜥社区合作,共同推出了排障北极星理论。
SysOM 操作系统运维平台的介绍和使用方法|龙蜥大讲堂42期
通过本次讲解,可以了解到操作系统相关运维知识,包括监控,宕机分析,系统诊断,安全等相关专业知识,了解 SysOM 操作系统运维平台的部署方法,以及使用方法,能够通过部署 SysOM 平台,对自己的操作系统进行系统级别的运维和诊断。
开源生态与本土 AI 芯片新机遇 | 龙蜥大讲堂39期
边缘 AI 视觉的技术和场景、RISC-V AI 芯片&开开原生态创新、AI 工具链等和人工智能的发展历程、驱动力、算法、AI 芯片的设计。
Intel 新平台虚拟化技术演讲
李肖瑶介绍了未来 Intel 在虚拟化技术方面的新功能。新功能可以分为两类,一类为需要做虚拟化支持的新功能,即由 hypervisor 将新功能正确地虚拟化给虚拟机,使得虚拟化系统可以使用,如 CET、AMX、Arch LBR、PKS、UI。另一类为针对虚拟化的新功能,由 hypervisor 支持使用来增强 hypervisor 的能力或安全性,如 SVA、SIOV、TDX、 Bus Lock Detection、 Notify VM exit、IPI virtualization。
基于 ContainerOS 应用的实践经验
统信软件研发主管、龙蜥容器优化 OS SIG Maintainer 王磊分享《基于ContainerOS应用的实践经验》主题演讲。ContainerOS 会加速云原生建设,提供更轻、更稳定、更便捷的云底座 OS。系统只保留了系统运行的软件包和容器运行依赖的软件包,使系统更轻更薄;系统关键目录采用只读权限,不再提供 yum 等软件包管理方式,所有应用都以容器镜像方式运行,使系统更稳定安全;在一个云原生的集群里以一个整体系统镜像为原子进行更新和升级,确保集群内每个节点的软件包版本都是一致固化的,使系统升级更简单。更多内容可以关注龙蜥云原生 LifseaOS 和统信云原生操作系统。
龙蜥开发者服务MeetUp——KeenTune:统信 UOS 性能调优利器
龙蜥开发者服务MeetUp——KeenTune:统信 UOS 性能调优利器 讲师/嘉宾简介: 李林杰:统信软件
经验分享!Linux 内核宕机介绍和简单分析思路 | 龙蜥大讲堂 77 期
直播主题:Linux 内核宕机介绍和简单分析思路直播时间:2023 年 05 月 16 日(周二)16:00-17:00直播内容:首先简要介绍宕机发生的场景、原因,基于现有的阿里云运维经验和 SysOM 宕机中心,讲解可以排查的思路和经验。听众受益:了解 Linux 内核宕机的原因、发生情况和简单的分析思路和应对方式。适合人群:研发工程师、运维工程师。讲师介绍:刘馨蔚,龙蜥社区系统运维 SIG Contributor ,硕士毕业于北京大学信息工程学院计算机应用技术专业。研究领域为未来基础网络架构、传输控制算法等。目前负责内核宕机检测和自动分析工作,是 SysOM 宕机中心和内存诊断核心开发者。
具身智能场景下端到端确定性挑战与思考|龙蜥MeetUp
探讨了具身智能系统,其核心在于构建紧密耦合的“感知-融合-决策-执行”闭环,使机器能实时理解并作用于物理世界。指出实现面临的主要挑战:需达成高实时性、强鲁棒性的多模态感知融合,并进行高效动态决策与控制。该演讲以智能机器人为核心示例,聚焦基于Ubuntu + ROS2构建的主流机器人操作系统生态,探讨了OS在具身智能中的关键角色及其面临的端到端确定性问题。
Confidential AI:基于机密计算的 AI 推理安全与隐私保护方案|龙蜥MeetUp
针对AI在医疗、金融等敏感领域应用带来的数据隐私与模型安全推理问题,介绍了基于机密计算技术的Confidential AI解决方案。解析了如何在机密计算环境中实现端到端安全推理,涵盖加密模型部署、端到端通信安全、系统数据落盘加密保护等关键技术,旨在为行业提供可复用的安全推理框架。
Mooncake 大模型开源生态体系建设与产业应用实践|龙蜥MeetUp
介绍了大模型推理架构Mooncake。该架构通过创新的KVCache中心设计,显著提升了Kimi智能助手的推理吞吐和成本效率,已引起业界广泛关注。近期,清华大学与阿里云等多家企业宣布共建Mooncake项目,旨在构建高性能推理框架的开源生态。阿里云与清华大学共同探索了大模型资源池化技术的工业应用,推动推理实例共享与缓存池化层标准化,实现高效分布式资源解耦,提升大模型长上下文推理性能。目前Mooncake已在vLLM/SGLang等多个推理框架集成,并在多家企业落地。
如何打造开放领先的可观测性数据底座|龙蜥MeetUp
乘云数字提出了构建可观测性数据底座的理念,以实现数据融合和自由开发应用。通过统一数据模型和统一组织构建的思路进行设计指导,全面拥抱 OpenTelemetry,确保了与业界生态的紧密接轨。
龙蜥操作系统
龙蜥社区(OpenAnolis)是面向国际的 Linux 服务器操作系统开源根社区及创新平台,秉承“平等、开放、协作、创新”的原则,理事会由阿里云、统信软件、龙芯、Arm 、Intel 等 24 家国内外头部企业共同组成,有超过 1000 家来自芯片厂商、软件厂商、整机厂商、操作系统厂商等覆盖操作系统全产业链的合作伙伴参与生态共建。