手机内核稳定性的治理与实践
我们了解的 Linux 稳定性都是基于 x86 和 Arm 服务器上的,然而在手机上的系统稳定性,也值得我们去一探究竟。魅族科技高级工程师、龙蜥系统运维SIG Contributor 白浩文与嘉宾一起谈一谈《手机内核稳定性的治理与实践》。他首先简要介绍了稳定性问题的来源,以及开发过程。重点举例介绍了运行时动态检测的一些方法以及相关原理。在实践中,魅族手机在开发阶段引入了一些新的特性来提高捕捉内存异常的概率,其中也包括从上游龙蜥社区引入的改进特性。为了全方位监控和解决稳定性问题,魅族也在智能化分析问题和提升效能方面做了相应工作。最后,还作了简要的总结和阐述所面临的一些挑战。
Linux 应用运行抖动的背后 | 龙蜥大讲堂25期
抖动是影响业务性能的一大类问题,通过深入理解 Linux 应用运行过程的抖动原因,来协助系统及应用进行优化。同时介绍怎么 SysAK 工具对问题进行监控和诊断。
Spark SQL向量化执行引擎框架Gluten-Velox在AArch64使能和优化
Apache Spark是当前流行的开源数据处理引擎,Spark SQL为用户提供可靠的查询计算解决方案。近期,Gluten项目作为基于Apache Arrow的原生SQL引擎正式亮相,旨在增强Spark SQL计算性能。与此同时,多个向量化SQL引擎和更加活跃的开源社区也纷纷涌现。其中Velox项目尤为引人注目,它提供了向量化数据库加速库。本议题简要介绍了Gluten-Velox框架的概况和原理,同步Gluten-Velox社区在AArch64平台上的使能状态,并通过一个 Velox的优化案例,展示此Spark SQL向量化执行引擎框架在AArch64上的潜力。
Alibaba Cloud Linux 与倚天软硬结合,加速数据智能创新
根据 IDC 报告统计,通过云满足客户业务的需求,已经大大超过了传统管理基础设施。ECS 作为阿里云的比较关键的产品和服务,需要用自身产品能力满足不同类型的市场需求。吴天议主要分享了基于龙蜥社区 Anolis OS,阿里云采用倚天芯片与 CIPU 构建的面向云原生神龙计算体系架构,如何满足未来智能化的应用的需求。
Linux 性能调优产品KeenTune快速入门
6 月 11 日 ~ 12 日,龙蜥社区联合 Linux 中国,在北京召开的开放原子全球开放峰会现场组织 LUG 线下沙龙活动,与大家一同聊聊开源、聊聊 Linux 、聊聊社区当中的那些最新的技术。
中移动算力网络中的云原生虚拟化
中国移动信息技术中心 PaaS 架构师魏宝辉分享了《中移动算力网络中的云原生虚拟化》技术演讲。他对中国移动算力网络的基本布局规划做了简要介绍,算力网络是以算为中心、网为根基的新型信息基础设施 。通过技术升级实现算力无处不在、网络无所不达、智能无所不及的愿景。 在多样性算力的开发过程中,对云原生技术栈的需求愈发突显,开发团队多,发布调试频繁,对 k8s 集群环境需求量大,但是算力资源有限,开发环境的供给速度,跟不上业务的发展速度。中国移动信息技术中心通过 kubevirt 的云原生虚拟化技术,结合 gitops,云 ide 等工具体系,打造了自动化交付的全功能开发环境。在技术上采用了 vm in pod 的模式,并将 k8s 集群放入 pod 内。有效突破了物理机供给 k8s 集群紧张的情况,实现了用 8 台物理主机交付 170 多个开发集群。这种高效的自动化交付能力,也通过云原生虚拟化技术屏蔽了底层的硬件差异,以标准化的 k8s 交付方式,满足开发者的集群使用需求,提升算力资源的利用率,释放更大的算力价值。
第17课:Spring Boot2.0 实战Docker容器Linux与架构原理
直播内容:第17课:Spring Boot2.0实战Docker容器Linux内容摘要:Docker是最流行的开源容器引擎,Go语言开发,在互联网大规模集群、云计算、微服务等架构中广泛使用。本次课程一起学习Docker容器架构原理、如何基于Linux系统实战实战Docker容器,打包、发布、运行Java Spring Boot2.0应用。讲师:徐雷(点击关注专家,掌握一手干货)阿里云栖Java技术专场讲师2018阿里云大学讲师,与阿里P9叶翔主讲《阿里巴巴MongoDB高级实战课程》《阿里巴巴MongoDB认证》讲师阿里巴巴MongoDB大会讲师2017翻译《MongoDB实战》第2版吉林大学计算机学士,上海交通大学硕士直播地址:Java技术进阶群3000人大群进群方式:钉钉扫码入群
Linux基础内容学习方法和概述
课程介绍:如何成为网络安全工程师?不知道该如何入门?本课程通过四个模块的知识学习,让您能够对网络安全相关基础技术有一个全面的了解和掌握,主要内容包括:IT基础技术、网络安全基础概念、网络安全渗透技术基础及Web应用安全基础。主要的学习方式包括在线直播、图文和在线实验进行学习。如果您是一位对网络安全感兴趣的大学生,我们还会根据您学习过程的参与情况,与线下考试情况,给您推荐实习或就业机会,快快来参与吧。系列课程Linux基础内容学习方法和概述(本节)用户管理和文件管理网络基础学习方法和概述局域网、路由技术 常见网络应用层协议和工具 MySQL数据库学习方法和概述 MySQL对象与应用和运维技术 Web应用基础学习方法和概述Web服务和应用实践网络安全学习方法、背景和发展密码学概述和关键算法密码学常见应用身份与访问控制概述、相关技术和常见威胁网络层和主机层常见漏洞和攻击 应用层和数据层常见漏洞和攻击渗透测试概述和相关工具概述信息收集和漏洞扫描技术 网络层主要攻击 、流量捕获技术和初识Netcat 主机层主要攻击 、口令破解和权限提升 OWASP Top 10 概述 、初识SQL注入、XSS和文件上传常见 Web 漏洞解析Web安全工具DVWA部署 、暴力破解和命令注入实操XSS 、 文件包含和文件上传实操SQL回显注入 、 SQL盲注和CSRF实操网络层和主机层安全防护技术基础Web应用层和数据层安全防护技术基础讲师介绍:唐俊飞:铭学在线创始人,网络安全行业知名讲师、CISSP、阿里云安全ACP、CISP、中国信息安全测评中心授权培训师资质(CISI)、 CSA(云安全联盟)大中华区授权培训师资质、阿里云MVP。16年网络信息安全以及培训领域从业经验,具有较强的网络安全管理、技术、咨询和培训实战项目经验,曾就职于:运营商、上市安全企业等。主要讲授CISSP(国际注册信息系统安全专家认证)、CISP(国家注册信息安全人员认证)、信息安全管理、渗透测试、等级保护、网络安全防护体系、云安全等课程资深讲师,培训人数20余万人次。张弛:梆梆安全安全服务团队负责人,致力于移动安全领域研究,目前主要负责移动应用渗透测试、安全培训体系建设、web渗透测试等工作。在职期间参与过重大活动保障、2019年护网行动作为攻击队参与护网行动等,通过自主学习获得了CISP、等保测评师等资格证书。目前在公司担任区域技术经理,深化移动安全的研究以及物、车联网方向的研究。张宁:梆梆安全高级培训讲师,在web安全和移动安全领域拥有数年渗透经验。在金融行业渗透测试有着丰富经验,目前为华夏银行,中信银行等多家银行服务过,也曾作为讲师为CCTV7,中原银行,金谷银行进行安全科普,漏洞挖掘等培训。适用人群:对网络安全感兴趣的在校大学生、网络安全初学者、希望掌握安全基础技术的IT在职者你能学到:网络安全相关的基本概念、基础渗透技术、基础防护技术等
释放硬件潜能,激活软件生态 《龙蜥+超级探访》第二期走进 Intel
作为龙蜥社区的创始理事单位,以及全球最大的半导体芯片制造商,英特尔为龙蜥提供先进的硬件优化技术,是开源社区创新技术孵化合作的完美典范,也是本期《龙蜥+超级探访》走进的企业。本次访谈邀请了英特尔副总裁、英特尔软件和先进技术事业部总经理李映,英特尔技术总监、龙蜥社区理事杨继国,阿里云服务器操作系统产品经理贾正华,阿里云高级技术专家、龙蜥社区英特尔 Arch SIG Maintainer 丁宁,阿里云 Higress & MSE 云原生网关产品负责人耿蕾蕾等 5 位业界专家,深度解读在操作系统产业面向 AI 升级换代的历史节点上,英特尔如何联手龙蜥布局“云+AI”的未来?在双向奔赴的合作历程中,龙蜥与英特尔如何完美搭配将创新技术孵化至成熟产品,进而服务关键业务场景?
2023龙蜥操作系统大会
据《国产服务器操作系统发展报告(2023)》称,在云与AI深度融合的技术浪潮之下,服务器操作系统产业正处于升级迭代的关键时期。该主论坛将聚焦服务器操作系统产业 2.0 时代背景,集领域专家学者、联盟协会领导、企业领军人物等,深度解读国产操作系统的过去与未来。讲师/嘉宾简介专家学者、联盟协会领导、企业领军人物
libvirt 虚拟机热迁移流程简介 |龙蜥大讲堂81期
直播主题:libvirt 虚拟机热迁移流程简介 直播时间:2023 年 05 月 31 日(周三)16:00-17:00 直播内容: libvirt 是用于管理虚拟机的开源项目,是各大基于 OpenStack 二次开发的云平台管理底层 qemu-kvm 虚拟机的核心组件,而热迁移作为虚拟机管理中较为常用的功能,其在稳定性和效率关乎云平台的整体使用体验,本次分享主要讲解虚拟机热迁移在 libvirt 项目中的主要流程及迁移参数作用和影响。 听众受益: 了解 libvirt 虚拟机热迁移整体流程,迁移方式及关键迁移参数作用及影响。 适合人群: 云计算研发人员。 讲师介绍: 李东世,浪潮数据云计算高级研发工程师,负责浪潮数据云平台核心功能开发及维护,主导底层虚拟化相关功能开发、问题定位处理。
全网首档操作系统探访体验栏目“龙蜥+超级探访”震撼上线!看国产 OS 如何乘风破浪
如何联合开源技术与国际社区形成双向互动,消除 CentOS 策略变更带来的影响?“全网首档操作系统探访体验节目”《龙蜥+超级探访》重磅上线!统信软件既是实现开源和商业互补协作的成功典范,又是身先士卒引领伙伴投身开源的“大队长”,也是龙蜥+超级探访首期走进的企业。且看龙蜥社区联合行业内生态伙伴何实现从技术创新到商业变现的跨越。
基于英特尔®DL Boost技术的 AI 性能优化
黄文欢介绍了基于英特尔®深度学习加速(Intel®DL Boost)技术的 AI 性能优化相关内容。首先介绍了英特尔®AVX-512 及深度学习加速技术在各代英特尔®至强®处理器上的演进,包括第一代深度学习加速技术 VNNI;第二代®深度学习加速技术 BFloat16;及下一代深度学习加速技术 AMX。接下来,和大家一起分享了这些深度学习加速技术在龙蜥社区 AI SIG 中的应用及带来的性能提升,包括对深度学习框架 TensorFlow 和 PyTorch 的优化,及用于模型压缩的优化工具 INC。最后介绍了下一代至强可扩展处理器 Sapphire Rapids 上 AMX 技术,并分享了其理论性能提升及相关应用场景。
超融合 Kata 虚拟化容器技术介绍 | 龙蜥大讲堂 78 期
直播主题:超融合产品中的 Kata Containers直播时间:2023 年 05 月 17 日(周三)16:00-17:00直播内容:超融合技术融合基础实施为企业用户提供虚拟化、容器等不同形态的服务。本次直播分享 Kata 虚拟化容器技术,及超融合产品为集成 Kata 容器而进行技术方案演进历程,讲解超融合 Kata 容器技术设计与应用。听众受益:了解 Kata 整体架构,识别云原生现有方案在超融合环境下技术缺陷。适合人群:云原生及 Kata 爱好者,云计算、超融合研发工程师等。讲师介绍:王永超,浪潮数据超融合云原生工程师。负责浪潮信息超融合产品容器方案设计、研发及参与 Kata、Kubernetes 等开源项目贡献等工作。
核心技术分享: CRI-RM based CPU and NUMA Affinity | 龙蜥大讲堂28期
介绍一种新的 CPU 和 NUMA 绑定方法,并在 CRI 资源管理器 (CRI-RM) 中实现,主要将其用作 K8S 上加速工作负载的解决方案。
企业级存储与操作系统的协同设计
随着数字经济的发展,数据即资源已经成为共识,其与土地、劳动力、技术、资本并成为五大基础资源,在数据基础设施中,存储平台扮演了核心角色。数据基础设施在多场景化、数据巨量化、多态化等方面对存储提出了越来越多的挑战和要求。孟宪伟通过本次演讲就企业级存储当前面临的挑战,面向极致可靠、极致可用、极致性能、极致安全四个方面,分享和探讨了企业级存储与操作系统协同设计的现状和未来。
AI Agent 在 Anolis OS CVE 数据增强及智能化评估的实践
周彭晨表示,操作系统产品安全是一个不断演进的动态过程,及时发现和修复系统漏洞是操作系统安全合规治理的重要基础,围绕 CVE 的漏洞管理体系直接影响产品的安全响应效率与风险控制水平。同时,以开源组件为基础的操作系统产品存在漏洞数据庞大,漏洞信息不完整、格式不统一、更新滞后等问题,导致误报率高、关键漏洞易被忽略,严重影响处置效率。通过 AI Agent 实现多源信息采集、标准化处理与漏洞智能增强,并利用 AI Agent 辅助进行漏洞影响的评估和分析,可有效提升漏洞处理的效率和准确性。
OCP GPU RAS规范解读|龙蜥大讲堂
本次演讲重点介绍面向大规模数据中心的GPU RAS能力建设要求,包括大规模数据中心集成过程中遇到的痛点问题,GPU RAS功能及管理要求、GPU系统级故障注入、错误报告及调试转储等内容。
基于 LLM Agent 的智能诊断机器人|龙蜥MeetUp
陈诗雁介绍了系统运维的现状和难点、智能对话机器人的发展、大模型在系统运维的应用、基于大模型智能体的诊断机器人设计,并演示了 SysOM 智能诊断机器人。智能机器人和运维平台是相辅相成的关系,运维平台的诊断能力成就了智能机器人解决实际问题的能力,智能机器人帮助运维平台更好地发挥和展示运维能力。
下一代数据中心互联协议CXL及在龙蜥的规划 | 龙蜥大讲堂第 58 期
CXL 作为下一代高带宽低延迟的互联协议,即将被广泛应用在数据中心之中。本次活动主要介绍了 CXL 的基础概念和规范,当前 Linux 内核和硬件厂商 Intel 对于 CXL 的支持,以及龙蜥社区对于 CXL 的规划。
龙蜥大讲堂第69期 - 阿里云 ECS 八代 SPR 实例上使用 Intel AMX 特性加速 AI 类业务的实践
69期-阿里云 ECS 八代 SPR 实例上使用 Intel AMX 特性加速 AI 类业务的实践
缓存一致性总线 CXL 的技术及应用研究 |龙蜥大讲堂 85 期
直播内容: 以 CXL 为代表的缓存一致性总线的出现,使得 CPU 之间、CPU 与异构加速器之间可以实现缓存一致性和多元异构计算融合,提升 CPU 与加速器之间的协同效率,实现大规模内存扩展与内存资源池化,有效提高内存资源利用率,提高服务器系统的可扩展性,灵活满足内存数据库、AI 异构加速、云计算等大内存和异构计算应用场景需求。《CXL 技术及应用研究》直播进行 CXL 技术基础剖析讲解,并分享应用 CXL 技术进行系统设计的应用心得。 听众受益: 理解 CXL 基本原理和应用场景,交流在工程上的应用实践。 适合人群: 软硬件工程师、系统架构师。 讲师介绍: 高显扬,浪潮信息硬件开发高级工程师,负责新一代融合架构系统设计,创新系统架构,实现大规模主机和资源解耦。从事的领域有系统架构设计、信号完整性分析、软硬件协同设计等。
“芯”有灵“蜥”——英特尔与龙蜥社区共建云原生时代开源全栈生态
云栖大会龙蜥专场论坛有9大主题、14位大咖亲临现场畅聊、分享,为龙蜥社区打 Call、上手龙蜥 OS 沉浸式体验.......来自开源社区领袖、高校专家学者、社区合作伙伴、开源技术专家等 14 位重磅嘉宾坐而论道,《OpenAnolis 龙蜥操作系统开源社区技术创新白皮书》正式发布!本场论坛特邀嘉宾 SegmentFault 思否 COO,开源社副执行长江波为整场论坛主持。云栖系列视频已经上线至龙蜥社区官网,欢迎观看:云栖大会龙蜥专场论坛。活动主题及内容《“芯”有灵“蜥”——英特尔与龙蜥社区共建云原生时代开源全栈生态》分享。杨继国表示,英特尔作为首批14 家理事单位之一参与到社区里去,相关技术专家和运营人员皆全方位参与到龙蜥社区的开发和推广中,是 Intel Arch SIG、AI SIG、商密软件栈 SIG 的创建者和维护者。此外,筹建中的 SIG,包括持久内存,还有 OS 基本库优化。讲师介绍Intel 技术总监——杨继国
阿里云 Confidential Al 最佳实践
为缓解用户对 AI 模型上云产生的隐私与合规问题,阿里云 Confidential AI(CAI)实现了一种覆盖模型数据生命周期的端到端通用框架,揭示了机密计算在 AI 系统安全方面的重要价值。未来,CAI 将利用远程证明体系提供基于软件供应链的可验证代码透明度,为用户提供独立验证 CAI 隐私和安全保证的能力。
开源社区漏洞治理策略与实践
开源软件供应链非常复杂,存在大量的攻击点,谷歌和微软分别给出了开源供应的 SLSA 框架和 S2C2F 框架,里面存在着漏洞攻击、投毒、过程篡改等风险,加之代码开源漏洞更加透明且容易获取。本次分享聚焦供应链漏洞治理,通过成分分析建立 BOM 体系,识别社区研发过程各个环节风险,通过工程能力提升社区漏洞感知、漏洞可达、漏洞修复,E2E 处理漏洞能力。
Intel QAT 加速的数据压缩和 TLS 加解密技术 | 龙蜥大讲堂 102 期
介绍Intel QAT技术,包括QAT是什么、QAT有哪些功能、QAT应用场景以及QAT的价值,并通过数据压缩加速以及SSL加解密加速两个应用进一步说明QAT的用法。
龙蜥社区在提升中国开源软件影响力和国际贡献率的思考|2023龙蜥操作系统大会
会上,中国工程院院士陈左宁,北航网安学院院长、教授、龙蜥社区高级顾问刘建伟 ,中国开源软件推进联盟副主席、龙蜥社区特约顾问刘澎,阿里巴巴集团副总裁、阿里云基础设施事业部总经理蒋江伟,就“龙蜥社区在提升中国开源软件影响力和国际贡献率的思考“展开圆桌话题环节。讨论中,陈左宁院士表示,龙蜥底座不是传统意义上的服务器操作系统,主要是来自于阿里云支撑云软件的操作系统,这个实践本身是支撑阿里云的,现在可能对通义千问,对人工智能有进一步支持。龙蜥将云时代、大数据时代、智能时代的一些技术,垂直做到基础操作系统里面,可以支撑上层系统,比原来 CentOS 等一般操作系统的意义更大。期望龙蜥的开放生态,下面对“芯”,上面对“云、数、智”,真正地支撑住。
英特尔®资源调配技术(英特尔®RDT)与业务混布
崔龙一开始介绍了多核心服务器上,由于资源共享带来的云上服务 QoS 波动,以及 Intel RDT特性对于内存带宽和 L3 cach e用量的监测和分配技术对于保证 QoS 的保障作用 ,intel RDT 特性在上游 Kernel 的支持情况。接着详细介绍了如何通过 pqos 和 Kernel resctrl 接口使用 Intel RDT。同时还以 speccpu 为例,说明了不同负载,对资源的敏感程度差异较大。最后介绍了一系列 Intel RDT 在实际业务混部中部署的实例。
Java 云原生能力重磅升级:开启高性能和可观测的新时代
英特尔亚太研发有限公司高级应用工程师金钟晖、阿里云智能云原生应用平台高级开发工程师魏嘉带来《Java 云原生能力重磅升级:开启高性能和可观测的新时代》主题分享。 在可观测领域介绍了 Continuous Profiling 对于应用的意义以及价值;系统性能分析和高级语言(JVM)性能分析的差别和性能分析类型分类;JFR 和 Async-Profiling 的优势和优缺点,Arms 和 Dragonwell 团队在 Continuous Profiling 领域的合作以及产品情况;Continuous 带来的难点以及解决办法:利用 SegmentTree 从 O(n) 到O(Log(n)) 的查询优化。 在计算领域介绍了在 Java 领域进行高性能计算,特别是如何充分利用当前硬件进行高效向量化运算面临的挑战,以及阿里巴巴和英特尔应对这些挑战做的努力。目前阿里巴巴和英特尔共同投入了相关的专家,着力于把 VectorAPI 移植到 Dragonwell11 上。不久业界就可以用到 OpenJDK11 兼容增强的 Dragonwell11+VectorAPI 的解决方案。从而在提高 CPU 运算效率的同时有效解决了在 Java 领域使用向量化计算所带来的挑战,极大地提升了 Java 云原生计算能力。
机密计算与龙蜥社区云原生机密计算 SIG 详细介绍
6 月 11 日 ~ 12 日,龙蜥社区联合 Linux 中国,在北京召开的开放原子全球开放峰会现场组织 LUG 线下沙龙活动,与大家一同聊聊开源、聊聊 Linux 、聊聊社区当中的那些最新的技术。
Co-Sight:基于多 Agent 动态规划与分层反思的下一代 AI 决策系统|龙蜥MeetUp
探讨了AI技术应用于复杂任务时,传统大语言模型(LLM)在动作决策和多步推理上的局限性。构建具备自主规划与动态纠偏能力的智能体系统成为关键挑战。中兴通讯介绍了其Co-Sight框架,该框架通过多Agent协同架构(Plan-Actor-Memory)实现任务降维,结合实时上下文精炼消除冗余,并依托分层反思系统生成奖惩信号以动态优化DAG执行路径。其核心创新在于关注点分离与闭环反思机制。在GAIA评测中,Co-Sight以72.73%综合得分超越Google DeepMind与OpenAI,在复杂多步任务(L2级)中稳定性显著领先。
Mooncake 大模型开源生态体系建设与产业应用实践|龙蜥MeetUp
介绍了大模型推理架构Mooncake。该架构通过创新的KVCache中心设计,显著提升了Kimi智能助手的推理吞吐和成本效率,已引起业界广泛关注。近期,清华大学与阿里云等多家企业宣布共建Mooncake项目,旨在构建高性能推理框架的开源生态。阿里云与清华大学共同探索了大模型资源池化技术的工业应用,推动推理实例共享与缓存池化层标准化,实现高效分布式资源解耦,提升大模型长上下文推理性能。目前Mooncake已在vLLM/SGLang等多个推理框架集成,并在多家企业落地。
打造更 AI 的操作系统 《龙蜥+超级探访》第三期走进浪潮信息
面对多元算力优化与操作系统 AI 双向融合的技术趋势,浪潮信息如何联手龙蜥把握产业机遇,共同推动中国操作系统产业的可持续发展,向更高层次的操作系统智能化迈进?
Intel Linux 内核测试套件-LKVS介绍 | 龙蜥大讲堂104期
分享Intel内核测试组开发并维护的LKVS(Linux内核测试套件),介绍套件的发展、特性、用法以及当前在最新Intel服务器CPU上的热门属性,及其使用和验证方法。
操作系统分层分类的实现与应用 | 2023龙蜥操作系统大会
统信UOS服务器版汲取国内外主流社区技术栈优势,并率先提出了「分层分类」的开源技术路线,分层分类理论可以将分散、无序的操作组件维护工作拆解,极大地提升了操作系统的研发效率。目前,分层分类研究成果已广泛应用于多产品、多领域,可以更好地协调产业/团队分工、明确研发方向、维护关键软件、共建共享共治开源新生态。
龙蜥操作系统
龙蜥社区(OpenAnolis)是面向国际的 Linux 服务器操作系统开源根社区及创新平台,秉承“平等、开放、协作、创新”的原则,理事会由阿里云、统信软件、龙芯、Arm 、Intel 等 24 家国内外头部企业共同组成,有超过 1000 家来自芯片厂商、软件厂商、整机厂商、操作系统厂商等覆盖操作系统全产业链的合作伙伴参与生态共建。