解读集群镜像“开箱即用”神器——sealer!| 龙蜥大讲堂第 11 期

集群镜像把整个集群看成一台服务器,把 k8s 看成云操作系统,实现整个集群的镜像化打包和交付,为企业级软件提供一种“开箱即用”的应用封装技术。以行业 ISV为例,集群镜像帮助企业解决了分布式软件的部署一致性难题、降低了交付出错率,最终指数级降低分布式软件的交付成本。受 docker 等容器技术的启发,集群镜像将单机应用封装技术,上升到分布式集群维度,最终实现分布式软件的高效交付(build、share、run)。

582 0

智算时代的浪潮云原生实战

主要涵盖以下四个方面: 1.智算时代的来临,云原生如火如荼,两者的碰撞与融合。 2.云原生助力人工智能产业化,智算 OS 对 GPU、FPGA、DPU 的管理调度能力,助力人工智能产业化落地。 3.人工智能助力云原生智能化,人工智能的高速发展推进智算 OS 的运维智能化、用户体验智能化。 4.智算能力从中心到边缘的延伸,智算 OS 的云边端能力,进一步释放智算能力。

9881 2

数据安全-云原生机密计算介绍

随着数据要素价值的不断提高,保护处于使用状态中的敏感数据比以往任何时候都更为重要。Gartner 已将隐私计算标记为 2021 年的关键企业技术趋势,并用于处理和分析高度敏感的数据;到 2025 年,50% 的大型组织将采用隐私计算技术,应用于在不可信环境中处理数据以及多方数据分析的场景中。 机密计算是隐私计算的关键核心技术之一,可以实现数据的可用不可见,解决“数据孤岛”,释放数据价值,进而实现数据的全生命周期安全。本场演讲麻付强和张佳乐介绍了机密计算的基本概念、浪潮信息的机密计算应用,以及龙蜥社区的云原生机密计算SIG 最佳实践。

477 0

企业级存储与操作系统的协同设计

随着数字经济的发展,数据即资源已经成为共识,其与土地、劳动力、技术、资本并成为五大基础资源,在数据基础设施中,存储平台扮演了核心角色。数据基础设施在多场景化、数据巨量化、多态化等方面对存储提出了越来越多的挑战和要求。孟宪伟通过本次演讲就企业级存储当前面临的挑战,面向极致可靠、极致可用、极致性能、极致安全四个方面,分享和探讨了企业级存储与操作系统协同设计的现状和未来。

450 0

龙蜥社区走进Intel MeetUp 理事杨继国致辞

Intel 是龙蜥社区首批理事成员单位,多次参加技术委员会和运营委员会的工作,创建并维护 Intel 架构兴趣小组,将 Intel 的新平台、新特性、新优化都贡献并集成到龙蜥社区发行版中,使得广大平台用户能第一时间在龙蜥操作系统上获得对新平台的支持,进而使得龙蜥操作系统在全球范围内的操作系统发行版本中走在前列。 龙蜥社区自成立以来吸引了众多业界生态伙伴以及广大开源开发者的广泛参与。我觉得以下两方面特别重要: 第一点是不同领域的生态伙伴的加入,整个生态结构更加多样和完整。龙蜥社区生态伙伴已超过两百家,涵盖了不同的领域,生态更加丰富健壮。 第二点是广泛的开发者参与,社区更具生命力和活力。龙蜥社区已经建立了多个技术方向的特殊兴趣小组,不断吸引着广大开发者加入到社区,推动社区在各个技术领域上的创新。

600 4

中国软件行业协会常务副秘书长陈宝国为龙蜥峰会致辞

中国软件行业协会常务副秘书长陈宝国为龙蜥峰会致辞:“随着计算能力的发展,器件、计算无处不在,由计算所带来的操作系统的演化和进化也在不断地生成。”他说到:“桌面、服务器、移动端、智能设备大量涌现,操作系统应运而生,操作系统怎么发展?龙蜥为操作系统的发展提供了一条解决的方案,也给操作系统的业界带来一个启示。”

470 0
|
运维 监控 Linux
|

2022开源开放周分享 - 操作系统的运维和可观测性

操作系统的运维和可观测性

426 1
|
运维 监控 Linux
|

龙蜥大讲堂第71期 - SysOM 2.0 内存相关诊断功能

71期-SysOM 2.0 内存相关诊断功能

528 55
|
弹性计算 Linux Anolis
|

龙蜥大讲堂第69期 - 阿里云 ECS 八代 SPR 实例上使用 Intel AMX 特性加速 AI 类业务的实践

69期-阿里云 ECS 八代 SPR 实例上使用 Intel AMX 特性加速 AI 类业务的实践

1182 0
|
运维 监控 Linux
|

龙蜥大讲堂第61期 - SysOM 2.0特性及架构介绍

61期-SysOM 2.0特性及架构介绍

423 0

基于 kata 的 Serverless 产品体系建设

联通数科云原生技术架构师王琦做了《基于kata的Serverless产品体系建设》主题演讲。介绍了联通云基于Kata进行的 Serverless 产品体系的建设。首先介绍了通过国家政策为牵引,联通云深化自主研发和创新能力,聚焦无服务器技术和 kata 相结合,基于联通云双引擎基座建设 Serverless 产品体系,助力联通乃至央国企应用快速上云。然后通过一个 Serverless k8s 具体产品深入讲解了技术架构设计与场景化的需求,以及在对 Kata 进行选型时候所考虑的几个方面内容和优化方式。最后分享了在国内百花齐放的硬件厂商的大环境下, Serverless 和 Kata 结合多种异构 CPU ,通过无服务器技术屏蔽底层硬件差异的一个展望。

704 0
|
Linux Anolis
|

基于Anolis OS部署Intel® SGX-based 端到端安全解决方案

基于Anolis OS部署Intel® SGX-based 端到端安全解决方案

619 1
|
Linux Anolis
|

基于Intel® TDX部署云上人工智能方案

基于Intel® TDX部署云上人工智能方案

610 0
|
Linux Anolis
|

高密度可拓展负载均衡器HDSLB性能加速实践

高密度可拓展负载均衡器HDSLB性能加速实践

675 0
|
Linux Anolis
|

基于Intel® AMX技术加速DeepRec训练性能

基于Intel® AMX技术加速DeepRec训练性能

751 58

关于硬件加速器 FPGA 的异构加速流程的介绍 | 龙蜥大讲堂87期

FPGA 作为一种灵活可配置的硬件加速器,在高性能计算中具有很大的潜力,然而如何实现应用层到 FPGA 的全栈集成,仍面临诸多挑战。本次直播将以数据库为例,分享针对数据库瓶颈点的 FPGA 逻辑设计与软件集成方法。

581 4

进击的开源操作系统

进击的开源操作系统

837 0

Compliance As Code理念与龙蜥社区安全加固最佳实践介绍

Compliance As Code理念与龙蜥社区安全加固最佳实践介绍 讲师/嘉宾简介: 李艺林:OpenAnolis社区 OS安全技术SIG Maintainer

557 1

使用人工智能驱动开源翻译组

使用人工智能驱动开源翻译组 讲师/嘉宾简介: 白宦成:Linux中国开源社区

3044 57
|
人工智能 Linux Anolis
|

人工智能驱动下的翻译组新模式

在2023开放原子全球开源峰会上,分享 Linux 中国在生成式 AI 上的新实践,以及其对于通过开源推动 Linux 中国翻译组的持续发展的一些想法和探索。

402 0

龙蜥开发者服务MeetUp——KeenTune:统信 UOS 性能调优利器

龙蜥开发者服务MeetUp——KeenTune:统信 UOS 性能调优利器 讲师/嘉宾简介: 李林杰:统信软件

488 0
|
运维 Linux Anolis
|

经验分享!Linux 内核宕机介绍和简单分析思路 | 龙蜥大讲堂 77 期

直播主题:Linux 内核宕机介绍和简单分析思路直播时间:2023 年 05 月 16 日(周二)16:00-17:00直播内容:首先简要介绍宕机发生的场景、原因,基于现有的阿里云运维经验和 SysOM 宕机中心,讲解可以排查的思路和经验。听众受益:了解 Linux 内核宕机的原因、发生情况和简单的分析思路和应对方式。适合人群:研发工程师、运维工程师。讲师介绍:刘馨蔚,龙蜥社区系统运维 SIG Contributor ,硕士毕业于北京大学信息工程学院计算机应用技术专业。研究领域为未来基础网络架构、传输控制算法等。目前负责内核宕机检测和自动分析工作,是 SysOM 宕机中心和内存诊断核心开发者。

6102 42
|
Linux 程序员 Anolis
|

Linux 内核内存泄漏原因分析与应对方法 | 龙蜥大讲堂 76 期

直播主题:内核内存泄漏原因分析与应对方法直播时间:2023 年 05 月 11 日 16:00-17:00直播内容:讲解内存泄漏的发生的场景和原因,分析当前业界对内存泄漏的排查方式和目前我们 SysAK 工具排查的做法。听众受益:了解 Linux 内核中内存泄漏问题可能发生的场景和原因,介绍目前可以探查内存泄漏的工具。适合人群:研发工程师、运维工程师。讲师介绍:刘馨蔚:龙蜥社区系统运维 SIG Contributor。硕士毕业于北京大学信息工程学院计算机应用技术专业。研究领域为未来基础网络架构、传输控制算法等。目前负责内核宕机检测和自动分析工作,是 SysOM 宕机中心和内存诊断核心开发者。

5066 43
|
开发者
|

开源人说第二期——《从开源中来,到开源中去》先导预告

《开源人说》为阿里云开发者社区与InfoQ 联合出品的一档精品开源视频栏目。栏目围绕四大开源领域:云原生、操作系统、数据库、大数据&AI,介绍优秀的开源软件背后的故事,记录传播技术人追求极致和开放共享的精神。第二期主题《从开源中来,到开源中去》,围绕龙蜥操作系统开源故事,以及开放、丰富、多元、健壮的社区生态,讲述龙蜥是如何从Linux开源而来,CentOS替换出发,捐赠开放原子基金会,到开源中去,最后落地千行百业中去产生实际价值的故事。我们希望有更多人了解到开源人背后的故事和付出,也希望可以影响更多人参与到开源的事业中。专题地址:https://developer.aliyun.com/topic/opensourcefolkstalk

42498 6

Linux指令入门-文件管理

视频介绍Linux系统中常用的磁盘管理命令。

580 0

Linux指令入门-文件与权限

视频介绍Linux系统中常用的文件目录管理和文件权限管理命令。

802 47

AIibaba CIoud Linux 2-实践之系统安全更新

场景为讲师讲解云起实验室场景《Alibaba Cloud Linux 2实践之系统安全更新》场景将提供一台配置了Alibaba Cloud Linux 2的ECS实例(云服务器)。通过本教程的操作,您可以使用yum查询、检查以及安装Alibaba Cloud Linux 2操作系统的安全更新。

715 1

一起来聊聊IO夯那些事

IO 夯是操作系统存储领域中的典型问题,并会带来诸多危害。作为一名操作系统稳定性开发者,遇到 IO 夯问题必须及时想办法解决掉。不过,复杂的 IO 架构往往令人望而却步,定位问题时也容易无从下手。那么,怎样才能正确地定位并解决 IO 夯呢?InfoQ 联合龙蜥社区推出系列公开课栏目《龙蜥大讲堂》,在第三期内容中,我们邀请到了龙蜥社区系统运维 SIG 核心成员、阿里云高级开发工程师李光水,他将从探索一个 IO 的生命周期开始,与我们聊一聊 IO 夯的那些事。讲师/嘉宾简介⻰蜥社区系统运维 SIG 核心成员、阿里云高级开发工程师李光水

617 0

Inclavare Containers 机密容器技术

2020年11月5日,OpenAnolis社区(Anolis is not just Linux System)联合Open Infrastructure基金会举办了首场线下meetup,围绕「Cloud Native Infrastructures」主题,各路大牛相聚北京阿里中心。本次活动共计8大议题。来自阿里云、蚂蚁集团、Intel、中国移动、红帽等公司的技术专家围绕内核、容器及虚拟化等云原生基础设施技术展开探讨,解析相关开源技术内幕及社区进展,分享企业落地及实践经验。讲师及内容介绍阿里云操作系统系统安全团队主管张佳分享技术《 Inclavare Containers机密容器技术》。Inclavare Containers是云原生领域的机密计算容器运行时和服务,旨在把机密计算做为一种容器化的通用计算资源基础设施,在为云用户隐私保护和敏感数据保护的同时,还能提供与普通容器一致的使用体验。Inclavare Containers技术栈中的rune组件已经成为OCI Runtime参考实现之一,并支持docker和containerd。使用者可以基于Inclavare Containers技术栈轻松搭建K8s机密计算集群。

778 0

【DevUp第十九期】“云原生”Linux操作系统及最佳实践

什么是“云原生”Linux操作系统?云上Linux如何做到更加安全,稳定,高性能?云上Linux如何提供弹性伸缩、容器资源隔离、系统安全、可信计算、自动运维等多种云上最佳实践?本议题通过介绍由阿里云研发新一代Linux操作系统Alibaba Cloud Linux 2为大家一一解答。讲师介绍晓贾,阿里云操作系统团队产品专家,负责Alibaba Cloud Linux的整体产品方案,致力于打造阿里云上最佳操作系统实践,为用户提供云上操作系统最佳体验,成功打造了Alibaba Cloud Linux在云上包括弹性伸缩、系统安全、自动运维等优秀产品实践案例。

1673 0
|
人工智能 AI芯片
|

阿里巴巴AI智能专场

阿里巴巴AI智能专场 讲师/嘉宾简介: 施兴(叔宝):阿里巴巴自身算法专家 高星(空崖):阿里巴巴算法专家 张宁豫(凌羽):阿里巴巴高级算法工程师 王跃(跃神):阿里巴巴高级算法专家

2811 0

2分钟带你了解 ANOLISA——Agent 系统管家

ANOLISA 是转为AI Agent打造的操作系统,致力于打造更高效、更安全的 Agent Native 环境。

62 0
|
3月前
|
人工智能 Linux Anolis
|

智算新生态:异构 AI 算力底座如何驱动大模型全场景落地?

大模型正从“参数竞赛”转向“应用落地”,算力的性能、成本与工程效率成为关键瓶颈。本圆桌邀请阿里云、中兴、沐曦、浪潮等企业专家,探讨三大关键:如何通过软硬协同释放异构算力效能?SGLang与开源社区如何降低部署门槛?在 AI 运维与垂直行业中如何构建稳定、弹性且低成本的推理方案?最终推动AI从技术突破走向产业落地。

133 0

C 转 Rust 的 AI 自动化方法

C 语言是非内存安全开发语言,在主流 Linux 操作系统中 C 语言代码占比超 70%,其中内核中的 C 语言代码超 90%。谷歌报告显示,超过 70% 高危漏洞源于内存安全问题。OpenSSF 也提出通过替换非内存安全的语言来消除内存安全漏洞是根本方法。统信服务器产线架构师张海东分享了《C 转 Rust 的 AI 自动化方法》,结合 AI 大模型 ,提出了一种 C 语言项目转换为 Rust 语言的一种可行性方法,提高系统关键组件的安全性,消除内存安全问题。

259 0

AI Agent 在 Anolis OS CVE 数据增强及智能化评估的实践

周彭晨表示,操作系统产品安全是一个不断演进的动态过程,及时发现和修复系统漏洞是操作系统安全合规治理的重要基础,围绕 CVE 的漏洞管理体系直接影响产品的安全响应效率与风险控制水平。同时,以开源组件为基础的操作系统产品存在漏洞数据庞大,漏洞信息不完整、格式不统一、更新滞后等问题,导致误报率高、关键漏洞易被忽略,严重影响处置效率。通过 AI Agent 实现多源信息采集、标准化处理与漏洞智能增强,并利用 AI Agent 辅助进行漏洞影响的评估和分析,可有效提升漏洞处理的效率和准确性。

167 0
|
10月前
|
Linux Anolis
|

开源文化与异构计算生态|龙蜥大讲堂第143期

了解开源文化,探索异构并行计算生态的发展与机遇。

399 0
|
10月前
|
Linux Anolis
|

异构并行计算系统和GPU程序设计|龙蜥大讲堂第142期

主要围绕GPU程序设计和异构系统编程进行由浅入深的讲解,理论与实践相结合,引领同学们熟悉和了解高性能计算生态的必备知识。

369 0

全景低侵扰的系统时延观测技术实践|龙蜥MeetUp

指出在泛在智算场景下,实时推理等业务对系统时延敏感,影响体验与收益,且随着AI技术发展,推理服务下沉为基础设施,时延稳定性决定上层应用可靠性。然而,传统观测工具难以兼顾精确性、完整性和低开销,导致生产环境时延问题难定位优化。分享了全景低侵扰系统时延观测技术的实践:构建轻量化、可部署的时延分析框架,覆盖CPU调度到网络IO的全栈追踪,为系统性降低非预期时延干扰提供观测依据。实践表明该方案在性能损耗可控前提下,显著提升运维效率,为泛在智算提供高稳定、低抖动的OS支撑。

202 0
|
11月前
|
Linux Anolis
|

Mooncake 大模型开源生态体系建设与产业应用实践|龙蜥MeetUp

介绍了大模型推理架构Mooncake。该架构通过创新的KVCache中心设计,显著提升了Kimi智能助手的推理吞吐和成本效率,已引起业界广泛关注。近期,清华大学与阿里云等多家企业宣布共建Mooncake项目,旨在构建高性能推理框架的开源生态。阿里云与清华大学共同探索了大模型资源池化技术的工业应用,推动推理实例共享与缓存池化层标准化,实现高效分布式资源解耦,提升大模型长上下文推理性能。目前Mooncake已在vLLM/SGLang等多个推理框架集成,并在多家企业落地。

338 0

零侵扰数据能力,构建可观测性智能体的基石|龙蜥MeetUp

从以 GPT 为代表的大模型出现之后,用 AI 实现 Ops 解决运维困境的梦想看起来实现近在咫尺,但 AIOps 发展的核心瓶颈是数据。现阶段的运维体系存在大量的数据盲区、数据孤岛、数据关联等问题,运维诊断更多的是依靠经验、猜测、直觉和灵感,而不是依靠数据。

250 0

面向AI的操作系统开发部署优化及应用实践|龙蜥大讲堂136期

介绍浪潮信息操作系统团队在人工智能浪潮中面向AI做的一些高效的AI解决方案。

318 0

高效可靠的处理器微体系结构性能测量技术

在Arm成熟的软硬件生态支持下,Arm架构处理器走进数据中心。应用的跨平台迁移及处理器设计研发均依赖于处理器微体系结构的性能数据,准确、可靠的性能测量是性能工程的重要基础。本次演讲围绕性能测量,着重分享了两项工作。第一项工作是关于如何高效地复用硬件性能计数器进行可靠测量,此项工作主要针对现有工具在复用硬件性能计数器测量时存在的低效行为,通过研究Linux内核性能事件的调度机制,提出一种自适应的性能事件分组方法提高性能计数器的复用效率。第二项工作是关于Arm架构处理器实时内存带宽的通用测量方法,Arm架构的灵活性赋予了各硬件厂商定制处理器的能力。此项工作探索了Arm架构下实时内存带宽测量通用方案的可能性。

321 0

AArch64架构调用链性能数据采集原理

调用链 (Callchain) 是软硬件事件上下文信息之一,对性能优化和故障排具有非常重要的作用。如著名的火焰图 (Flamegraph) 就是对调用链信息汇总统计和可视化的结果。但是在调用链收集的过程中,工程师往往因为不了解底层的采集原理导致调用链收集不完整,采集开销不可控等问题。本议题核心介绍了在AArch64架构下调用链采集的原理,比较它们之间的不同和阐述适用场景。同时对Linux内核态和eBPF调用链采集做了一些简单介绍。

354 0

为RTP-LLM提供Arm CPU后端,助力Arm AI软件生态持续发展

随着大语言模型(LLM)的普及与应用,AI计算需求快速增长。许多LLM模型运行在基于GPU的硬件上,而随着Arm架构不仅在边缘设备,而且在数据中心领域也愈发流行,如何让RTP-LLM(实时推理框架)有效支持Arm CPU平台变得尤为重要。通过优化LLM在Arm平台的推理性能,可以进一步提升功耗效率和模型部署的灵活性。

434 0

阿里云 Confidential Al 最佳实践

为缓解用户对 AI 模型上云产生的隐私与合规问题,阿里云 Confidential AI(CAI)实现了一种覆盖模型数据生命周期的端到端通用框架,揭示了机密计算在 AI 系统安全方面的重要价值。未来,CAI 将利用远程证明体系提供基于软件供应链的可验证代码透明度,为用户提供独立验证 CAI 隐私和安全保证的能力。

389 0

开源社区漏洞治理策略与实践

开源软件供应链非常复杂,存在大量的攻击点,谷歌和微软分别给出了开源供应的 SLSA 框架和 S2C2F 框架,里面存在着漏洞攻击、投毒、过程篡改等风险,加之代码开源漏洞更加透明且容易获取。本次分享聚焦供应链漏洞治理,通过成分分析建立 BOM 体系,识别社区研发过程各个环节风险,通过工程能力提升社区漏洞感知、漏洞可达、漏洞修复,E2E 处理漏洞能力。

430 0

车载操作系统信息安全架构

随着汽车产业智能化、网联化发展,其安全性与隐私保护方面的问题也日益凸显。 车载操作系统作为汽车产业智能化核心,安全更是重中之重。中兴通讯打造的 safetylinux 操作系统,提出了包括安全启动、安全通信、安全存储、安全诊断和入侵检测等要素在内的车载操作系统信息安全架构,为汽车产业的信息安全保驾护航。

319 0

操作系统的密码应用

密码是数据安全的基石,操作系统是软件世界的基石,随着《密码法》《数据安全法》《商用密码管理条例》等法律法规的颁布,“合规”的要求逐渐增多。本次分享聚焦在操作系统中如何使用商用密码保障自身“组件”的安全并满足趋严的“合规”要求。

258 0

基于英特尔平台加速 AI 应用及 LLM 推理性能介绍|龙蜥大讲堂第115期

了解新一代英特尔®至强®可扩展处理器,对深度学习和经典机器学习方面的加速能力;大语言模型推理的常见优化技术;英特尔开源 LLM 高速推理框架 xFasterTransformer 的相关优化策略及效果。

464 0

大语言模型的优化及基于Intel® Extension for Transformers 的部署实践

大语言模型的优化及基于Intel® Extension for Transformers 的部署实践

330 0

龙蜥操作系统

龙蜥社区(OpenAnolis)是面向国际的 Linux 服务器操作系统开源根社区及创新平台,秉承“平等、开放、协作、创新”的原则,理事会由阿里云、统信软件、龙芯、Arm 、Intel 等 24 家国内外头部企业共同组成,有超过 1000 家来自芯片厂商、软件厂商、整机厂商、操作系统厂商等覆盖操作系统全产业链的合作伙伴参与生态共建。

0
今日
4374
内容
9
活动
9731
关注
你好!
登录掌握更多精彩内容

活跃用户