基于 PolarDB 开源生态的可信安全数据库一体机

简介: 本文整理自莲子数据硬件系统首席架构师许长魁,在 2022 阿里巴巴开源开放周上的分享。本篇内容主要分为三个部分: 1. 项目背景 2. 研究进展 3. 未来规划。

本文整理自莲子数据硬件系统首席架构师许长魁,在 2022 阿里巴巴开源开放周上的分享。

本篇内容主要分为三个部分: 1. 项目背景 2. 研究进展 3. 未来规划。



一、项目背景:行业发展现状与项目研发驱动

莲子数据PolarDB 数据库一体机的立项得益于阿里云 PolarDB 开源计划的激励。PolarDB for Posgre SQL版本与莲子数据产品有着非常好的兼容性,保证了数据库一体机的软硬件适配工作得以顺利开展。数据库一体机主要包含三个方面的六大特点,即开放与异构、高效与节能、可信与安全。

1. 开放与异构

随着数据维度的扩张,业务对于算力也提出了更高要求。而随着摩尔定律的放缓,所有类别的处理器想要借助先进制程达到性能提升的技术路线难度也越来越大,但是 AI 自动驾驶和高性能计算对于计算性能的要求却越来越高。由此可见,单一的计算架构已经很难满足如今多元化的需求,而这一方面催生了存算分离的架构,另一方面也推动了异构计算的高速发展。



国内外的企业和研究机构对超域异构计算此类新一代的计算体系均进行了技术与产业布局。国外方面,英特尔和ARM均提出了“XPU”的概念,但侧重点略有不同。Intel 主要利用不同的架构处理不同类型的数据,根据处理速度或者带宽的要求进行优化。ARM则强调了全面计算的理念,对XPU的定义更多侧重于开放的数据融合计算平台,强调了对于数据流的处理、跨域计算以及多元的算力扩展。



NVIDIA 在超域异构计算方面主推的是NVLink 以及基于NVLink的NVSwitch芯片,用于 CPU、GPU 以及 GPU 集群之间的高速通信。

国内方面,阿里云作为国内超域异构计算的代表建设了基于CIPU的计算体系。与国外厂商不同的是,CIPU是一种云原生的全新计算体系架构,CIPU向下云化管理数据中心的硬件,加速了计算、存储和网络资源的调度,向上能够接入飞天云操作系统。相比于其他芯片公司,阿里云在实现 CIPU 与云操作系统的深度融合上具备了先天优势。一方面,它具备对底层基础设施资源的虚拟化管理能力,另一方面能够承载飞天对此类资源的编排和调度需求,并且具备存储、网络、计算、安全等硬件的加速能力。

从异构计算的国内外相关布局可以看出,异构计算的本质是将不同架构的处理芯片整合到一个系统上进行工作,具体实施上包含两个方面的含义。其一是板级的集成方式,将CPU、GPU、FPGA等置于一个板上进行组合;其二是芯片及封装级的集成方式。两个内涵分别涉及到数据总线技术和电子封装技术。



数据总线技术上,PCIe总线经过几十年的发展,已经进入5.0时代,拓展到计算存储加速的方方面面,6.0 已处于推广阶段,7.0标准也正在制定中。CXL 又是基于 PCIe5.0 发展而来的一套服务于高性能计算机和数据中心领域的超高速互联新标准,主要用于 CPU 和加速芯片比如GPU、 FPGA等之间的通信能力,能够显着改善多路 CPU和加速卡之间的通信能力,从而保证更低的延迟和内存一致性。2022 年最新提出的UCIe 互联标准,其目的是解决Chiplet 之间互联的行业标准问题。UCIe、PCIe 与 CXL进行协同,指明了 UCIe在封装内的Chiplet方向和封装外的Off Package 应用方向。

从本质上来说, CXL 基于PCIe发展而来,UCIe的提出也离不开 PCIe 和 CXL 总线的应用铺垫。但是 UCIe 的出现能够统一机柜内互联的物理标准,将 In Package 和 Off Package 统一到整体的框架中,也即一体机硬件研发的架构演进方向。

封装内互联也是 UCIe发挥的另一主场。Chiplet是未来混合异构芯片系统的重要单元,与之相似的另一概念为 system-in-package,即SIP封装。SIP封装是将芯片的最小系统进行系统级的二次封装,除了异构的芯片之外,还包含了一些必要的外设和内存单元,以上均为封装内互联的范畴。



我们的工作主要聚焦于板级和机柜空间数据互联的技术方案,期望打造开放的异构数据交换平台。


2.可信与安全

网络安全的风险源于图灵机原理缺少攻防的理念,这是先天性的不足。并且在设计计算系统时,也无法穷尽所有逻辑组合,必定会存在逻辑不全的缺陷。因此,需要通过安全可信的计算,在实时运算的同时进行免疫的安全防护,使得存在的缺陷不被攻击者所利用,从而达到预期的计算目标。



可信计算是 1999 年由 IBM、Intel 和 Microsoft 等牵头成立的国际 TCPA组织,后改名称为 Trusted Computing Group (TCG) 组织。该组织于 12 年发布了 TPM 2.0 标准,能够兼容中国的加密算法。后续在Intel 的不断推动下,它也成为了欧盟电信运营商设备采购的必要条件。



我国的可信计算从 1992 年开始立项, 06 年发布了可信计算平台的密码技术方案和可信计算密码智能平台功能与接口规范。先后经过了 1.0 阶段和 2.0 阶段,目前已经发展到 3.0 阶段。



与此同时,近五年在立法和规章的角度也进一步增强了对于可信安全计算的强制性要求。因此,我们认为可信计算需要以双模、软硬一体的方式融入到数据服务中,以提高可信度、安全度和隐私度。



3. 高效与节能


对于数据中心而言,能源成本已经占据了数据中心总成本的一半。因此,减少碳排放既是企业的社会责任,也是提高经济效益的手段。数据中心的高质量发展首先要着眼于提升能效,同时还要兼顾可扩展性、可靠性、安全性等方面的问题。因此,它的建设是一个庞大的系统工程。



节能方面,ARM处理器与X86 相比表现出了明显优势,在同等能耗水平下,ARM处理器仍能够提供相当的算力水平,这一点从此前蝉联四次全球冠军的富岳超算系统上也能够得以体现。亚马逊的 Graviton和阿里云的倚天 710 中也能看到基于 ARM 架构实现节能降碳的设计思路。

数据中心作为支撑企业业务的核心资产,其建设成本和运营质量直接关联企业的资金投入产出比。数据中心的绿色节能化趋势不仅仅是有益于社会和环境层面,对于数据中心企业而言也具备重要的意义。绿色节能化意味着数据中心基础设施的建设更加灵活,运营将更少地依赖传统电网,相关 IT 设备的能耗水平更低,自动化和智能化将体现在运营的各个环节。这些趋势都将为企业带来强大的市场竞争力,并且在长期维度上降低企业拥有数据中心的总拥有成本。数据中心的节能解决方案可以分为建设模式节能、制冷系统节能、供配电系统节能、 ICT 的设备节能以及 AI 应用等技术创新。我们的设计主要为设备节能技术路线。



二、研究进展:PolarDB数据库一体机项目详述

莲子数据的数据库一体机采用基于众核架构的ARM CPU ,遵循arm v8指令集,搭配ECC内存能够胜任企业应用级别的稳定性要求,且仅有 5 瓦的功耗,单颗 CPU 能够提供高达 38GFlops/瓦的计算能力,性能功耗比是行业平均水平的 3-8 倍。我们可以利用四颗 CPU 进行平行计算,虽然 4 颗 CPU 只能达到其他产品的一颗 CPU 的算力水平,但仅有 20 瓦功耗,而同类产品达到相同算力可能需要近百瓦的功耗。



在数据互联特性上, CPU 间采用了基于 PCIe 的数据总线,也开发了 Dynamic Data Transmission Over PCIE 的异构互联机制,实现了板级设备的高速数据传输。典型机型中,在不到 2U 的空间中集成了 8 个高密度的计算机节点单元,外加相当于万兆交换机的网机互联模块的高速通讯能力。该配置非常适用于云、边、端一体化计算的工业场景中。

传统的数据交换路径以 CPU 为中心, PCIe 的数据交换和以太网的数据交换互相分离,数据交换存在很多绕路行为。而数据互联方案采用了非 CPU 中心化的数据交换路径, 数据传输路径延迟降低50%,TCP/IP 的延迟降低90%。



在存储外设方面,我们基于 PolarDB 的存算分离架构,采用了SAN存储器来进行数据的分离存储,并且对数据读写的路径和空间均进行了优化,增强了数据校验的机制,同时也优化了缓存策略,以满足 QoS 的需求。此外,也优化了在线全局重删的功能,根据读写频度重新选择重删区域,不影响业务的访问性能,删除重复数据前会进行二次比对,避免数据丢失。通过存储系统内置的数据压缩功能模块,对数据进行压缩处理时前端业务系统无感知。上述配置缓解了存储系统的空间增长问题,降低了成本,也从另一方面降低了存储系统的能耗指标。

在可信安全方面,我们通过两部分构建了可信根和可信软件基。系统通过对应用透明的主动可信监控机制来保障应用的可信运行,不修改原应用,而是通过制定策略进行主动实时防护,对业务的性能影响非常小。



基于以上软硬件布局,我们实现了基于可信计算的数据库设备的主动防护。利用可信芯片实现硬件隔离,将安全保护与宿主系统分离,防止安全机制被旁路。同时利用了 USB、PCIE 等标准化的可信根实现了即插即用。可信根通过可信总线与三节点一体机进行通信,利用可信软件基实现芯片级和内存级的可信度量,硬件层的度量实现真正的免疫高级未知攻击的功能。同时,在可信防护中也采用了轻量级的加密技术,减少了密码的运算开销,降低了性能损耗,能够有效应对野外设备性能受限状况下的加密保护场景。



针对可能存在的篡改,可以通过主机的安全防护实现用户、程序、文件、服务、注册表等的访问控制。针对未知危害,可以通过建立核心程序防护来严禁未知程序的执行,从而实现对于未知程序的主动免疫。



基于以上三方面的能力,我们也进行了 ARM 架构的数据库一体机硬件条件下可信安全 PolarDB 的HTAP性能测试。鉴于 CPU 的平行计算特性,我们在测试中选取了最严苛的条件——每个节点单颗 CPU 在 5 瓦超低的功耗性能下,测试了三节点 PolarDB 的性能,操作系统搭载龙蜥 7.9 ,测试工具使用 Benchmark SQL 5.0 和 dbgen,分别进行了 TPCC 测试和 TPCH测试。



TPCC 测试结果显示,测试过程性能输出较为平稳。对比同一硬件条件下的 PG 单机版, PolarDB 采用了分布式架构,由于一致性问题,其性能略低。虽然绝对数值看似不高,但本系统的功耗和成本远低于其他X86 的同类架构。因此,在常规应用中已经能够满足技术要求,尤其适合在边缘计算等工业或苛刻场景下的应用。



TPCH 测试结果显示,随着跨机并行数的增加,TPCH 性能几乎呈线性提升状态,直到并行数达到 CPU 的核心数。在并行数超过 CPU 的核心数之后,性能会有所下降。但是对比同一硬件条件下的 GTDB,在并行度一致的情况下,两者性能相当。



三、未来规划:围绕PolarDB生态的发展规划

在未来的工作中,莲子数据会紧紧围绕 PolarDB 的生态完善使用体验,同时积极拓展场景应用,充分发挥开放异构、节能高效和可信安全的特性。结合 5G 云边端协同的趋势,充分发挥人工智能和专家系统的优势,建立基于 AI 的数据观测机制和系统诊断机制,为专网场景和工业现场等相关需求而努力。



借助阿里云的开放平台,我们希望能够和同行携手共建开放合作的 PolarDB 大生态。感谢诸多合作伙伴为项目的持续优化作出的努力,同时也希望感兴趣的同行能够参与其中共同进步。

相关实践学习
使用PolarDB和ECS搭建门户网站
本场景主要介绍如何基于PolarDB和ECS实现搭建门户网站。
阿里云数据库产品家族及特性
阿里云智能数据库产品团队一直致力于不断健全产品体系,提升产品性能,打磨产品功能,从而帮助客户实现更加极致的弹性能力、具备更强的扩展能力、并利用云设施进一步降低企业成本。以云原生+分布式为核心技术抓手,打造以自研的在线事务型(OLTP)数据库Polar DB和在线分析型(OLAP)数据库Analytic DB为代表的新一代企业级云原生数据库产品体系, 结合NoSQL数据库、数据库生态工具、云原生智能化数据库管控平台,为阿里巴巴经济体以及各个行业的企业客户和开发者提供从公共云到混合云再到私有云的完整解决方案,提供基于云基础设施进行数据从处理、到存储、再到计算与分析的一体化解决方案。本节课带你了解阿里云数据库产品家族及特性。
相关文章
|
3月前
|
SQL 关系型数据库 MySQL
开源新发布|PolarDB-X v2.4.2开源生态适配升级
PolarDB-X v2.4.2开源发布,重点完善生态能力:新增客户端驱动、开源polardbx-proxy组件,支持读写分离与高可用;强化DDL变更、扩缩容等运维能力,并兼容MySQL主备复制及MCP AI生态。
开源新发布|PolarDB-X v2.4.2开源生态适配升级
|
3月前
|
SQL 关系型数据库 MySQL
开源新发布|PolarDB-X v2.4.2开源生态适配升级
PolarDB-X v2.4.2发布,新增开源Proxy组件与客户端驱动,支持读写分离、无感高可用切换及DDL在线变更,兼容MySQL生态,提升千亿级大表运维稳定性。
886 24
开源新发布|PolarDB-X v2.4.2开源生态适配升级
|
6月前
|
存储 关系型数据库 分布式数据库
喜报|阿里云PolarDB数据库(分布式版)荣获国内首台(套)产品奖项
阿里云PolarDB数据库管理软件(分布式版)荣获「2024年度国内首版次软件」称号,并跻身《2024年度浙江省首台(套)推广应用典型案例》。
|
4月前
|
Java 关系型数据库 数据库
怎么保障数据库在凭据变更过程中的安全与稳定?
本文介绍了在Spring应用中实现RDS数据源账密运行时轮转的方案,通过集成KMS与Nacos,实现数据库凭据的加密托管、动态更新与无缝切换,保障应用在凭据变更过程中的安全与稳定。适用于使用Java语言开发的Spring Boot或Spring Cloud应用,支持多种数据库类型,如MySQL、SQL Server、PostgreSQL等。
|
4月前
|
Cloud Native 关系型数据库 MySQL
免费体验!高效实现自建 MySQL 数据库平滑迁移至 PolarDB-X
PolarDB-X 是阿里云推出的云原生分布式数据库,支持PB级存储扩展、高并发访问与数据强一致,助力企业实现MySQL平滑迁移。现已开放免费体验,点击即享高效、稳定的数据库升级方案。
免费体验!高效实现自建 MySQL 数据库平滑迁移至 PolarDB-X
|
4月前
|
关系型数据库 MySQL 分布式数据库
阿里云PolarDB云原生数据库收费价格:MySQL和PostgreSQL详细介绍
阿里云PolarDB兼容MySQL、PostgreSQL及Oracle语法,支持集中式与分布式架构。标准版2核4G年费1116元起,企业版最高性能达4核16G,支持HTAP与多级高可用,广泛应用于金融、政务、互联网等领域,TCO成本降低50%。
|
4月前
|
安全 关系型数据库 数据管理
阿里云数据库:构建高性能与安全的数据管理系统
阿里云数据库提供RDS、PolarDB、Tair等核心产品,具备高可用、弹性扩展、安全合规及智能运维等技术优势,广泛应用于电商、游戏、金融等行业,助力企业高效管理数据,提升业务连续性与竞争力。
|
5月前
|
人工智能 关系型数据库 MySQL
开源PolarDB-X:单节点误删除binlog恢复
本文由邵亚鹏撰写,分享了在使用开源PolarDB-X过程中,因误删binlog导致数据库服务无法启动的问题及恢复过程。作者结合实践经验,详细介绍了在无备份情况下如何通过单节点恢复机制重启数据库,并提出了避免类似问题的几点建议,包括采用高可用部署、定期备份及升级至最新版本等。
|
4月前
|
安全 关系型数据库 MySQL
MySQL安全最佳实践:保护你的数据库
本文深入探讨了MySQL数据库的安全防护体系,涵盖认证安全、访问控制、网络安全、数据加密、审计监控、备份恢复、操作系统安全、应急响应等多个方面。通过具体配置示例,为企业提供了一套全面的安全实践方案,帮助强化数据库安全,防止数据泄露和未授权访问,保障企业数据资产安全。
|
6月前
|
SQL 人工智能 安全
深度复盘MCP安全风暴:一个工单如何演变成数据库“特洛伊木马”危机?
近期,安全公司 General Analysis 披露的MCP安全漏洞在技术圈引发了巨大震动。这个"特洛伊木马"式的安全漏洞暴露了一个现实:AI时代,传统的数据库访问方式已经无法满足安全需求。阿里云数据管理DMS新推出的DMS MCP Server,正是为AI时代的数据库安全访问而生,它不仅完美解决了传统MCP的安全隐患,更为企业提供了一个安全、智能、高效的数据访问新范式。
563 5

相关产品

  • 云原生数据库 PolarDB