医疗大数据安全——基于区块链的委托量子云架构(一)

本文涉及的产品
数据安全中心,免费版
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 智能医疗系统解决了分子可视化、DNA分析和治疗确定等复杂计算问题。这些被认为是当今超级计算机仍然面临的复杂问题。另一方面,量子计算承诺快速、高效和可扩展的计算资源,足以在指数时间内计算大规模和复杂的操作。量子计算将充分创新计算的视角,这是一个事实。然而,它还不是一个可行的解决方案,因为它可能是罕见的和昂贵的生产。本文介绍了量子云即服务,为复杂的智能医疗计算提供高效、可伸缩和安全的解决方案。我们的创新之处在于量子终端机(QTM)和区块链技术的使用,以提高提出的架构的可行性和安全性。实验结果证明了该体系结构的可行性和所实现的Q-OTP封装的绝对安全性

目录


  • 导论
  • 相关研究
  • 研讨会贡献
  • 关键贡献
  • 系统模型
  • Pre-initialization phases
  • 量子计算机终端
  • 初始化阶段
  • QMT和QCS之间的安全通信
  • 云委托的量子计算
  • X和Z门协议的实现
  • 评估与安全分析
  • 性能评估
  • 安全性分析
  • 结论


正文


导论


可扩展的智能医疗系统需要安全的数据收集、高效快速的数据处理和系统的知识提取(Demirkan, 2013)。这些应用通常是计算复杂的,并需要广泛和强大的计算资源。例如,使用当今的超级计算机,RNA测序需要至少1.5到12天甚至更多的计算时间(Kukurba和Montgomery, 2015)。此外,仅在美国,由传感器和健康记录生成的医疗数据就达到了1024G(transformation health, 2013年)。医疗保健大数据包括大型而复杂的电子健康记录(EHR),如放射图像、注释、免疫日期、药物、治疗计划、实验室数据和测试结果。除EHR外,医学数据的计算还包括DNA计算、分子可视化、治疗发现等。大医疗数据的复杂性在于其数量、多样性和计算和管理的速度(Frost &sullivan: Drownin)。医疗数据的数量和种类为未经指示的记录创建了一个复杂的指数搜索问题。然而,管理这些类型的数据所需的长计算时间导致了改进的关键限制,在一些情况下可能是致命的(Javed等,2020;Singh, Azzaoui, Kim, Pan, Park等,2020年;Chen et al., 2020;Alshammari等,2020年)。此外,医疗大数据的安全性和私密性是另一个迫切需要快速管理的问题。由第三方供应商造成的最严重的医疗保健数据泄露发生在2019年(Healthsecurity and Lates,2020)。


从另一个角度看,量子信息科学是下一个有前途的计算和数据处理领域。从本质上讲,全通计算融合了经典信息理论和量子物理定理(Abrams and Lloyd, 1997;EL Azzaoui, 2020)。Quan- tum计算机利用基本粒子的量子力学状态,特别是被称为自旋的内部角动量,来创造量子比特(Qubits)。根据量子物理定律,一个量子位持有两个值;1表示自旋向上,0表示自旋向下。因此,拥有n个量子位的量子计算机能够同步执行2n次计算,从而实现指数计算速度。


量子计算机可以有效地对无指示数据执行可扩展的复杂计算和搜索算法,提高智能医疗系统提供的服务质量,从而提高大医疗数据的可用性,是一个有前途的解决方案。然而,就像早期的经典计算机,量子计算机是稀缺的,可能是昂贵的。为此,本文提出了一种基于区块链的委托量子云架构,用于医疗大数据的处理和安全。区块链用于安全目的,选择和认证云中可以参与、共享和使用量子服务的节点。此外,量子服务器托管在云端,用于安全存储和处理医疗相关的大数据,量子终端机被用作经典用户和云端量子服务器之间安全且经济的中间体。


我们提出了一种基于区块链的委托量子云架构——用于安全的医疗数据处理。我们提出的架构分为三个阶段:区块链集群生成阶段、量子终端机阶段和量子云即服务阶段。区块链作为一种分布式技术,在量子终端机(Quantum Terminal Machine)的边缘层,实现了智能医院、医学研究机构、智能医疗提供商等经典用户之间的安全通信。这个阶段生成安全的经过身份验证的集群,这些集群可以访问量子云并从量子云的计算能力中获益。量子终端机器,被称为量子图像,被用作经典云服务器和量子云服务器之间的安全介质。它的主要作用是将经典位元转换为量子位元,并将量子云接收到的结果编译为用户破译的经典位元。利用委托量子云概念,在云层安全地计算病人敏感数据,同时保护信息保密(输入和输出)和计算


我们提议的研究论文的其余部分组织如下;第二部分介绍了简要的背景研究,包括相关的工作和拟议的建筑考虑。第三部分包括主要思想概述以及接下来的阶段,在建议的体系结构。第四部分讨论了安全性分析和性能评估。同时,第五部分对开放式研究面临的挑战进行了详细的论述。最后,我们在第六部分结束了这项工作。


相关研究


医疗数据的复杂性促使人们使用更强大的计算资源来达到所需的服务质量(QoS)和体验质量(QoE)。云端的量子计算机理论上能够提供快速、高效的大医疗数据计算和分析。在接下来的文章中,我们将讨论量子云即服务的一些主要思想和协议。


研讨会贡献


Singh等人(Singh和Sachdev, 2014)讨论了部署量子云即服务的可能优势。他们的论文提出了量子技术与云服务集成的全面分析。作者指出,量子云即服务技术的基本好处是消除了可能使用量子云的基于量子的加密的安全困境。然而,本文并没有提供任何一致的案例研究或分析来支持所提出的观点。另一方面,Xin等人(2018)在核磁共振量子计算机上描述了量子云的概念。提议的服务类似于IBM的量子云体验,在那里他们部署了核磁共振来实现计算任务。尽管如此,通过随机基准测试,它们只能提供至多2量子位保真度。Gong等人(2021)在可信的量子云服务器上提出了K-means算法的高级用法,该算法广泛用于解决集群问题。k-means算法执行核心子例程SwapTest和GroverOptim,同时减少了客户端的负载。然而,他们的建议要求常规客户拥有一台小型的Quantum机器,以便在云层与量子服务器通信。表1总结了上述讨论的相关工作,并与我们的方案进行了比较。


5e7f2751364803d122b960727b2bb537_watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBAQ2hhaG90,size_20,color_FFFFFF,t_70,g_se,x_16.png


这些先进的论文介绍了量子服务器在云层的用途,并讨论了它如何在指数水平上提高计算效率,通过使用不同的算法,如Grover搜索算法、K-means算法等来测试它。然而,这些作品的局限性是类似的;用户或客户都需要有一个量子机器来交付结构作为量子位,并编译结果回来。这种技术被称为量子互联网,它在两台量子机器之间建立通信,一台在客户端级别,另一台在云级别(更强大的服务器)。基于量子互联网的通信无疑是一种非常安全的传输数据和计算指令的手段,但由于成本要求和纠缠复杂性等多种原因,它是不可行的(Kim等人,2021年)。因此,本文利用区块链技术、量子终端机和一种介质,提出了一种可实现的、经济的、可扩展的、安全的、高效的解决方案


关键贡献


该架构的主要考虑因素如下:


  • 可扩展性:智能医疗系统结合了先进的物联网设备、传感器和大型复杂数据,包括放射图像和病史。该应用程序的最终目标是提高患者的生活质量和服务质量。随着越来越多的应用、传感器和患者的加入,医疗大数据正在迅速增长。因此,创建可伸缩的基础设施,使医疗保健提供商能够维护其快速增长的组件的需求,而量子云作为服务可以确保这种可伸缩性。


  • 效率:计算效率是大医疗数据的另一个关键需求。然而,随着现有的、快速增长的大规模应用的出现,由于需求和需求高于现有的传统服务和系统,效率并不总是能得到保证。因此,需要一个快速高效的计算系统来平衡医疗数据处理的可扩展性和效率,从而提高患者的QoS。


  • 安全和隐私:智能医疗系统旨在收集大量数据,特别是实时获取的数据和信息。用户的私人信息,如ID、姓名、位置、健康状况等,黑客可能有意或无意地缺乏这些信息。因此,保护这些数据是一个关键的要求。这个问题的解决办法是只允许预先验证过的用户访问。保密性:大医疗数据的主要挑战是信息的安全性和隐私性。敏感数据容易受到第三方的攻击,可能导致数据被未经授权的个人操纵、丢失或暴露。此外,智能医疗系统更容易受到安全攻击和数据泄露,因为它们持有用户的敏感信息。


  • 完整性:任何未经授权方对数据的操作或修改是智能城市环境中的另一个关键问题。攻击者可能使用恶意软件或伪装攻击来删除数据。


  • 可用性:在智能医疗环境中,由于其敏感性质,数据应由经授权的个人和各方在需要时访问。确保数据可用性对智能医疗系统的功能至关重要,因为它主要依赖于数据采集。


系统模型


为了在云层面保障医疗数据的安全,利用量子技术提高计算效率,解决在用户层面使用量子机的成本和可行性困境,本文提出了一种新的解决方案。我们提出的体系结构可分为三层:1)医疗设备层,2)边缘层,3)云层。该体系结构的概述如图1所示。

c7fa23b9f344132d5b2fd4efd6f18357_watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBAQ2hhaG90,size_20,color_FFFFFF,t_70,g_se,x_16.png


该体系结构由三层组成,旨在利用委托量子计算和区块链技术创建可行、安全、可扩展的医疗大数据处理。


  • 设备层:我们提出的体系结构的第一层是设备副层;它损害了由受信任的医疗保健服务提供商(如医院)收集的智能医疗保健数据。这些数据可以直接从医疗物联网设备和可穿戴传感器中获取的患者的医疗记录,或患者的药物、疾病、分析、放射史等医院记录。这些数据被称为电子医疗记录(Electronic Healthcare Records),由于其性质,这些数据很容易理解,对于为每一位患者创建有针对性和个性化的治疗至关重要;因此,它需要更高的安全性度量。此外,复杂的医疗数据包括DNA测序、药物分子可视化、治疗发现等数据也在这一层收集。这些数据对于使用当今速度更快的超级计算机来计算是至关重要和具有挑战性的,它们直接有助于更好地治疗和理解每个病人的病例;因此,他们迫切需要快速、可伸缩和高效的数据处理。


  • 边缘层:提议的体系结构中的第二层是边缘层。这一层是我们提案的主要贡献。区块链技术驻留在这一层,创建一个由诚实节点组成的安全集群,这些节点有权访问量子云并从其服务中受益。此外,量子机终端,即权通图像,也包括在这一层,以方便经典用户和量子云之间的通信。


  • 云层:建议中的最后一层是量子服务器所在的云层。云端的量子服务器执行来自客户端的各种请求计算,例如DNA测序、药物发现,或者在不知道输入信息的情况下搜索未经指示的和变体的数据库。因此,在量子云服务器上提供了委托计算的名称。与任何经典计算机相比,所请求的分析以指数级的速度、可伸缩性和效率执行,更安全,因为客户端和量子服务器在云上的通信通道是通过区块链技术验证和验证的。此外,计算是盲目进行的,这将确保信息和计算。为了实现和模拟这个提议的架构,我们考虑了这样一种情况:云中的每个服务提供商都有自己的嵌入式量子服务;在智能医疗保健场景中,服务提供商控制一个基于量子的专门用于医疗保健服务的云。


该架构的主要设计可以分为三个基本步骤;首先,进行基于区块链的集群选择的预初始化阶段。为了防止恶意节点和智能医疗系统组件(如假医院)访问量子网络的服务,使用区块链对请求提供服务的每个节点进行验证和验证。二是量子机终端的基本初始化阶段;量子机器终端(QMT)是经典设备和量子服务器之间的媒介。QMT是一个至少有1个量子位的小型量子机器,它帮助将经典比特编译成量子服务器可读的量子位,反之亦然。最后,在云层的量子云计算阶段。量子云计算(QCC)是在量子服务器上运行的一套操作和功能,用于医疗广泛的数据安全和处理,如委托量子计算(DQC)和Grover的搜索算法。在下面的小节中,我们将详细描述这些阶段


Pre-initialization phases


由于量子云所保证的计算能力,并不是每一个智能医疗系统的客户都有权访问和使用它。只有预先验证和认证的节点,如诚实的医院和国家卫生提供商,才能请求使用量子云服务,因此,只有相同的认证设备能够接收从量子云返回的计算结果并解密它们。区块链是一种分布式的、安全的、加密保证的、既非伪造也非修改的分布式账本技术可以作为一种验证和认证节点的手段。在这种情况下,我们提出了一种基于区块链的聚类选择;所使用的共识算法是著名的实用拜占庭容错算法的改进版本。一个联合体区块链是考虑周到的,其中验证和验证请求的节点都是预先选定的节点。算法1描述了所需的步骤。

63fd43a5d35fdc62e6a46b29ad2c9da7_watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBAQ2hhaG90,size_20,color_FFFFFF,t_70,g_se,x_16.png

7560f2475d364a768483d2f8414554d7_watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBAQ2hhaG90,size_20,color_FFFFFF,t_70,g_se,x_16.png

诚实客户的选择可以解释为:当客户(医疗保健提供商、医院)希望从量子云服务中获益时,它必须首先向检查机构(CA)发送请求。在该算法中,CA可以是管理其他客户端的政府医疗机构;在该算法中,CA被指定为根的角色。CA验证客户端的身份;如果它是准确的,CA成为分配的CL0根,并开始广播消息。收到CL0报文的对等体继续守护该报文,并计算其内存中的报文数量。当消息数达到f+1轮时,广播提交状态,并将标记结果发送到CL0。该算法中部署了函数标记,用于最后阶段检查。参与的同伴继续发送结果到CL0,直到它达到2f+1。使用标记函数,可以比较CL0和CLk的结果。如果结果一致,客户被认为是一个诚实的客户;如果没有,请求是被遗漏的。


基于区块链的集群选择确保了只有诚实的客户端才能成为系统的一部分,从而提供了智能医疗客户所需的保护。因此,只有诚实且经过验证的客户才能使用该系统。然而,这并不是区块链在我们系统中的唯一角色。在对诚实节点进行验证和验证后,区块链将在边缘层保护被验证的健康服务提供商和量子机终端之间的通信。这个额外的阶段加强了私有数据和计算请求的安全性,并确保量子机终端对输入和输出是盲目的

3861c5b6ef69fc99bd8f8f8284207ccd_watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBAQ2hhaG90,size_20,color_FFFFFF,t_70,g_se,x_16.png

使用算法2,我们使用区块链加密从医疗保健客户端发送到边缘层QMT的所有消息,并使用曲线25519 Diffie-Hellman密码密钥(CDHCK)加密私有客户端密钥。使用新生成的加密私钥对打算使用NaCl Crypto Box算法发送的消息进行加密。NaCl盒是一种新型的用于网络通信的高速库.它用于加密、签名和解密消息。我们在我们的框架中部署了这个算法,因为它易于使用和高速性能。医疗保健客户端发送的消息和计算请求包括敏感信息,如患者姓名、病史甚至DNA信息。所有这些数据都需要在量子服务器上进行繁重的计算。在我们提出的框架中,我们在边缘层使用量子机器终端(QTM)作为医疗保健客户端和云中的量子服务器之间通信的手段。并且,与其他相关工作不同的是,我们使用区块链技术考虑了客户端与边缘节点之间通信的安全性。因此,QMT是完全盲的,不知道医疗保健客户端发送的数据或计算请求。QMT的作用是将客户端发送的消息和请求从经典比特转换为量子服务器的可读量子位。下面的部分将详细部署这个步骤。

目录
相关文章
|
13天前
|
大数据
【赵渝强老师】大数据主从架构的单点故障
大数据体系架构中,核心组件采用主从架构,存在单点故障问题。为提高系统可用性,需实现高可用(HA)架构,通常借助ZooKeeper来实现。ZooKeeper提供配置维护、分布式同步等功能,确保集群稳定运行。下图展示了基于ZooKeeper的HDFS HA架构。
|
1月前
|
SQL 存储 分布式计算
ODPS技术架构深度剖析与实战指南——从零开始掌握阿里巴巴大数据处理平台的核心要义与应用技巧
【10月更文挑战第9天】ODPS是阿里巴巴推出的大数据处理平台,支持海量数据的存储与计算,适用于数据仓库、数据挖掘等场景。其核心组件涵盖数据存储、计算引擎、任务调度、资源管理和用户界面,确保数据处理的稳定、安全与高效。通过创建项目、上传数据、编写SQL或MapReduce程序,用户可轻松完成复杂的数据处理任务。示例展示了如何使用ODPS SQL查询每个用户的最早登录时间。
95 1
|
1月前
|
存储 分布式计算 大数据
大数据-169 Elasticsearch 索引使用 与 架构概念 增删改查
大数据-169 Elasticsearch 索引使用 与 架构概念 增删改查
59 3
|
14天前
|
SQL 数据采集 分布式计算
【赵渝强老师】基于大数据组件的平台架构
本文介绍了大数据平台的总体架构及各层的功能。大数据平台架构分为五层:数据源层、数据采集层、大数据平台层、数据仓库层和应用层。其中,大数据平台层为核心,负责数据的存储和计算,支持离线和实时数据处理。数据仓库层则基于大数据平台构建数据模型,应用层则利用这些模型实现具体的应用场景。文中还提供了Lambda和Kappa架构的视频讲解。
【赵渝强老师】基于大数据组件的平台架构
|
23天前
|
存储 安全 大数据
大数据隐私保护:用户数据的安全之道
【10月更文挑战第31天】在大数据时代,数据的价值日益凸显,但用户隐私保护问题也愈发严峻。本文探讨了大数据隐私保护的重要性、面临的挑战及有效解决方案,旨在为企业和社会提供用户数据安全的指导。通过加强透明度、采用加密技术、实施数据最小化原则、加强访问控制、采用隐私保护技术和提升用户意识,共同推动大数据隐私保护的发展。
|
1月前
|
SQL 存储 分布式计算
大数据-157 Apache Kylin 背景 历程 特点 场景 架构 组件 详解
大数据-157 Apache Kylin 背景 历程 特点 场景 架构 组件 详解
31 9
|
16天前
|
存储 安全 大数据
|
1月前
|
存储 SQL 分布式计算
湖仓一体架构深度解析:构建企业级数据管理与分析的新基石
【10月更文挑战第7天】湖仓一体架构深度解析:构建企业级数据管理与分析的新基石
90 1
|
1月前
|
存储 分布式计算 druid
大数据-155 Apache Druid 架构与原理详解 数据存储 索引服务 压缩机制
大数据-155 Apache Druid 架构与原理详解 数据存储 索引服务 压缩机制
54 3
|
1月前
|
存储 SQL 缓存
Apache Doris 3.0 里程碑版本|存算分离架构升级、湖仓一体再进化
从 3.0 系列版本开始,Apache Doris 开始支持存算分离模式,用户可以在集群部署时选择采用存算一体模式或存算分离模式。基于云原生存算分离的架构,用户可以通过多计算集群实现查询负载间的物理隔离以及读写负载隔离,并借助对象存储或 HDFS 等低成本的共享存储系统来大幅降低存储成本。
Apache Doris 3.0 里程碑版本|存算分离架构升级、湖仓一体再进化
下一篇
无影云桌面