我们知道,当前随着企业业务的数字化与全球化拓展,数据呈指数级增长。IDC预测显示,到2025年全球数据总量将达到175ZB。爆炸式的数据增长哺育了数字技术的发展和应用,但同时也对数据的智能管理提出了更高的要求。一个例子,卫健委在2017年4月1日起实施的《电子病历应用管理规范》第19条中,有一个明确的规定:“门/急诊电子病历由医疗机构保管的,保存时间自患者最后一次就诊之日起不少于15年。住院病历保存时间,自患者最后一次出院之日起不少于30年。”我们知道,患者的数据是患者个人隐私,也关乎国家安全。从这一角度,数据的管理和存储就显得尤为重要,而近日联想凌拓发布全自研联想ThinkSystem DXN V2.0企业级分布式软件定义存储系统,具有重要意义。
流动数据改变行业应用模式
“今年是国家十四五规划的第二个年头。在国家的’十四五’规划中,’数字经济’成为一个非常重要的组成部分。”联想凌拓产品管理与营销高级总监林佑声解释说,“在当前多种资源形式共同发展的时代,数据流动要变得越来越重要。只有数据可以实现跨资源平台自由流动,才能让用户利用自有的数据中心、托管的数据中心,以及云端的多种资源模式构建出一个合理的资源组织架构。”换句话说,数据流动意味着数据管理要具备跨资源平台传输与处理的能力,这也是我们经常说的“实现资源和成本的合理配比,提高投入产出比、为业务发展注入原动力”。还是回到医疗数据的实际案例。我们知道医院里面有很多大家熟知的医学检查、检验设备,比如X光、CT、核磁、超声、显微镜等等。这些设备被统称为“医学影像设备”。医学影像设备为提高医生诊疗效率提供了非常大的帮助。管理这些医学影像设备的信息系统称为PACS系统。PACS系统的主要任务就是把医学影像设备产生的影像数据通过各种接口以数字化的方式存储和使用。“PACS系统和HIS系统一样,是医院的核心业务系统。而医学影像检查的数据,又是PACS业务的核心。”联想凌拓医疗行业解决方案架构师娄辛研介绍说,“PACS影像存储的首要要求是高可靠性和大容量,其次是高性能。PACS影像数据以小文件为主,从几十KB到几百KB都有。患者做完一次检查后,医院通常要求在1-4小时左右出具检查报告,这就需要PACS存储必须能够支撑多个医学影像检查设备、多台终端设备并发的小文件写入、读取要求。”
我们知道,对于存储系统而言,小文件、高并发的读取写入,是一项非常严苛的技术考验,甚至没有办法通过单纯的硬件堆砌来满足。当前主流的存储访问协议中,能够同时满足PACS影像数据高性能、大容量、海量数据管理需求的,只有NAS存储协议。
创新数据管理突破行业发展瓶颈
我们知道,医院的信息化建设有两大特点:一是复杂性,二是海量数据。医院信息系统通常有上百个子系统,这些子系统之间有着千丝万缕的联系,复杂度之高行业罕见。此外,医院信息化系统生成的数据类型非常多,而且数据量巨大——高可靠性、高性能,是影像科和信息科对于PACS的共性需求;而数据高效流动、存储大容量、IT基础架构简便易运维,是业务科室和管理科室的个性化需求。在娄辛研看来,PACS影像存储的可靠性,可以分为“数据可靠性保障”和“系统可靠性保障”两个层面。分布式存储的数据保护,主要有“副本”、“纠删码”两种技术。“副本”保护技术是把一份数据同时保存为几份相同的数据副本,缺点是存储空间利用率低;而“纠删码”数据保护技术的优点,是存储容量利用率高。比如DXN V2.0使用16+1的纠删码配置的时候,能够实现高达94%的可用容量。当然,如此高可用容量的前提,是至少配置17个DXN存储节点。对于多数在起步阶段数据量不是很大的医院PACS系统来说,也可以在可靠性保障基础上寻求与成本之间的平衡。
“ThinkSystem DXN V2.0分布式存储最小3个节点起配,就能够提供同时任意故障2块硬盘或者任意故障1个存储节点数据不丢失、业务不中断的数据可靠性保障,相当于其它存储系统至少配置6个以上存储节点的可靠性。”娄辛研解释说,在性能方面,ThinkSystem DXN V2.0采用先进的元数据管理架构,真正做到读写性能伴随节点数量增加线性提升,提供包括小文件智能缓存预取、QoS服务质量控制、配额、更强洞见更易使用的智能UI等功能提升用户体验,助力客户实现更高的业务效率。 据介绍,DXN V2.0一套集群提供CIFS、NFS、FTP、S3、OpenStack、Kubernetes CSI等多协议及生态支持,容纳百亿文件规模,支持软硬解耦,帮助客户更加轻松地管理数据;通过事前主动防御(存储亚健康检测)、事中自动处理(副本、EC自动重构)、事后快速兜底(基于嵌套式快照的多层级灵活数据恢复)的闭环数据保护架构,为客户提供数据安全保障。换句话说,DXN V2.0扩展性更强、更加稳定可靠、存储管理效率更高。
自研创新应对行业发展变化
据悉,联想凌拓专门为医院PACS系统设计了统一存储平台的架构拓扑,在逻辑上被划分为“生产站点“、”灾备站点”和“科研站点”三个部分。不仅如此,这一架构拓扑也完全适用于医院的HIS系统、虚拟化系统的统一数据管理解决方案。这也意味着医院完全可以将这两套核心业务系统整合在一套基础架构平台里面。实际上,除了医疗行业,DXN V2.0还专门针对自动驾驶、制造业、视频监控等各种不同行业推出了相应的解决方案。“联想凌拓的研发团队精益求精,把元数据管理打造成了基于建制模型的元数据训练数据库。”联想凌拓资深产品营销经理吴静解释说,“元数据训练数据库本身位于SSD上,它是通过访问元数据查找数据碎片所在的位置,而不仅仅是把复杂目录切成小目录。通过这种建制模型根制的方式以扁平的方式迅速查找文件位置,无视目录本身结构的复杂性,然后提供三倍的数据读写效率,所以它在针对自动驾驶的元数据处理能力上是非常强悍的。”而在制造业领域,DXN2000 G2支持84盘位大容量的JBOD扩展柜,可以满足用户在小规模集群同样提供大容量。针对视频监控场景,DXN V2.0的解决方案满足视频存储“写”多于“读”,存储集群能够支持一千个以上的摄像头,提供NFS服务,用户访问数据通常要既有NFS服务也要有FTP服务,卡口则主要是通过高速卡口相机拍照,用于捕捉违章行为的需求。
很明显,从上述案例中体现了联想凌拓对行业市场的深入了解。林佑声解释说,基于中国经济发展的大趋势,传统的数据管理技术不得不持续面对新形态的强力挑战,因此联想凌拓在2019年创立之初就建立了一个本地的研发团队,依托两家专业母公司联想和NetApp的技术底蕴,对于数据存储管理进行了本地化全自研的技术创新。
据了解,联想凌拓如今已经获得了研发领域里的桂冠CMMI5级认证,还顺利通过了一系列ISO认证,表明了联想凌拓的实力。应该说,联想凌拓以国内各行业客户数据管理实际需求为中心,推出的全自研联想ThinkSystem DXN V2.0实现了包括协议支持、性能加速、扩展能力、数据保护等方面的充分提升,为各行业客户的典型需求提供精准支持,是一款真正帮助本土客户应对现有挑战,利用平台优势降本增效的具有国际水准的本地化企业级分布式软件定义存储系统。