阿里云SDDP(敏感数据保护)测试调研

本文涉及的产品
对象存储 OSS,20GB 3个月
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
简介: 海量数据的使用正在为企业创造越来越多的价值,与此同时,数据也正成为企业的核心资产;如何在对数据高效使用的同时,确保数据的安全,尤其是敏感数据的安全,是一个重要的安全课题,也是很多企业的核心诉求。本次对阿里云SDDP(敏感数据保护)产品进行了测试调研。

海量数据的使用正在为企业创造越来越多的价值,与此同时,数据也正成为企业的核心资产;如何在对数据高效使用的同时,确保数据的安全,尤其是敏感数据的安全,是一个重要的安全课题,也是很多企业的核心诉求。本次对阿里云SDDP(敏感数据保护)产品进行了测试调研。

一.主要功能
测试过程中,了解到SDDP实现的功能主要包括:

1.敏感数据识别:基于敏感数据识别规则,对使用阿里云产品服务中产生的数据进行分析,识别出其中的敏感数据和对应的风险等级。

2.异常事件告警:从权限开放,数据流转和操作等方面对潜在的异常事件告警。

3.数据脱敏:敏感数据从高安全级别区域/系统进入低安全级别区域/系统使用前,进行静态脱敏。

4.其他增强特性:如API等。

二.功能体验
当前SDDP主要支持OSS,RDS,MaxCompute这三款阿里云产品,在使用该产品之前,首先需要对相应的产品资源进行连接授权,确保SDDP对这些资源有足够的权限进行操作。

1.连接授权
以下是三种资源连接授权界面的截图,整个过程还是比较简单的,选择需要授权的资源,并填入必要的连接信息(如RDS的用户名/密码)即可。
_2019_07_29_14_07_25
_2019_07_29_14_08_03
_2019_07_29_14_13_15
连接授权信息填入完毕后,SDDP会尝试使用该授权信息访问对应的资源,如果没有问题,检测状态会变为通过,后续就可以正常使用SDDP的各项功能,连接授权整个配置过程还是比较简单的。
_2019_07_29_14_18_26

2.敏感数据识别
2.1规则相关配置
敏感数据的识别需要基于一系列既定的规则,从实际使用过程中了解到,SDDP默认已经内置了一系列常见的敏感数据的识别规则,如身份证,手机号,银行卡等个人敏感信息的识别,以及在应用开发部署和安全场景中会经常接触到的AccessKeyId,AccessKeySecret,key私钥等敏感信息。

敏感识别规则页面可以看到SDDP默认内置了三十多项常见的敏感数据识别规则。以下是敏感识别规则页面的部分截图,可以看到,内置的规则覆盖了一些较为典型的敏感数据信息,并且默认定义好了该类信息对应的风险等级;例如身份证和手机号风险被定义为S3,银行卡为S4;AccessKeyId被定义为S3,而AccessKeySecret和Key私钥等则被定义为S4,个人认为默认的风险等级定义还是比较合理的。
_2019_07_26_10_54_23
_2019_07_26_11_17_34
值得一提的是,发现默认规则还集成了对身份证图片,护照图片等图片信息的敏感信息识别,推测可能使用了OCR之类的图像识别技术?这一点还是很不错的,毕竟现在的确有很多敏感信息是通过图片的方式进行存储,常见的直接基于文本字符串的识别规则,并不能覆盖这一部分。
_2019_07_26_11_09_30
敏感识别规则这一部分,除了产品自带的一系列规则外,也支持自定义规则的配置,可以看到支持关键字以及正则表达式匹配的模式,并且能对自定义的规则设置风险等级。

_2019_07_26_11_35_25
不过,关于自定义规则,发现有一些不方便的是,自定义的规则无法修改,如果因为规则编写的原因需要修改时,只能将原策略删除,重新添加。
_2019_07_26_11_42_13
其实建议这个自定义规则,可以和内置规则保持一些差异,自定义规则可以允许用户编辑,因为在添加规则中,特别是正则表达式类型,由于编写的准确性,是很有可能需要修改的。

2.2识别结果展示
因本次测试未添加MaxCompute资源,以下是OSS及RDS敏感数据识别页面的展示效果:
_2019_07_29_12_01_42
_2019_07_29_12_02_10
_2019_07_29_16_14_34
_2019_07_29_16_14_59
从展示效果来看,还是不错的;如果点击上图中具体的资源,例如OSS的某个bucket或者RDS的某个库,会显示出具体的哪个对象包含敏感信息,以及对应的风险等级:
_2019_07_29_16_24_30
在这里需要注意的是,当前的展示效果不能对数据进行隐藏,例如只显示某一级别,或者某个级别以上的对象,担心如果加入的资源较多时,展示效果可能会比较混乱,难以找到关键的风险信息;在使用中就发现,例如我需要查找某个包含了S3级别风险的RDS字段时,因为该库中的表和字段较多,需要翻页,在多个S2中找到一个S3,比较困难。这应该是可以改进的地方。

3.异常事件告警和处置
SDDP能基于对OSS/RDS/MaxCompute等场景异常的定义,产生异常告警事件。当前的异常场景和事件规则定义以下:
_2019_07_29_19_12_03
_2019_07_29_19_12_18

可以看到,规则的丰富度尚可,但是不支持对规则的编辑,或者针对用户场景的自定义规则,定制化略有不足。
在“异常事件处理”的标签页下,可以看到基于当前异常事件规则所产生的一些告警事件:
_2019_07_30_11_07_30
点击查看详情,可以看到该异常事件的细节;另外,在处理页面,能对该异常事件的跟进调查进行简单记录,并确认是否误报还是的确违规。

_2019_07_30_11_12_45
_2019_07_30_13_46_26

4.数据脱敏
通常,对数据脱敏功能的衡量,主要从支持的脱敏方式,以及脱敏动作执行的便利性,效率等方面来判断。从SDDP数据脱敏的实际体验来看,基本覆盖了当前最常见的一些数据脱敏方式,适用于对不同类型的源数据作脱敏,还是很全面的。比较贴心的是,对脱敏算法进行配置时,有一个测试功能,能够提前验证脱敏效果是否符合自己的预期。
_2019_07_31_17_40_47
数据脱敏的具体操作执行上,需要在脱敏任务里指定脱敏源,脱敏算法,目标位置;该功能的实际使用比较简单,配置也很方便,以下以RDS的脱敏为例,可以很便利的对需要脱敏的字段进行脱敏开关的开启,在对脱敏算法进行选择是,也支持提前测试和验证:
_2019_07_31_17_44_37
任务的触发方式,也支持人工,定时,人工+定时等多种方式;对于脱敏后可能存在的数据冲突,也给了用户不同的选择方式。

_2019_07_31_17_57_08
以下是任务创建完毕,并执行完成的截图:

_2019_07_31_18_04_49
整体使用中,感觉数据脱敏的功能相当不错,不管是功能设计,还是用户体验,都很不错。

5.API等增强功能
根据产品介绍,SDDP也是支持通过API进行相关查询和操作的,不过本次因时间原因,暂未对其API进行测试。

三.计费模式与版本
当前官方公布的计费模式如下:
_2019_08_01_18_25_45
从已经公布的敏感数据识别功能的计费模式来看,价格整体还算比较合理,OSS支持的最大存储量为10T,RDS则为20个库,对于部分深度企业用户来说,总量很可能远超这些;因此在使用中,个人认为更适合对那些比较重视数据敏感性的bucket和库进行授权识别,而不是所有资源,这样从使用效率以及成本上都可能会更好。至于敏感数据脱敏的计费模式,也值得后期关注。

四.总结与建议
经过以上的测试体验,得出以下结论:

1.整体功能设计还是比较完善的,覆盖到了数据识别,事件跟进处置,基于处置的算法优化,以及数据脱敏等核心功能,有闭环的整体框架性设计;特别是数据脱敏功能,使用起来感觉很方便。

2.在敏感数据展示,敏感数据定位方面,当前对于用户来讲,还有些不便的地方,毕竟识别出来只是第一步,定位到数据本身才是后续通常要进行的动作;另外,用户自定义规则方面,当前给与用户的选择还不太够,可以完善。

相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
10天前
|
数据采集 自然语言处理 数据库
深入体验阿里云通义灵码:测试与实例展示
阿里云通义灵码是一款强大的代码生成工具,支持自然语言描述需求,快速生成高质量代码。它在测试、代码质量和用户体验方面表现出色,能够高效地生成 Python 和 Java 等语言的代码,助力开发者提升开发效率和代码质量。无论是新手还是资深开发者,都能从中受益匪浅。
深入体验阿里云通义灵码:测试与实例展示
|
3月前
|
弹性计算 测试技术 持续交付
阿里云云效产品使用合集之如何进行自动化测试
云效作为一款全面覆盖研发全生命周期管理的云端效能平台,致力于帮助企业实现高效协同、敏捷研发和持续交付。本合集收集整理了用户在使用云效过程中遇到的常见问题,问题涉及项目创建与管理、需求规划与迭代、代码托管与版本控制、自动化测试、持续集成与发布等方面。
|
1月前
|
弹性计算 安全 Linux
阿里云国际版使用ping命令测试ECS云服务器不通的排查方法
阿里云国际版使用ping命令测试ECS云服务器不通的排查方法
|
3月前
|
运维 Java Devops
阿里云云效操作报错合集之在流水线增加单元测试报错,是什么导致的
本合集将整理呈现用户在使用过程中遇到的报错及其对应的解决办法,包括但不限于账户权限设置错误、项目配置不正确、代码提交冲突、构建任务执行失败、测试环境异常、需求流转阻塞等问题。阿里云云效是一站式企业级研发协同和DevOps平台,为企业提供从需求规划、开发、测试、发布到运维、运营的全流程端到端服务和工具支撑,致力于提升企业的研发效能和创新能力。
|
3月前
|
存储 Kubernetes 测试技术
阿里云块存储问题之处理信用分低的测试用例(即不稳定Case)如何解决
阿里云块存储问题之处理信用分低的测试用例(即不稳定Case)如何解决
46 0
|
3月前
|
存储 Kubernetes 测试技术
阿里云块存储问题之生产代码与测试代码需要同步原子提交如何解决
阿里云块存储问题之生产代码与测试代码需要同步原子提交如何解决
37 0
|
3月前
|
存储 测试技术 块存储
阿里云块存储问题之有顺序依赖的测试导致不稳定如何解决
阿里云块存储问题之有顺序依赖的测试导致不稳定如何解决
33 0
|
8天前
|
JSON Java 测试技术
SpringCloud2023实战之接口服务测试工具SpringBootTest
SpringBootTest同时集成了JUnit Jupiter、AssertJ、Hamcrest测试辅助库,使得更容易编写但愿测试代码。
37 3
|
1月前
|
JSON 算法 数据可视化
测试专项笔记(一): 通过算法能力接口返回的检测结果完成相关指标的计算(目标检测)
这篇文章是关于如何通过算法接口返回的目标检测结果来计算性能指标的笔记。它涵盖了任务描述、指标分析(包括TP、FP、FN、TN、精准率和召回率),接口处理,数据集处理,以及如何使用实用工具进行文件操作和数据可视化。文章还提供了一些Python代码示例,用于处理图像文件、转换数据格式以及计算目标检测的性能指标。
59 0
测试专项笔记(一): 通过算法能力接口返回的检测结果完成相关指标的计算(目标检测)
|
2月前
|
移动开发 JSON Java
Jmeter实现WebSocket协议的接口测试方法
WebSocket协议是HTML5的一种新协议,实现了浏览器与服务器之间的全双工通信。通过简单的握手动作,双方可直接传输数据。其优势包括极小的头部开销和服务器推送功能。使用JMeter进行WebSocket接口和性能测试时,需安装特定插件并配置相关参数,如服务器地址、端口号等,还可通过CSV文件实现参数化,以满足不同测试需求。
239 7
Jmeter实现WebSocket协议的接口测试方法