阿里云SDDP(敏感数据保护)测试调研

本文涉及的产品
RDS MySQL DuckDB 分析主实例,集群系列 4核8GB
简介: 海量数据的使用正在为企业创造越来越多的价值,与此同时,数据也正成为企业的核心资产;如何在对数据高效使用的同时,确保数据的安全,尤其是敏感数据的安全,是一个重要的安全课题,也是很多企业的核心诉求。本次对阿里云SDDP(敏感数据保护)产品进行了测试调研。

海量数据的使用正在为企业创造越来越多的价值,与此同时,数据也正成为企业的核心资产;如何在对数据高效使用的同时,确保数据的安全,尤其是敏感数据的安全,是一个重要的安全课题,也是很多企业的核心诉求。本次对阿里云SDDP(敏感数据保护)产品进行了测试调研。

一.主要功能
测试过程中,了解到SDDP实现的功能主要包括:

1.敏感数据识别:基于敏感数据识别规则,对使用阿里云产品服务中产生的数据进行分析,识别出其中的敏感数据和对应的风险等级。

2.异常事件告警:从权限开放,数据流转和操作等方面对潜在的异常事件告警。

3.数据脱敏:敏感数据从高安全级别区域/系统进入低安全级别区域/系统使用前,进行静态脱敏。

4.其他增强特性:如API等。

二.功能体验
当前SDDP主要支持OSS,RDS,MaxCompute这三款阿里云产品,在使用该产品之前,首先需要对相应的产品资源进行连接授权,确保SDDP对这些资源有足够的权限进行操作。

1.连接授权
以下是三种资源连接授权界面的截图,整个过程还是比较简单的,选择需要授权的资源,并填入必要的连接信息(如RDS的用户名/密码)即可。
_2019_07_29_14_07_25
_2019_07_29_14_08_03
_2019_07_29_14_13_15
连接授权信息填入完毕后,SDDP会尝试使用该授权信息访问对应的资源,如果没有问题,检测状态会变为通过,后续就可以正常使用SDDP的各项功能,连接授权整个配置过程还是比较简单的。
_2019_07_29_14_18_26

2.敏感数据识别
2.1规则相关配置
敏感数据的识别需要基于一系列既定的规则,从实际使用过程中了解到,SDDP默认已经内置了一系列常见的敏感数据的识别规则,如身份证,手机号,银行卡等个人敏感信息的识别,以及在应用开发部署和安全场景中会经常接触到的AccessKeyId,AccessKeySecret,key私钥等敏感信息。

敏感识别规则页面可以看到SDDP默认内置了三十多项常见的敏感数据识别规则。以下是敏感识别规则页面的部分截图,可以看到,内置的规则覆盖了一些较为典型的敏感数据信息,并且默认定义好了该类信息对应的风险等级;例如身份证和手机号风险被定义为S3,银行卡为S4;AccessKeyId被定义为S3,而AccessKeySecret和Key私钥等则被定义为S4,个人认为默认的风险等级定义还是比较合理的。
_2019_07_26_10_54_23
_2019_07_26_11_17_34
值得一提的是,发现默认规则还集成了对身份证图片,护照图片等图片信息的敏感信息识别,推测可能使用了OCR之类的图像识别技术?这一点还是很不错的,毕竟现在的确有很多敏感信息是通过图片的方式进行存储,常见的直接基于文本字符串的识别规则,并不能覆盖这一部分。
_2019_07_26_11_09_30
敏感识别规则这一部分,除了产品自带的一系列规则外,也支持自定义规则的配置,可以看到支持关键字以及正则表达式匹配的模式,并且能对自定义的规则设置风险等级。

_2019_07_26_11_35_25
不过,关于自定义规则,发现有一些不方便的是,自定义的规则无法修改,如果因为规则编写的原因需要修改时,只能将原策略删除,重新添加。
_2019_07_26_11_42_13
其实建议这个自定义规则,可以和内置规则保持一些差异,自定义规则可以允许用户编辑,因为在添加规则中,特别是正则表达式类型,由于编写的准确性,是很有可能需要修改的。

2.2识别结果展示
因本次测试未添加MaxCompute资源,以下是OSS及RDS敏感数据识别页面的展示效果:
_2019_07_29_12_01_42
_2019_07_29_12_02_10
_2019_07_29_16_14_34
_2019_07_29_16_14_59
从展示效果来看,还是不错的;如果点击上图中具体的资源,例如OSS的某个bucket或者RDS的某个库,会显示出具体的哪个对象包含敏感信息,以及对应的风险等级:
_2019_07_29_16_24_30
在这里需要注意的是,当前的展示效果不能对数据进行隐藏,例如只显示某一级别,或者某个级别以上的对象,担心如果加入的资源较多时,展示效果可能会比较混乱,难以找到关键的风险信息;在使用中就发现,例如我需要查找某个包含了S3级别风险的RDS字段时,因为该库中的表和字段较多,需要翻页,在多个S2中找到一个S3,比较困难。这应该是可以改进的地方。

3.异常事件告警和处置
SDDP能基于对OSS/RDS/MaxCompute等场景异常的定义,产生异常告警事件。当前的异常场景和事件规则定义以下:
_2019_07_29_19_12_03
_2019_07_29_19_12_18

可以看到,规则的丰富度尚可,但是不支持对规则的编辑,或者针对用户场景的自定义规则,定制化略有不足。
在“异常事件处理”的标签页下,可以看到基于当前异常事件规则所产生的一些告警事件:
_2019_07_30_11_07_30
点击查看详情,可以看到该异常事件的细节;另外,在处理页面,能对该异常事件的跟进调查进行简单记录,并确认是否误报还是的确违规。

_2019_07_30_11_12_45
_2019_07_30_13_46_26

4.数据脱敏
通常,对数据脱敏功能的衡量,主要从支持的脱敏方式,以及脱敏动作执行的便利性,效率等方面来判断。从SDDP数据脱敏的实际体验来看,基本覆盖了当前最常见的一些数据脱敏方式,适用于对不同类型的源数据作脱敏,还是很全面的。比较贴心的是,对脱敏算法进行配置时,有一个测试功能,能够提前验证脱敏效果是否符合自己的预期。
_2019_07_31_17_40_47
数据脱敏的具体操作执行上,需要在脱敏任务里指定脱敏源,脱敏算法,目标位置;该功能的实际使用比较简单,配置也很方便,以下以RDS的脱敏为例,可以很便利的对需要脱敏的字段进行脱敏开关的开启,在对脱敏算法进行选择是,也支持提前测试和验证:
_2019_07_31_17_44_37
任务的触发方式,也支持人工,定时,人工+定时等多种方式;对于脱敏后可能存在的数据冲突,也给了用户不同的选择方式。

_2019_07_31_17_57_08
以下是任务创建完毕,并执行完成的截图:

_2019_07_31_18_04_49
整体使用中,感觉数据脱敏的功能相当不错,不管是功能设计,还是用户体验,都很不错。

5.API等增强功能
根据产品介绍,SDDP也是支持通过API进行相关查询和操作的,不过本次因时间原因,暂未对其API进行测试。

三.计费模式与版本
当前官方公布的计费模式如下:
_2019_08_01_18_25_45
从已经公布的敏感数据识别功能的计费模式来看,价格整体还算比较合理,OSS支持的最大存储量为10T,RDS则为20个库,对于部分深度企业用户来说,总量很可能远超这些;因此在使用中,个人认为更适合对那些比较重视数据敏感性的bucket和库进行授权识别,而不是所有资源,这样从使用效率以及成本上都可能会更好。至于敏感数据脱敏的计费模式,也值得后期关注。

四.总结与建议
经过以上的测试体验,得出以下结论:

1.整体功能设计还是比较完善的,覆盖到了数据识别,事件跟进处置,基于处置的算法优化,以及数据脱敏等核心功能,有闭环的整体框架性设计;特别是数据脱敏功能,使用起来感觉很方便。

2.在敏感数据展示,敏感数据定位方面,当前对于用户来讲,还有些不便的地方,毕竟识别出来只是第一步,定位到数据本身才是后续通常要进行的动作;另外,用户自定义规则方面,当前给与用户的选择还不太够,可以完善。

相关实践学习
每个IT人都想学的“Web应用上云经典架构”实战
本实验从Web应用上云这个最基本的、最普遍的需求出发,帮助IT从业者们通过“阿里云Web应用上云解决方案”,了解一个企业级Web应用上云的常见架构,了解如何构建一个高可用、可扩展的企业级应用架构。
MySQL数据库入门学习
本课程通过最流行的开源数据库MySQL带你了解数据库的世界。   相关的阿里云产品:云数据库RDS MySQL 版 阿里云关系型数据库RDS(Relational Database Service)是一种稳定可靠、可弹性伸缩的在线数据库服务,提供容灾、备份、恢复、迁移等方面的全套解决方案,彻底解决数据库运维的烦恼。 了解产品详情: https://www.aliyun.com/product/rds/mysql 
目录
相关文章
|
10月前
|
机器学习/深度学习 自然语言处理 API
阿里云零门槛、轻松部署您的专属 DeepSeek模型体验测试
DeepSeek R1是基于Transformer架构的先进大规模深度学习模型,2025年1月20日发布并开源,遵循MIT License。它在自然语言处理等任务上表现出色,高效提取特征,缩短训练时间。阿里云推出的满血版方案解决了服务器压力问题,提供100万免费token,云端部署降低成本,用户可快速启动体验。虽然回答速度有待提升,但整体表现优异,备受关注。
423 8
|
9月前
|
关系型数据库 测试技术 分布式数据库
刷新世界纪录!阿里云PolarDB凭借创新的「三层解耦」架构刷新TPC-C基准测试世界纪录
刷新世界纪录!阿里云PolarDB凭借创新的「三层解耦」架构刷新TPC-C基准测试世界纪录
|
弹性计算 测试技术 持续交付
阿里云云效产品使用合集之如何进行自动化测试
云效作为一款全面覆盖研发全生命周期管理的云端效能平台,致力于帮助企业实现高效协同、敏捷研发和持续交付。本合集收集整理了用户在使用云效过程中遇到的常见问题,问题涉及项目创建与管理、需求规划与迭代、代码托管与版本控制、自动化测试、持续集成与发布等方面。
|
传感器 安全 物联网
阿里云先知安全沙龙(北京站) ——车联网安全渗透测试思路分享
本文介绍了智能汽车的整车架构、协议栈结构、攻击点分析、渗透思路及案例分享。整车架构涵盖应用层、协议层和物理层,详细解析各层次功能模块和通信机制。攻击点包括Wi-Fi、USB、NFC等,展示车辆通信接口和系统组件的安全风险。渗透思路从信息收集到系统内部探索,利用固件漏洞控制车辆功能。案例展示了网段隔离不足导致的SSH访问和OTA日志审计漏洞,揭示了潜在的安全威胁。
|
数据采集 自然语言处理 数据库
深入体验阿里云通义灵码:测试与实例展示
阿里云通义灵码是一款强大的代码生成工具,支持自然语言描述需求,快速生成高质量代码。它在测试、代码质量和用户体验方面表现出色,能够高效地生成 Python 和 Java 等语言的代码,助力开发者提升开发效率和代码质量。无论是新手还是资深开发者,都能从中受益匪浅。
深入体验阿里云通义灵码:测试与实例展示
|
弹性计算 安全 Linux
阿里云国际版使用ping命令测试ECS云服务器不通的排查方法
阿里云国际版使用ping命令测试ECS云服务器不通的排查方法
|
运维 Java Devops
阿里云云效操作报错合集之在流水线增加单元测试报错,是什么导致的
本合集将整理呈现用户在使用过程中遇到的报错及其对应的解决办法,包括但不限于账户权限设置错误、项目配置不正确、代码提交冲突、构建任务执行失败、测试环境异常、需求流转阻塞等问题。阿里云云效是一站式企业级研发协同和DevOps平台,为企业提供从需求规划、开发、测试、发布到运维、运营的全流程端到端服务和工具支撑,致力于提升企业的研发效能和创新能力。
|
11月前
|
数据可视化 前端开发 测试技术
接口测试新选择:Postman替代方案全解析
在软件开发中,接口测试工具至关重要。Postman长期占据主导地位,但随着国产工具的崛起,越来越多开发者转向更适合中国市场的替代方案——Apifox。它不仅支持中英文切换、完全免费不限人数,还具备强大的可视化操作、自动生成文档和API调试功能,极大简化了开发流程。
|
6月前
|
Java 测试技术 容器
Jmeter工具使用:HTTP接口性能测试实战
希望这篇文章能够帮助你初步理解如何使用JMeter进行HTTP接口性能测试,有兴趣的话,你可以研究更多关于JMeter的内容。记住,只有理解并掌握了这些工具,你才能充分利用它们发挥其应有的价值。+
1079 23
|
8月前
|
SQL 安全 测试技术
2025接口测试全攻略:高并发、安全防护与六大工具实战指南
本文探讨高并发稳定性验证、安全防护实战及六大工具(Postman、RunnerGo、Apipost、JMeter、SoapUI、Fiddler)选型指南,助力构建未来接口测试体系。接口测试旨在验证数据传输、参数合法性、错误处理能力及性能安全性,其重要性体现在早期发现问题、保障系统稳定和支撑持续集成。常用方法包括功能、性能、安全性及兼容性测试,典型场景涵盖前后端分离开发、第三方服务集成与数据一致性检查。选择合适的工具需综合考虑需求与团队协作等因素。
1328 24