Dataphin功能Tips系列(84)基于大模型的敏感信息分类分级解决方案

简介: 某金融公司需对海量用户信息进行分类分级以满足合规要求。人工处理效率低、风险高。Dataphin 5.4推出智能安全分类分级功能,基于AI大模型语义解析字段,结合元数据与描述,自动推荐分类结果,支持全表扫描与规则筛选,提升治理效率与数据安全性。

👉🏻场景

某金融公司管理着大量用户信息数据,如客户的姓名、手机号、身份证号、账户信息等。这些数据不仅是企业的核心资产,也是《数据安全法》和《个人信息保护法》等法规重点保护的对象。

公司需对所有数据表的用户信息字段进行分类分级(如分类为用户基础信息、分级为敏感等级L1-L4),以满足合规要求并防止敏感数据泄露。然而,表数量庞大且字段复杂,人工处理容易遗漏或出错,治理效率低且风险高。如何快速分类分级用户信息,确保数据安全与合规性呢?

👉🏻解决方案及功能

在Dataphin 5.4版本中,X-数据安全新增支持了智能安全分类分级识别,借助AI大模型对数据表字段进行语义解析,结合DDL元数据、字段描述,智能推荐字段的安全分类与分级,精准高效,降低人工成本,提升治理效率。

  1. 首先,进入「X-数据安全」,点击「添加数据来源」,选择需要扫描哪些表进行分类分级。
  2. 由于我们需要所有数据表进行分类分级扫描,直接选择对应数据源下的 所有表

    若有更具体的需求,例如只针对某些表进行处理,可通过表名、资产标签等规则,圈选指定项目或板块中的表作为数据来源
  3. 完成数据来源范围的配置后,选择基于“用户相关”分类的规则,发起数据分类分级任务。

  4. 任务完成后,系统会生成分类分级推荐结果,我们可针对每条结果进行审核。根据大模型的匹配度以及实际字段与分类的关联情况,选择“应用”或“弃用”推荐结果。
  5. 成功应用识别结果后,可在 「资产安全 - 识别结果」 中查看生效后的数据资产分类分级情况。

相关文章
|
2月前
|
SQL 自然语言处理 BI
Dataphin功能Tips系列(87)Dataphin「X-分析」:自然语言开启自助取数新时代
Dataphin推出【X-分析】Agent,支持非技术用户通过自然语言提问,自动生成SQL并执行查询,快速获取数据结果。用户可新建分析专辑,结合业务数据与提示词优化模型理解,实现精准取数。支持SQL审核编辑、保存至Notebook或一键创建Quick BI数据集,打通从查询到分析的全流程,降低人力成本,提升数据消费效率,助力业务自助高效用数。
106 0
Dataphin功能Tips系列(87)Dataphin「X-分析」:自然语言开启自助取数新时代
|
2月前
|
数据采集 运维 调度
Dataphin功能Tips系列(88)补数据场景下,如何实现质量规则的精准回溯校验?
在数据补跑场景中,为精准校验指定历史日期(如12月18日)的数据,质量管理员应使用基于业务日期的表达式 ds='${yyyyMMdd}' 配置调度规则。该方式支持手动执行时动态关联所选业务日期,确保校验范围准确指向目标数据,实现高效、精确的质量校验。
|
2月前
|
数据采集 人工智能 运维
Dataphin功能Tips系列(85)告别“人肉排障”:AI驱动数据质量根因诊断,让治理效率跃升
传统数据治理中,数据质量问题依赖人工排查,效率低且难定位根因。Dataphin 5.4推出X-数据质量根因诊断功能,基于AI大模型分析数据血缘与采样,智能定位问题源头,自动生成整改建议与影响评估,实现从发现问题到闭环治理的自动化,大幅提升治理效率与准确性。
120 0
|
2月前
|
存储 分布式计算 Hadoop
Dataphin功能Tips系列(86)Dataphin“查询加速”方案:提升大表分析性能,节省存储保障数据一致性
Dataphin推出“查询加速”功能,无需数据同步,通过一键映射外部Catalog,实现对MaxCompute/Hadoop大表的透明加速。利用StarRocks等引擎秒级响应即席查询,保障权限统一与数据安全,降低存储成本与运维压力。
|
3月前
|
SQL 关系型数据库 MySQL
释放数据潜能,加速业务创新 —— Dataphin 5.4 新增删改API功能
Dataphin 5.4推出数据增删改API功能,支持通过配置SQL快速生成安全、可管理的CRUD接口,覆盖AI编程、数据集成、低代码等场景,降低开发成本,提升数据治理与安全性,助力企业高效释放数据价值。
258 0
|
3月前
|
数据采集 人工智能
Dataphin X-数据质量,智能分析质量问题并推荐整改建议
针对数据治理中质量问题难发现、根因定位难、整改效率低等痛点,推出AI驱动的数据质量问题智能分析功能。通过智能分析异常、追溯根因、构建数据证据链,自动生成含改进建议与影响评估的质量报告,提升治理效率与决策可靠性。
152 3
|
3月前
|
SQL 数据可视化 大数据
Dataphin数据血缘:实现全面追溯,保障流转透明
数据血缘揭示数据从源头到应用的全链路流转关系,助力企业厘清数据来源、影响范围与质量问题根源。Dataphin通过自动采集、手动配置和OpenAPI注册三类方式构建全面的数据血缘,支持可视化展示与用于质量问题溯源,实现数据可查、可信、可管,推动高质量数据治理。
382 1
|
4月前
|
数据采集 SQL 数据可视化
Dataphin功能Tips系列(72)一键数据探查,打造高质量数据开发、分析流程
Dataphin数据探查功能助力高效识别数据质量问题,支持手动与自动两种探查模式。通过一键生成质量报告,快速检测空值、异常值、重复值等问题,全面掌握数据分布与健康状况,提升数据准备与分析准确性。
309 7
|
2月前
|
数据采集 人工智能 安全
Dataphin V5.4版本发布:拥有「最强大脑」的数据中台,究竟智能在哪儿?
Dataphin是阿里巴巴数据中台方法论的实践产品,助力企业构建湖仓一体、多云兼容的数据资产体系。V5.4版本升级集成、治理、安全与运维能力,新增API/FTP增强、数据质量智能分析、外部血缘注册、行级权限申请等特性,全面提升数据开发效率与治理水平。
234 3