MySql加密存储的数据,如何模糊搜索?

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS PostgreSQL,集群系列 2核4GB
简介: MySql加密存储的数据,如何模糊搜索?

背景

蔚来被勒索 225 万美元,大量数据遭泄露!


根据网络上流传的截图显示,黑客似乎掌握着蔚来内部员工数据 22800 条、车主用户身份证数据 399000 条、用户地址数据 6500000 条、注册用户数据 4850000 条、企业及企业代表联系人数据 10000 条、订单数据 490000 条、退单数据 90000 条,出售的金额以 0.1-0.25 比特币不等。


蔚来公司和蔚来创始人李斌也都出来道歉,并承诺对因本次事件给用户造成的损失承担责任。

数据安全


现在企业都已经数字化办公了,在提升效率的同时,数据安全也是重中之重,很多公司为了追求效率,却忽略安全这方面的工作。从上面的报告看,蔚来这次泄露的数据包含:用户身份证、地址,这些数据保密级别都是最高的,在数据库存储也应该要加密存储。


而加密存储就涉及以下几个问题:


1、加密存储的方式;


2、加密存储后,数据如何展示;


3、加密存储如何模糊搜索。


今天就给大家分享下,MySql数据加密的解决方案、以及如何解决以上的问题。

Mysql加密方案

Mysql本身自带的加密方法,分为2种:

1、不可逆加密算法:

PASSWORD,ENCRYPT,MD5,SHA。

2、可逆的加密算法:


AES_ENCRYPT、AES_DECRYPT 和 ENCODE、DECODE。


以上两组分别为可逆的加解密函数,都是返回一个二进制字符串,要以BLOB类型存储。不过ENCODE与DECODE,在MySql 5.7后已经取消,并且安全性比较低,建议不要采用。


在项目开发中,比如密码等少量的数据,不涉及显示和搜索的业务需求,可以采用不可逆加密,但大部分数据,我们还是需要采用可逆的加密方式。

Mysql 加密存储

下面我们以AES_ENCRYPT、AES_DECRYPT 为例子,来介绍下如何解决,数据加密存储与查询。

1、创建表

首先先创建一张表,只有一个字段data,用来存储解密后的数据,sql语句如下:

CREATE TABLE `tab_aes` (`data` VARCHAR(250) NULL DEFAULT NULL COLLATE 'utf8_general_ci')COMMENT='数据加密存储表'COLLATE='utf8_general_ci'ENGINE=InnoDB;

2、插入数据

通过Sql语句插入加密的数据,1ql语句如下:

INSERT INTO tab_aes 
VALUES( TO_BASE64( AES_ENCRYPT('要加密的内容','秘钥') ) );


TO_BASE64函数把加密的二进制转换为Base64,方便我们查看。


插入的结果如下:


[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-8cydETQM-1671712236301)(https://mmbiz.qpic.cn/sz_mmbiz_png/tJJDa2wmJiapJMlo01Tr0vjlrj8G49MZHrtkCQ0YJNicvPBPZqQqU6whxA1r1UWjZoeXVZ2I9knWNvXeyHxJSVdQ/640?wx_fmt=png)]

3、查询返回解密数据

SELECT CAST( AES_DECRYPT( FROM_BASE64(tab_aes.data), '秘钥') AS CHAR CHARACTER SET utf8 ) 
FROM  tab_aes

解密后,要用CAST把字符串编码转为UTF8,否则返回是乱码。

模糊搜索

数据加密存储与解密数据,这些都没有太大问题,加密存储产生最大的问题,就是模糊搜索,关于模糊搜索有以下方案:


1、数据预加载至内存数据库

此方案是程序启动的时候,预先把数据库的数据解密,并加载至内存中,比如采用MongoDB,此方案存在的优缺点如下:

优点:


数据安全,查询性能速度快


缺点:


服务器占用内存大;


数据表无法关联查询;


内存数据与数据库要实时保存一致,需要额外工作量。


2、程序实时加载数据,并解密处理


此方案是,用户触发请求的时候,程序实时加载并解密,保存至内存,虽然此方案解决了与数据库同步的问题,但也存在其他问题,此方案优缺点如下:


优点:


数据安全,查询性能速度快、数据处理灵活。


缺点:


服务器内存不可控,瞬间内存容易飙升,可能导致服务器不稳定;


数据表无法关联查询。


3、在Sql语句处理模糊搜索


如果数据量比较少,以上两种方案可能不会产生太大的影响,但对于大多数项目以上两种方案还是不靠谱的。


在Sql语句处理模糊搜索,也有以下几种方案:3.1、实时解密搜索

直接在数据库端,把加密的数据解密。

SELECT CAST( AES_DECRYPT( FROM_BASE64(tab_aes.data), '秘钥') AS CHAR CHARACTER SET UTF8 ) 
FROM  tab_aes
WHERE
CAST( AES_DECRYPT( FROM_BASE64(tab_aes.data), '秘钥') AS CHAR CHARACTER SET UTF8 ) LIKE '要加密%'

优点

搜索灵活

缺点:

无法利用索引,搜索性能慢;

数据需要先解密,导致性能慢。

3.2、字段冗余存储

我们都知道MySql模糊搜索,只有当匹配开头、或者匹配结尾的时候,索引才会生效。所以我们可以扩展一个字段,用来存储开头和结尾加密后的数据。


创建表sql语句如下,新增一个字段data_ext,并建立索引:

CREATE TABLE `tab_aes` (
`data` VARCHAR(250) NULL DEFAULT NULL COLLATE 'utf8_general_ci',
`data_ext` VARCHAR(250) NULL DEFAULT NULL COLLATE 'utf8_general_ci',
INDEX `data_ext` (`data_ext`) USING BTREE
)
COMMENT='数据加密存储表'
COLLATE='utf8_general_ci'
ENGINE=InnoDB
;


比如,要加密的内容为:123456789,字段data_ext取字段data,开头和结尾3个字符存储,储存格式为:AES(123) , AES(789),插入数据的sql语句如下:

INSERT INTO tab_aes  VALUES( TO_BASE64( AES_ENCRYPT('要加密的内容','秘钥')), 
CONCAT(TO_BASE64( AES_ENCRYPT('要加密','秘钥')), ',', TO_BASE64( AES_ENCRYPT('内容','秘钥')))
);

存储结果如下:


相应的模糊搜索sql语句如下:

SELECT CAST( AES_DECRYPT( FROM_BASE64(tab_aes.data), '秘钥') AS CHAR CHARACTER SET UTF8 )  FROM tab_aesWHEREtab_aes.data_ext LIKE CONCAT(TO_BASE64(AES_ENCRYPT(('要加密'),'秘钥')),'%')AND tab_aes.data_ext LIKE CONCAT('%',TO_BASE64(AES_ENCRYPT(('内容'),'秘钥')))AND tab_aes.data_ext LIKE CONCAT(TO_BASE64(AES_ENCRYPT(('要加密'),'秘钥')),'%', TO_BASE64(AES_ENCRYPT('内容','秘钥')));


通过Explain分析结果,该查询sql语句索引是生效的。


此方案优点:

搜索性能高;

支持表关联搜索。

此方案也有以下缺点:

1、匹配字符数是固定,如果业务有变,需要重新更新数据库;

2、数据存储需要额外工作量;

3、冗余数据,需要额外的存储空间。

写在最后

任何一种方案都有其优点,也有它的局限性,但有一点的是,数据安全是最重要的,任何企业切不可只为了业务发展,而忽略安全的重要性。

好了,今天就分享到这边了,如果对您有帮助,欢迎点赞分享,谢谢!

- End -

推荐阅读

用C#自己动手写个操作系统,爽!

盘点5个C#实用的Word、PPT、Excel、Mail第三方库

一个C#开发的Windows远程桌面工具

盘点10个Web开发人员必备的最佳开发工具推荐

盘点10个.Net比较流行的开源的ORM框架


相关文章
|
2月前
|
存储 监控 前端开发
如何实现前端框架数据驱动方式的数据加密存储?
实现前端框架数据驱动方式的数据加密存储需要综合考虑多个因素,包括加密算法的选择、密钥管理、传输安全、服务器端处理等。通过合理的设计和实施,能够有效提高数据的安全性,保护用户的隐私和敏感信息。但需要注意的是,前端加密存储不能完全替代后端的安全措施,后端的安全防护仍然是不可或缺的。
47 3
|
19天前
|
存储 关系型数据库 MySQL
mysql怎么查询longblob类型数据的大小
通过本文的介绍,希望您能深入理解如何查询MySQL中 `LONG BLOB`类型数据的大小,并结合优化技术提升查询性能,以满足实际业务需求。
74 6
|
2月前
|
存储 Oracle 关系型数据库
【赵渝强老师】MySQL InnoDB的数据文件与重做日志文件
本文介绍了MySQL InnoDB存储引擎中的数据文件和重做日志文件。数据文件包括`.ibd`和`ibdata`文件,用于存放InnoDB数据和索引。重做日志文件(redo log)确保数据的可靠性和事务的持久性,其大小和路径可由相关参数配置。文章还提供了视频讲解和示例代码。
155 11
【赵渝强老师】MySQL InnoDB的数据文件与重做日志文件
|
1月前
|
SQL 关系型数据库 MySQL
mysql分页读取数据重复问题
在服务端开发中,与MySQL数据库进行数据交互时,常因数据量大、网络延迟等因素需分页读取数据。文章介绍了使用`limit`和`offset`参数实现分页的方法,并针对分页过程中可能出现的数据重复问题进行了详细分析,提出了利用时间戳或确保排序规则绝对性等解决方案。
|
2月前
|
关系型数据库 MySQL 数据库
GBase 数据库如何像MYSQL一样存放多行数据
GBase 数据库如何像MYSQL一样存放多行数据
|
2月前
|
缓存 NoSQL 关系型数据库
Redis和Mysql如何保证数据⼀致?
在项目中,为了解决Redis与Mysql的数据一致性问题,我们采用了多种策略:对于低一致性要求的数据,不做特别处理;时效性数据通过设置缓存过期时间来减少不一致风险;高一致性但时效性要求不高的数据,利用MQ异步同步确保最终一致性;而对一致性和时效性都有高要求的数据,则采用分布式事务(如Seata TCC模式)来保障。
73 14
|
2月前
|
存储 前端开发 安全
如何确保前端框架数据驱动方式的数据加密存储的兼容性?
确保前端框架数据驱动方式的数据加密存储的兼容性需要综合考虑多个因素,通过充分的评估、测试、关注和更新,以及与其他技术的协调配合,来提高兼容性的可靠性,为用户提供稳定和安全的使用体验。
38 2
|
2月前
|
SQL 前端开发 关系型数据库
SpringBoot使用mysql查询昨天、今天、过去一周、过去半年、过去一年数据
SpringBoot使用mysql查询昨天、今天、过去一周、过去半年、过去一年数据
68 9
|
2月前
|
数据库 数据安全/隐私保护 Windows
Windows远程桌面出现CredSSP加密数据修正问题解决方案
【10月更文挑战第30天】本文介绍了两种解决Windows系统凭据分配问题的方法。方案一是通过组策略编辑器(gpedit.msc)启用“加密数据库修正”并将其保护级别设为“易受攻击”。方案二是通过注册表编辑器(regedit)在指定路径下创建或修改名为“AllowEncryptionOracle”的DWORD值,并将其数值设为2。
713 3
|
2月前
|
安全 网络安全 数据安全/隐私保护
网络安全与信息安全:从漏洞到加密,保护数据的关键步骤
【10月更文挑战第24天】在数字化时代,网络安全和信息安全是维护个人隐私和企业资产的前线防线。本文将探讨网络安全中的常见漏洞、加密技术的重要性以及如何通过提高安全意识来防范潜在的网络威胁。我们将深入理解网络安全的基本概念,学习如何识别和应对安全威胁,并掌握保护信息不被非法访问的策略。无论你是IT专业人士还是日常互联网用户,这篇文章都将为你提供宝贵的知识和技能,帮助你在网络世界中更安全地航行。