MySQL分割一行为多行的思路

本文涉及的产品
云数据库 RDS MySQL Serverless,0.5-2RCU 50GB
简介: MySQL分割一行为多行的思路

最近数据分析有需求,分析运营活动短信用户,但是发送短信的用户是通过 JSON 字符串数组存储在一个 text 字段的。内容类似于:

["user1", "user2", "user3"....]

数据分析想分析这些用户,那么就需要 in 这些用户查询。自己手动拼 SQL 太蛋疼,而且好几万几十万的用户,拼成SQL,复制粘贴也够蛋疼的。那么可以考虑将这一行分割为多行,作为一个字段。


mysql.help_topic 是啥


网上的思路是利用 mysql.help_topic 这个记录表,这个表是存储 mysql 各种帮助文档目录的,主要因为他有一个从零开始自增的 id 字段,所以采用这张表作为帮助表。其实他不是用来干这个的。并且,有时候我们精简安装,或者是云服务里面的 mysql,他们的这张表里面的内容,是空的,所以我们不能靠这张表。


如何自己实现呢?


思路主要是如下,首先处理数据,将 JSON 字符串数组处理成:

user1,user2,user3

通过:

select replace(replace(replace(replace(a,'[',''),']',''), '"', ''),' ','') processed_data from 表

然后,我们通过substring_index函数,可以提取出user1user2user3这些用户 id。分别是:substring_index(substring_index(processed_data,',',1),',',-1)substring_index(substring_index(processed_data,',',2),',',-1)substring_index(substring_index(processed_data,',',3),',',-1).可以看出,如果我们能提供一个数字,这个数字从1开始,一直到,的个数 + 1,这样就能使用substring_index函数,将每个 userId 提取出来,也就是将数据转换成:

+-------------------+----+
| processed_data    | id |
| user1,user2,user3 | 1  |
| user1,user2,user3 | 2  |
| user1,user2,user3 | 3  |

哪里有这么一张表呢?我们可以创建一个表,里面只有一列 id,从0或者1开始,这里我们从0开始,一直到你的,可能的最多个数,我们这里是 200 万。

+----+
| id |
+----+
|  0 |
|  1 |
|  2 |
|  3 |
|  4 |
|  5 |

这样,通过 join 这张表,用 id < ,的个数为条件,就能得出上面的processed_dataidjoin 的数据。

最后的SQL:

SELECT
  substring_index( substring_index( processed_data, ',', b.id + 1 ), ',',- 1 ) user_id 
FROM
(
SELECT REPLACE
  (
    REPLACE ( REPLACE ( REPLACE (数据字段, '[', '' ), ']', '' ), '"', '' ),
    ' ',
    '' 
  ) processed_data 
FROM
) temp
JOIN help表 b ON b.id < ( length( temp.processed_data ) - length( REPLACE ( temp.processed_data, ',', '' ) ) + 1 )

其中的 help 表就是里面只有一列 id,从0或者1开始,这里我们从0开始,一直到你的,可能的最多个数的这张表

相关实践学习
基于CentOS快速搭建LAMP环境
本教程介绍如何搭建LAMP环境,其中LAMP分别代表Linux、Apache、MySQL和PHP。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助 &nbsp; &nbsp; 相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
18天前
|
SQL 存储 关系型数据库
【mysql】将逗号分割的字段内容转换为多行并group by
【mysql】将逗号分割的字段内容转换为多行并group by
|
2月前
|
监控 关系型数据库 MySQL
PHP与MySQL的结合:实现局域网上网行为监控软件的数据库管理
在当今信息化时代,网络安全日益成为重要的话题。为了有效监控和管理局域网上网行为,开发一个基于PHP和MySQL的数据库管理系统是一个理想的选择。本文将介绍如何结合PHP和MySQL,开发一款简单而高效的局域网上网行为监控软件,并重点关注数据库管理方面的实现。
198 0
|
4月前
|
Oracle 关系型数据库 MySQL
oceanbase在MySQL语法兼容模式下,在授权语法、行为方面 是否与 开源MySQL完全一致 ?
oceanbase在MySQL语法兼容模式下,在授权语法、行为方面 是否与 开源MySQL完全一致 ?
103 2
|
6月前
|
SQL 关系型数据库 MySQL
【MySQL用法】mysql如何进行以,分割的字符串的拆分
【MySQL用法】mysql如何进行以,分割的字符串的拆分
44 0
|
关系型数据库 MySQL 数据库
|
SQL 关系型数据库 MySQL
MySql字符串拆分实现split功能(字段分割转列、转行)
MySql字符串拆分实现split功能(字段分割转列、转行)
MySql字符串拆分实现split功能(字段分割转列、转行)
|
关系型数据库 MySQL
MySQL基础-删除/更新行为
添加了外键之后,再删除父表数据时产生的约束行为,我们就称为删除/更新行为。具体的删除/更新行为有以下几种:
156 0
|
算法 关系型数据库 MySQL
【MySQL性能优化】MySQL分库分表与水平分割取模案例(三)
【MySQL性能优化】MySQL分库分表与水平分割取模案例(三)
169 0
|
存储 设计模式 关系型数据库
MYSQL 逗号分割字段行转列
由于很多业务表因为历史原因或者性能原因,都使用了违反第一范式的设计模式。即同一个列中存储了多个属性值。现需要将多个属性值通过字典表转义,这种模式下,应用常常需要将这个列依据分隔符进行分割,并得到列转行的结果
893 2
|
存储 SQL JSON
MySQL Case-通过optimizer_trace看MySQL优化器行为
我们在日常维护数据库的时候,如果遇到慢语句查询的时候,我们一般会怎么做?执行EXPLAIN去查看它的执行计划?是的。我们经常会这么做,然后看到执行计划展示给我们的一些信息,告诉我们MySQL是如何执行语句的。但是,执行计划往往只给我们带来了最基础的分析信息,比如是否有使用索引,还有一些其他供我们分析的信息,比如使用了临时表、排序等等。
386 0