重温SQL Server的行转列和列转行,面试常考题

简介: 行转列,列转行是我们在开发过程中经常碰到的问题。行转列一般通过CASE WHEN 语句来实现,也可以通过 SQL SERVER 的运算符PIVOT来实现。用传统的方法,比较好理解。层次清晰,而且比较习惯。 但是PIVOT 、UNPIVOT提供的语法比一系列复杂的SELECT…CASE 语句中所指定的语法更简单、更具可读性。下面我们通过几个简单的例子来介绍一下列转行、行转列问题。

我们首先先通过一个老生常谈的例子,学生成绩表(下面简化了些)来形象了解下行转列


CREATE  TABLE [StudentScores]
(
 [UserName]         NVARCHAR(20),        --学生姓名
  [Subject]          NVARCHAR(30),        --科目
  [Score]            FLOAT,               --成绩
)

INSERTINTO [StudentScores] SELECT'Nick', '语文', 80
INSERTINTO [StudentScores] SELECT'Nick', '数学', 90
INSERTINTO [StudentScores] SELECT'Nick', '英语', 70
INSERTINTO [StudentScores] SELECT'Nick', '生物', 85
INSERTINTO [StudentScores] SELECT'Kent', '语文', 80
INSERTINTO [StudentScores] SELECT'Kent', '数学', 90
INSERTINTO [StudentScores] SELECT'Kent', '英语', 70
INSERTINTO [StudentScores] SELECT'Kent', '生物', 85



如果我想知道每位学生的每科成绩,而且每个学生的全部成绩排成一行,这样方便我查看、统计,导出数据


SELECT
    UserName,
    MAX(CASE Subject WHEN'语文'THEN Score ELSE0END) AS'语文',
    MAX(CASE Subject WHEN'数学'THEN Score ELSE0END) AS'数学',
    MAX(CASE Subject WHEN'英语'THEN Score ELSE0END) AS'英语',
    MAX(CASE Subject WHEN'生物'THEN Score ELSE0END) AS'生物'
FROM dbo.[StudentScores]
GROUPBY UserName


查询结果如图所示,这样我们就能很清楚的了解每位学生所有的成绩了

1.jpg 

接下来我们来看看第二个小列子。有一个游戏玩家充值表(仅仅为了说明,举的一个小例子),


CREATE TABLE [Inpours]
(
  [ID]                INT IDENTITY(1,1),
  [UserName]          NVARCHAR(20),  --游戏玩家
   [CreateTime]        DATETIME,      --充值时间
   [PayType]           NVARCHAR(20),  --充值类型
   [Money]             DECIMAL,       --充值金额
   [IsSuccess]         BIT,           --是否成功 1表示成功, 0表示失败
   CONSTRAINT [PK_Inpours_ID] PRIMARY KEY(ID)
)
INSERT INTO Inpours SELECT '张三', '2010-05-01', '支付宝', 50, 1
INSERT INTO Inpours SELECT '张三', '2010-06-14', '支付宝', 50, 1
INSERT INTO Inpours SELECT '张三', '2010-06-14', '手机短信', 100, 1
INSERT INTO Inpours SELECT '李四', '2010-06-14', '手机短信', 100, 1
INSERT INTO Inpours SELECT '李四', '2010-07-14', '支付宝', 100, 1
INSERT INTO Inpours SELECT '王五', '2010-07-14', '工商银行卡', 100, 1
INSERT INTO Inpours SELECT '赵六', '2010-07-14', '建设银行卡', 100, 1


下面来了一个统计数据的需求,要求按日期、支付方式来统计充值金额信息。这也是一个典型的行转列的例子。我们可以通过下面的脚本来达到目的


SELECT
      CONVERT(VARCHAR(10), CreateTime, 120) AS CreateTime,
      CASE PayType WHEN '支付宝'     THEN SUM(Money) ELSE 0 END AS '支付宝',
      CASE PayType WHEN '手机短信'    THEN SUM(Money) ELSE 0 END AS '手机短信',
      CASE PayType WHEN '工商银行卡'  THEN SUM(Money) ELSE 0 END AS '工商银行卡',
      CASE PayType WHEN '建设银行卡'  THEN SUM(Money) ELSE 0 END AS '建设银行卡'
FROM Inpours
GROUP BY CreateTime, PayType


如图所示,我们这样只是得到了这样的输出结果,还需进一步处理,才能得到想要的结果


2.jpg

SELECT
      CreateTime,
      ISNULL(SUM([支付宝])    , 0)  AS [支付宝],
      ISNULL(SUM([手机短信])  , 0)  AS [手机短信],
      ISNULL(SUM([工商银行卡]), 0)  AS [工商银行卡],  
      ISNULL(SUM([建设银行卡]), 0)  AS [建设银行卡]
FROM
(
   SELECT
          CONVERT(VARCHAR(10), CreateTime, 120) AS CreateTime,
          CASE PayType WHEN '支付宝'     THEN SUM(Money) ELSE 0 END AS '支付宝' ,
          CASE PayType WHEN '手机短信'   THEN SUM(Money) ELSE 0 END AS '手机短信',
          CASE PayType WHEN '工商银行卡' THEN SUM(Money) ELSE 0 END AS '工商银行卡',
          CASE PayType WHEN '建设银行卡' THEN SUM(Money) ELSE 0 END AS '建设银行卡'
   FROM Inpours
   GROUP BY CreateTime, PayType
) T
GROUP BY CreateTime


其实行转列,关键是要理清逻辑,而且对分组(Group by)概念比较清晰。上面两个列子基本上就是行转列的类型了。但是有个问题来了,上面是我为了说明弄的一个简单列子。实际中,可能支付方式特别多,而且逻辑也复杂很多,可能涉及汇率、手续费等等(曾经做个这样一个),如果支付方式特别多,我们的CASE WHEN 会弄出一大堆,确实比较恼火,而且新增一种支付方式,我们还得修改脚本如果把上面的脚本用动态SQL改写一下,我们就能轻松解决这个问题


DECLARE @cmdText    VARCHAR(8000);
DECLARE @tmpSql        VARCHAR(8000);
SET @cmdText = 'SELECT CONVERT(VARCHAR(10), CreateTime, 120) AS CreateTime,' + CHAR(10);
SELECT @cmdText = @cmdText + ' CASE PayType WHEN ''' +
PayType + ''' THEN SUM(Money) ELSE 0 END AS ''' + PayType
      + ''',' + CHAR(10)  FROM (SELECT DISTINCT PayType FROM Inpours ) T
SET @cmdText = LEFT(@cmdText, LEN(@cmdText) -2) --注意这里,如果没有加CHAR(10) 则用LEFT(@cmdText, LEN(@cmdText) -1)
SET @cmdText = @cmdText + ' FROM Inpours    
   GROUP BY CreateTime, PayType ';
SET @tmpSql ='SELECT CreateTime,' + CHAR(10);
SELECT @tmpSql = @tmpSql + ' ISNULL(SUM(' + PayType  + '), 0) AS ''' +
PayType  + ''','  + CHAR(10)
FROM  (SELECT DISTINCT PayType FROM Inpours ) T
SET @tmpSql = LEFT(@tmpSql, LEN(@tmpSql) -2) + ' FROM (' + CHAR(10);
SET @cmdText = @tmpSql + @cmdText + ') T GROUP BY CreateTime ';
PRINT @cmdText
EXECUTE (@cmdText);


下面是通过PIVOT来进行行转列的用法,大家可以对比一下,确实要简单、更具可读性

 

SELECT CreateTime, [支付宝] , [手机短信],[工商银行卡] , [建设银行卡]
FROM
(
   SELECT CONVERT(VARCHAR(10), CreateTime, 120) AS CreateTime,PayType, Money
   FROM Inpours
) P
PIVOT (
           SUM(Money)
           FOR PayType IN
           ([支付宝], [手机短信], [工商银行卡], [建设银行卡])
     ) AS T
ORDER BY CreateTime

有时可能会出现这样的错误:


消息 325,级别 15,状态 1,第 9 行


‘PIVOT’ 附近有语法错误。您可能需要将当前数据库的兼容级别设置为更高的值,以启用此功能。有关存储过程 sp_dbcmptlevel 的信息,请参见帮助。


这个是因为:对升级到 SQL Server 2005 或更高版本的数据库使用 PIVOT 和 UNPIVOT 时,必须将数据库的兼容级别设置为 90 或更高。有关如何设置数据库兼容级别的信息,请参阅 sp_dbcmptlevel (Transact-SQL)。 例如,只需在执行上面脚本前加上 EXEC sp_dbcmptlevel Test, 90; 就OK了, Test 是所在数据库的名称。


下面我们来看看列转行,主要是通过UNION ALL ,MAX来实现。假如有下面这么一个表


Create Table ProgrectDetail
(
   ProgrectName         NVARCHAR(20), --工程名称
   OverseaSupply        INT,          --海外供应商供给数量
   NativeSupply         INT,          --国内供应商供给数量
   SouthSupply          INT,          --南方供应商供给数量
   NorthSupply          INT           --北方供应商供给数量
)
INSERT INTO ProgrectDetail
SELECT 'A', 100, 200, 50, 50
UNION ALL
SELECT 'B', 200, 300, 150, 150
UNION ALL
SELECT 'C', 159, 400, 20, 320
UNION ALL
SELECT 'D', 250, 30, 15, 15


我们可以通过下面的脚本来实现,查询结果如下图所示


SELECT  ProgrectName, 'OverseaSupply' AS Supplier,
      MAX(OverseaSupply) AS 'SupplyNum'
FROM ProgrectDetail
GROUP BY ProgrectName
UNION ALL
SELECT ProgrectName, 'NativeSupply' AS Supplier,
       MAX(NativeSupply) AS 'SupplyNum'
FROM ProgrectDetail
GROUP BY ProgrectName
UNION ALL
SELECT ProgrectName, 'SouthSupply' AS Supplier,
       MAX(SouthSupply) AS 'SupplyNum'
FROM ProgrectDetail
GROUP BY ProgrectName
UNION ALL
SELECT ProgrectName, 'NorthSupply' AS Supplier,
       MAX(NorthSupply) AS 'SupplyNum'
FROM ProgrectDetail
GROUP BY ProgrectName


3.jpg

用UNPIVOT 实现如下:


SELECT ProgrectName,Supplier,SupplyNum
FROM  
(
   SELECT ProgrectName, OverseaSupply, NativeSupply,
          SouthSupply, NorthSupply
    FROM ProgrectDetail
)T
UNPIVOT  
(
   SupplyNum FOR Supplier IN
   (OverseaSupply, NativeSupply, SouthSupply, NorthSupply )
) P




相关文章
|
SQL 数据库
SQL面试50题------(初始化工作、建立表格)
这篇文章提供了SQL面试中可能会遇到的50道题目的建表和初始化数据的SQL脚本,包括学生、教师、课程和成绩表的创建及数据插入示例。
SQL面试50题------(初始化工作、建立表格)
sql面试50题------(1-10)
这篇文章提供了SQL面试中的前10个问题及其解决方案,包括查询特定条件下的学生信息、教师信息和课程成绩等。
sql面试50题------(1-10)
|
SQL 机器学习/深度学习 数据挖掘
【Uber 面试真题】SQL :每个星期连续5星评价最多的司机
本文是【SQL周周练】系列的第一篇,作者“蒋点数分”分享了一道来自Uber面试的真题及其解法。题目要求找出每周连续获得5星好评最多的司机ID。文章详细解析了利用SQL窗口函数解决“连续”问题的思路,并通过Python和NumPy生成模拟数据,最终提供Hive SQL解答方案。后续还将涉及Streamlit应用、时间序列分析、AB实验设计等内容,欢迎关注。
356 16
|
数据采集 Java Linux
面试大神教你:如何巧妙回答线程优先级这个经典考题?
大家好,我是小米。本文通过故事讲解Java面试中常见的线程优先级问题。小明和小华的故事帮助理解线程优先级:高优先级线程更可能被调度执行,但并非越高越好。实际开发需权衡业务需求,合理设置优先级。掌握线程优先级不仅能写出高效代码,还能在面试中脱颖而出。最后,小张因深入分析成功拿下Offer。希望这篇文章能助你在面试中游刃有余!
288 4
面试大神教你:如何巧妙回答线程优先级这个经典考题?
|
SQL 缓存 监控
大厂面试高频:4 大性能优化策略(数据库、SQL、JVM等)
本文详细解析了数据库、缓存、异步处理和Web性能优化四大策略,系统性能优化必知必备,大厂面试高频。关注【mikechen的互联网架构】,10年+BAT架构经验倾囊相授。
大厂面试高频:4 大性能优化策略(数据库、SQL、JVM等)
|
关系型数据库 MySQL 网络安全
5-10Can't connect to MySQL server on 'sh-cynosl-grp-fcs50xoa.sql.tencentcdb.com' (110)")
5-10Can't connect to MySQL server on 'sh-cynosl-grp-fcs50xoa.sql.tencentcdb.com' (110)")
|
SQL 存储 监控
SQL Server的并行实施如何优化?
【7月更文挑战第23天】SQL Server的并行实施如何优化?
956 13
解锁 SQL Server 2022的时间序列数据功能
【7月更文挑战第14天】要解锁SQL Server 2022的时间序列数据功能,可使用`generate_series`函数生成整数序列,例如:`SELECT value FROM generate_series(1, 10)。此外,`date_bucket`函数能按指定间隔(如周)对日期时间值分组,这些工具结合窗口函数和其他时间日期函数,能高效处理和分析时间序列数据。更多信息请参考官方文档和技术资料。
647 9
sql面试50题------(11-20)
这篇文章提供了SQL面试中的50道题目,其中详细解释了11至20题,包括查询与学号为“01”的学生所学课程相同的学生信息、不及格课程的学生信息、各科成绩统计以及学生的总成绩排名等问题的SQL查询语句。
|
SQL 存储 网络安全
关系数据库SQLserver 安装 SQL Server
【7月更文挑战第26天】
396 6