🚀游戏玩法分析 I
活动表 Activity:
+--------------+---------+
| Column Name | Type |
+--------------+---------+
| player_id | int |
| device_id | int |
| event_date | date |
| games_played | int |
+--------------+---------+
在 SQL 中,表的主键是 (player_id, event_date)。
这张表展示了一些游戏玩家在游戏平台上的行为活动。
每行数据记录了一名玩家在退出平台之前,当天使用同一台设备登录平台后打开的游戏的数目(可能是 0 个)。
查询每位玩家 第一次登录平台的日期。
查询结果的格式如下所示:
Activity 表:
+-----------+-----------+------------+--------------+
| player_id | device_id | event_date | games_played |
+-----------+-----------+------------+--------------+
| 1 | 2 | 2016-03-01 | 5 |
| 1 | 2 | 2016-05-02 | 6 |
| 2 | 3 | 2017-06-25 | 1 |
| 3 | 1 | 2016-03-02 | 0 |
| 3 | 4 | 2018-07-03 | 5 |
+-----------+-----------+------------+--------------+
Result 表:
+-----------+-------------+
| player_id | first_login |
+-----------+-------------+
| 1 | 2016-03-01 |
| 2 | 2017-06-25 |
| 3 | 2016-03-02 |
+-----------+-------------+
我自己的想法
1.首先按照 player_id 分组
2.然后对于每个组,选择最早的 event_date 作为每位玩家的第一次登录日期
3.最早的event_date,用到一个函数也就是min
4.代码如下
SELECT player_id, MIN(event_date) AS first_login FROM Activity GROUP BY player_id;
力扣更详细的描述解法:
如果您第一次使用带有类似 MIN() 的 GROUP BY,那么考虑一下从以下查询中可以获取什么样的聚合信息:
SELECT A.player_id FROM Activity A GROUP BY A.player_id;
这个查询的结果可能一开始并不令人兴奋:
+-----------+
| player_id |
+-----------+
| 1 |
| 2 |
| 3 |
+-----------+
但是,使用问题描述中的示例,一旦将行按 player_id 分组,实际上我们对于每个组(即每个 player_id)有以下信息:
1:
device_id: 2, 2
event_date: 2016-03-01, 2016-05-02
games_played: 5, 6
2:
device_id: 3
event_date: 2017-06-25
games_played: 1
3:
device_id: 1, 4
event_date: 2016-03-02, 2018-07-03
games_played: 0, 5
上面的拆分使得很清楚我们总共有三个组(每个不同的 player_id 对应一个组)。对于 player_id 值为 1、2 和 3 的玩家,我们分别有 2、1 和 2 个子组。我们使用的聚合函数将应用于每个组的子组值。由于我们对每个玩家的第一个登录日期感兴趣,所以我们将使用 MIN() 聚合函数来扫描每个组的 event_date 子组值,以找到最小的日期。每个组的最小值将作为报告的 first_login 值:
SELECT A.player_id, MIN(A.event_date) AS first_login FROM Activity A GROUP BY A.player_id;
🚀员工奖金
表:Employee
+-------------+---------+
| Column Name | Type |
+-------------+---------+
| empId | int |
| name | varchar |
| supervisor | int |
| salary | int |
+-------------+---------+
empId 是该表中具有唯一值的列。
该表的每一行都表示员工的姓名和 id,以及他们的工资和经理的 id。
表:Bonus
+-------------+------+
| Column Name | Type |
+-------------+------+
| empId | int |
| bonus | int |
+-------------+------+
empId 是该表具有唯一值的列。
empId 是 Employee 表中 empId 的外键(reference 列)。
该表的每一行都包含一个员工的 id 和他们各自的奖金。
编写解决方案,报告每个奖金 少于 1000
的员工的姓名和奖金数额。
以 任意顺序 返回结果表。
结果格式如下所示
示例 1:
输入:
Employee table:
+-------+--------+------------+--------+
| empId | name | supervisor | salary |
+-------+--------+------------+--------+
| 3 | Brad | null | 4000 |
| 1 | John | 3 | 1000 |
| 2 | Dan | 3 | 2000 |
| 4 | Thomas | 3 | 4000 |
+-------+--------+------------+--------+
Bonus table:
+-------+-------+
| empId | bonus |
+-------+-------+
| 2 | 500 |
| 4 | 2000 |
+-------+-------+
输出:
+------+-------+
| name | bonus |
+------+-------+
| Brad | null |
| John | null |
| Dan | 500 |
+------+-------+
思路:
1.首先,我们需要使用 LEFT JOIN 来将 Employee 表与 Bonus 表连接起来,以便获取每个员工的奖金信息
2.由于题目要求报告每个奖金少于 1000 的员工的姓名和奖金数额,我们需要找到奖金少于 1000 或者没有奖金的员工。
3.当然,左外连接的连接条件就是Employee.empId = Bonus.empId
4.但只有这个还远远不够,肯定还要有条件,我们能想象,只有左外连接后的情况是这样的
5.
6.我们还需要筛查,我们要b.bonus<1000的和b.bonus为null的,于是我们就可以用where条件去过滤了
7.那么条件肯定就是b.bonus < 1000 or bonus is null
8.这里要特别注意的是中间用的肯定是or,不能用and,如果要用and的话,意思是bonus小于1000和bonus为null都要满足,这是不可能的
10.所以代码如下
SELECT e.name, b.bonus FROM Employee e LEFT JOIN Bonus b ON e.empId = b.empId WHERE b.bonus < 1000 OR b.bonus IS NULL;
今天的每日一题就到这里啦,你学会了嘛