滴滴2020年面试题:如何找出最小的N个数?

简介:

【题目】

“学生表”里记录了学生的学号、入学时间等信息。“成绩表”里是学生选课成绩的信息。两个表中的学号一一对应。(滴滴2020年面试题)

现在需要:

  1. 筛选出2017年入学的“计算机”专业年龄最小的3位同学名单(姓名、年龄)
  2. 统计每个班同学各科成绩平均分大于80分的人数和人数占比

【解题思路】

问题1:筛选出2017年入学的“计算机”专业年龄最小的3位同学名单(姓名、年龄)

一看是不是有点懵?

别着急,我们用逻辑树分析方法,把这个复杂问题拆解为一个一个可以解决的简单问题:

1)筛选条件:入学时间是2017,专业是计算机

2)最小的3位同学名单(姓名、年龄)

1.先找出符合要求的同学

筛选条件:入学时间是2017,专业是计算机。year(日期)函数用来获取日期的年份

select 姓名,年龄
from 学生表
where 专业='计算机' and year(入学时间)=2017;

2.最小的3位同学名单(姓名、年龄)

先使用order by对年龄排序(从小到大,也就是升序asc),然后使用limit输出前3行数据,就是年龄最小的3位。

select 姓名,年龄
from 学生表
where 专业='计算机' and year(入学时间)=2017
order by 年龄 asc
limit 3;

问题2:统计每个班同学各科成绩平均分大于80分的人数和人数占比

一看是不是有点懵?

别着急,我们用逻辑树分析方法,把这个复杂问题拆解为一个一个可以解决的简单问题:

(1)每位同学的平均成绩

(2)平均分大于80分的人数

(3)平均分大于80分的人数占比

(4)输出结果是班级,平均分大于80分的人数,平均分大于80分的人数占比

  1. 每位同学的平均成绩

涉及到“每个”的时候,就要想到《猴子 从零学会sql》里的分组汇总了。按学号分组(group by),然后求平均成绩(avg函数),把所得结果看做临时表。

select 学号,avg(分数) as 平均成绩
from 成绩表
group by 学号;

2.平均成绩>80的人数

可以使用使用sum函数和case表达式来统计平均成绩大于80的人数

select sum(
case when 平均成绩>80 then 1

                 else 0 

end) as 人数
from 临时表;

下图是case和sum结合起来统计人数的sql过程:

3.平均成绩大于80分的人数占比

平均成绩>80的人数占比 =(平均成绩>80的人数)/ 总人数

总人数是表行数:count(学号)。所以平均成绩>80的人数占比就是:

select sum(
case when 平均成绩>80 then 1

                 else 0 

end)/count(学号) as 人数占比
from 临时表;

  1. 输出结果是班级、人数、人数占比

班级在“学生表”中,这涉及到需要将“学生表”和“临时表”2张表,需要用到多表联结。联结两表的是“学号”,如下:

因为要保留“学生表”班级的全部数据,所以使用左联结。
select a.班级
from 学生表 as a
left join 临时表 as b
on a.学号=b.学号
group by 班级;

题目要求是输出班级、人数、人数占比,所以在上面sql中加入输出的列名:

select a.班级,人数,人数占比
from 学生表 as a
left join 临时表 as b
on a.学号=b.学号
group by 班级;

select子句中的人数、人数占比在前面第1步、第2步中已经得到,套入这个sql语句中就是:

最终sql如下:

select a.班级,
sum(
case when b.平均成绩>80 then 1
else 0 end) as 人数,
sum(
case when b.平均成绩>80 then 1
else 0 end)/count(a.学号) as 人数占比
from 学生表 as a left join(
select 学号,avg(分数) as 平均成绩
from 成绩表
group by 学号
) as b
on a.学号=b.学号
group by 班级

【本题考点】

1.使用逻辑树分析方法将复杂问题变成简单问题的能力

2.当遇到“每个”问题的时候,要想到用分组汇总

3.查询最小n个数据的问题:先排序(order by),然后使用limit取出前n行数据

4.遇到有筛选条件的统计数量问题时,使用case表达式筛选出符合条件的行为1,否则为0。然后用汇总函数(sum)对case表达式输出列求和。

有筛选条件的统计数量问题的万能模板

select sum(
case when <判断表达式> then 1

   else 0

end
) as 数量
from 信息表;

【举一反三】

1.查询最小/最大的N个数据的问题

某网站有购买记录表,找出消费最大的2名顾客,输出顾客ID和消费金额

select 顾客ID,消费金额
from 购买记录表
order by 消费金额 desc
limit 2;

  1. 分组汇总问题

某网站有顾客表和消费表,请统计每个城市的顾客平均消费在1000元以上的人数,输出城市,人数

select a.城市,
sum(
case when b.平均消费>1000 then 1
else 0 end) as 人数
from 顾客表 as a left join(
select ID,avg(消费金额) as 平均消费
from 消费表
group by ID
) as b
on a.ID=b.ID
group by 城市;

推荐:如何从零学会sql?

相关文章
剑指Offer LeetCode 面试题40. 最小的k个数
剑指Offer LeetCode 面试题40. 最小的k个数
120 0
|
SQL 存储 关系型数据库
滴滴面试:明明 mysql 加的是 行锁,怎么就变 表锁 了?
滴滴面试:明明 mysql 加的是 行锁,怎么就变 表锁 了?
|
存储 缓存 关系型数据库
滴滴面试:单表可以存200亿数据吗?单表真的只能存2000W,为什么?
40岁老架构师尼恩在其读者交流群中分享了一系列关于InnoDB B+树索引的面试题及解答。这些问题包括B+树的高度、存储容量、千万级大表的优化、单表数据量限制等。尼恩详细解释了InnoDB的存储结构、B+树的磁盘文件格式、索引数据结构、磁盘I/O次数和耗时,以及Buffer Pool缓存机制对性能的影响。他还提供了实际操作步骤,帮助读者通过元数据找到B+树的高度。尼恩强调,通过系统化的学习和准备,可以大幅提升面试表现,实现“offer直提”。相关资料和PDF可在其公众号【技术自由圈】获取。
|
消息中间件 监控 Java
滴滴面试:谈谈你对Netty线程模型的理解?
Netty 线程模型是指 Netty 框架为了提供高性能、高并发的网络通信,而设计的管理和利用线程的策略和机制。 **Netty 线程模型被称为 Reactor(响应式)模型/模式,它是基于 NIO 多路复用模型的一种升级,它的核心思想是将 IO 事件和业务处理进行分离,使用一个或多个线程来执行任务的一种机制。** ## 1.**Reactor三大组件** Reactor 包含以下三大组件: ![image.png](https://cdn.nlark.com/yuque/0/2024/png/92791/1717079218890-89000a00-48bc-4a1a-b87e-e1b6
394 2
|
XML 前端开发 Android开发
Android架构设计——MVC,滴滴 战略 面试
Android架构设计——MVC,滴滴 战略 面试
|
缓存 前端开发 JavaScript
蚂蚁、字节、滴滴面试经历总结(都已过)
在文章里我不仅会列出面试题,还会给到一些答题建议,个人能力有限,也不能保证我回答都正确,如果有错误,希望能纠正我。
551 0
蚂蚁、字节、滴滴面试经历总结(都已过)
|
算法 C++ 容器
剑指Offer - 面试题40:最小的k个数
剑指Offer - 面试题40:最小的k个数
206 0
|
前端开发 IDE Java
蚂蚁、字节、滴滴面试经历总结
vim 被誉为『编辑器之神』,与之同时代的 emacs 被誉为『神之编辑器』。可以看得出 vim 在编辑器的地位是很高的,得益于 vim 的指法,敲起代码来如行云流水。特别膜拜创始人创始出这么方便的敲代码的指法,这篇文章就是来带你入坑 vim 指法操作。
195 0
Leecode面试题40. 最小的k个数
Leecode面试题40. 最小的k个数
195 0