求职指南!给数据开发的SQL面试准备路径!⛵

简介: 大量的数据科学职位需要精通 SQL,它也是数据分析师、数据科学家、数据建模岗最常考核的面试技能。在本篇内容中 ShowMeAI 将梳理汇总所有面试 SQL 问题,按照不同的主题构建练习专项块。
ad45180c99ca0673f527a3897ea5641f.png
💡 作者: 韩信子@ ShowMeAI
📘 数据分析实战系列https://www.showmeai.tech/tutorials/40
📘 AI 面试题库系列https://www.showmeai.tech/tutorials/48
📘 本文地址https://www.showmeai.tech/article-detail/342
📢 声明:版权所有,转载请联系平台与作者并注明出处
📢 收藏 ShowMeAI查看更多精彩内容
7b7666bd6241617b30c5c142469235a2.png

大量的数据科学职位需要精通 SQL,它也是数据分析师、数据科学家、数据建模岗最常考核的面试技能。在本篇内容中 ShowMeAI 将梳理汇总所有面试 SQL 问题,按照不同的主题构建练习专项块,要求职的同学们可以按照对应板块内容进行专项击破与复习。

本篇内容借助于LeetCode平台,它是面试刷题演练的绝佳资源,内容覆盖大家熟知的数据结构算法和 SQL等。 LeetCode 将问题分为简单、中等和困难的难度级别,SQL板块的一个问题是它没有对它们做很好的分类,大家可以参考 ShowMeAI 在本篇的内容板块分类方式。

我们每个板块的内容都会指向 LeetCode 问题的对应链接,大家可以刷题和定向复习。

💡 学习计划时间表

我们建议最佳的节奏是1天一个板块,每天 2-4 个 SQL 问题(就如我们在下面划分的板块)。 这个节奏下你应该可以充分掌握并巩固对应的主题。

当然,如果你是资深玩家,可以跳过里面的基础板块,专注于更中级和高级的主题(比如第8,9,10天的内容)。

b573ca6fe663997e05c0669319af2dc8.png

对于 SQL 更详尽的内容,欢迎大家查阅ShowMeAI制作的速查表,快学快用:

💡 学习计划

💦 第1天:选择和过滤

这个板块主要针对 SQL 的SELECT语句,掌握使用它从一个或多个表中选择列字段,配合WHERE语句设定一个或多个条件。

💦 第2天:表关联

SQL中有 4 种主要的连接类型: INNER JOIN(或者 JOIN), LEFT JOIN / RIGHT JOIN, FULL OUTER JOIN, 和 CROSS JOIN

SQL中的UNION函数将两个或多个 select 语句的结果集组合成一个结果。

SQL UNION ALL函数保留重复的行。

💦 第3天:分组聚合

SQL中GROUP BY语句根据一列或多列的值对行进行分组,每组返回一行。分组之后可以对每个组执行聚合函数,例如 SUMCOUNT

💦 第4天:过滤分组

SQL HAVING子句为定义的组指定条件 GROUP BY. 这通常用于过滤由分组和聚合产生的行。

💦 第5天:CASE语句

SQL CASE语句判断符合的条件并返回该条件下对应的结果,类似在其他编程语言中的if语句。

💦 第6天:子查询

SQL 子查询是嵌套在另一个查询中的查询,我们可以把一个查询的结果,用到另一个查询中。

💦 第7天:更新&删除

SQL中的UPDATE语句用于更改表中的现有数据。

SQL中的DELETE语句用于从表中删除一行或多行。

💦 第8天:字符串处理

SQL中有很多字符串处理函数,例如UPPER, LOWER, CONCAT, GROUP_CONCAT, TRIM,以及正则表达式的使用。 熟悉一些常见的 SQL 字符串函数 📘在这里

💦 第9天:分析函数

SQL中

  • FIRST_VALUE()LAST_VALUE()分析函数分别返回一组有序值中的第一个值和最后一个值;
  • LAG()窗口函数提供对前一行或多行数据的访问;
  • LEAD()窗口函数提供对下一行或多行数据的访问。

对应考题

💦 第10天:窗口函数

常用&面试常考的RANK窗口函数是 ROW_NUMBER(), RANK(), DENSE_RANK()NTILE()

e9190f41b8de4af38c8a1a0c96f0513b~tplv-k3u1fbpfcp-zoom-1.image

目录
相关文章
|
5月前
|
SQL 人工智能 JSON
Flink 2.1 SQL:解锁实时数据与AI集成,实现可扩展流处理
简介:本文整理自阿里云高级技术专家李麟在Flink Forward Asia 2025新加坡站的分享,介绍了Flink 2.1 SQL在实时数据处理与AI融合方面的关键进展,包括AI函数集成、Join优化及未来发展方向,助力构建高效实时AI管道。
881 43
|
5月前
|
SQL 人工智能 JSON
Flink 2.1 SQL:解锁实时数据与AI集成,实现可扩展流处理
本文整理自阿里云的高级技术专家、Apache Flink PMC 成员李麟老师在 Flink Forward Asia 2025 新加坡[1]站 —— 实时 AI 专场中的分享。将带来关于 Flink 2.1 版本中 SQL 在实时数据处理和 AI 方面进展的话题。
360 0
Flink 2.1 SQL:解锁实时数据与AI集成,实现可扩展流处理
|
8月前
|
缓存 NoSQL 关系型数据库
美团面试:MySQL有1000w数据,redis只存20w的数据,如何做 缓存 设计?
美团面试:MySQL有1000w数据,redis只存20w的数据,如何做 缓存 设计?
美团面试:MySQL有1000w数据,redis只存20w的数据,如何做 缓存 设计?
|
6月前
|
SQL
SQL如何只让特定列中只显示一行数据
SQL如何只让特定列中只显示一行数据
|
10月前
|
SQL 自然语言处理 数据库
【Azure Developer】分享两段Python代码处理表格(CSV格式)数据 : 根据每列的内容生成SQL语句
本文介绍了使用Python Pandas处理数据收集任务中格式不统一的问题。针对两种情况:服务名对应多人拥有状态(1/0表示),以及服务名与人名重复列的情况,分别采用双层for循环和字典数据结构实现数据转换,最终生成Name对应的Services列表(逗号分隔)。此方法高效解决大量数据的人工处理难题,减少错误并提升效率。文中附带代码示例及执行结果截图,便于理解和实践。
277 4
|
6月前
|
SQL
SQL中如何删除指定查询出来的数据
SQL中如何删除指定查询出来的数据
|
6月前
|
SQL 关系型数据库 MySQL
SQL如何对不同表的数据进行更新
本文介绍了如何将表A的Col1数据更新到表B的Col1中,分别提供了Microsoft SQL和MySQL的实现方法,并探讨了多表合并后更新的优化方式,如使用MERGE语句提升效率。适用于数据库数据同步与批量更新场景。
|
8月前
|
SQL 数据挖掘 关系型数据库
【SQL 周周练】一千条数据需要做一天,怎么用 SQL 处理电表数据(如何动态构造自然月)
题目来自于某位发帖人在某 Excel 论坛的求助,他需要将电表缴费数据按照缴费区间拆开后再按月份汇总。当时用手工处理数据,自称一千条数据就需要处理一天。我将这个问题转化为 SQL 题目。
295 12
|
7月前
|
SQL DataWorks 数据管理
SQL血缘分析实战!数据人必会的3大救命场景
1. 开源工具:Apache Atlas(元数据管理)、Spline(血缘追踪) 2. 企业级方案:阿里DataWorks血缘分析、腾讯云CDW血缘引擎 3. 自研技巧:在ETL脚本中植入版本水印,用注释记录业务逻辑变更 📌 重点总结:
|
9月前
|
SQL 机器学习/深度学习 数据挖掘
【Uber 面试真题】SQL :每个星期连续5星评价最多的司机
本文是【SQL周周练】系列的第一篇,作者“蒋点数分”分享了一道来自Uber面试的真题及其解法。题目要求找出每周连续获得5星好评最多的司机ID。文章详细解析了利用SQL窗口函数解决“连续”问题的思路,并通过Python和NumPy生成模拟数据,最终提供Hive SQL解答方案。后续还将涉及Streamlit应用、时间序列分析、AB实验设计等内容,欢迎关注。
262 16