每天一道大厂SQL题【Day24】华泰证券真题实战(六)

简介: 每天一道大厂SQL题【Day24】华泰证券真题实战(六)

第24题:

需求列表

编写一个脚本,代码可用python或pyspark或scala(40分)

需求:cust_pft是客户(cust_if)每天(date)的资产净值(pft),现在需要获得每个客户近1年的最大回撤:

最大回撤定义:在该客户的净值曲线中,当出现最大的净值的时点记为m1,这之后出现的净值比m1那天净值相差最大的净值记为m2,最大回撤就是(m2-m1)/m1.(注意是出现最大净值之后的最小净值,两者的差)

create or replace temporary view cust_pft (cust_id,date,pft)
as values
(1,‘2021-01-01’,10000),
(1,‘2021-01-02’,10010),
(1,‘2021-01-03’,10020),
(1,‘2021-01-04’,9999),
(1,‘2021-01-05’,9998),
(1,‘2021-01-06’,10020),
(1,‘2021-12-27’,6000),
(1,‘2021-12-28’,6001),
(1,‘2021-12-29’,6002);

思路分析

  • 使用MAX()函数计算最大回撤;
  • 使用子查询计算每个日期的价格、最高价格和回撤率;
  • 使用MAX() OVER()函数计算每个日期之前的最高价格;
  • 计算回撤率,并使用MAX()函数找到最大回撤。

答案获取

建议你先动脑思考,动手写一写再对照看下答案,如果实在不懂可以点击下方卡片,回复:大厂sql 即可。

参考答案适用HQL,SparkSQL,FlinkSQL,即大数据组件,其他SQL需自行修改。

加技术群讨论

点击下方卡片关注 联系我进群

或者直接私信我进群

文末SQL小技巧

提高SQL功底的思路。

1、造数据。因为有数据支撑,会方便我们根据数据结果去不断调整SQL的写法。

造数据语法既可以create table再insert into,也可以用下面的create temporary view xx as values语句,更简单。

其中create temporary view xx as values语句,SparkSQL语法支持,hive不支持。

2、先将结果表画出来,包括结果字段名有哪些,数据量也画几条。这是分析他要什么。

从源表到结果表,一路可能要走多个步骤,其实就是可能需要多个子查询,过程多就用with as来重构提高可读性。

3、要由简单过度到复杂,不要一下子就写一个很复杂的。

先写简单的select from table…,每个中间步骤都执行打印结果,看是否符合预期, 根据中间结果,进一步调整修饰SQL语句,再执行,直到接近结果表。

4、数据量要小,工具要快,如果用hive,就设置set hive.exec.mode.local.auto=true;如果是SparkSQL,就设置合适的shuffle并行度,set spark.sql.shuffle.partitions=4;

目录
相关文章
|
5月前
|
SQL 大数据 HIVE
每天一道大厂SQL题【Day25】脉脉真题实战(一)每日活跃用户
每天一道大厂SQL题【Day25】脉脉真题实战(一)每日活跃用户
50 0
|
5月前
|
SQL 大数据 HIVE
每天一道大厂SQL题【Day27】脉脉真题实战(三)连续两天活跃用户
每天一道大厂SQL题【Day27】脉脉真题实战(三)连续两天活跃用户
37 0
|
11天前
|
SQL 自然语言处理 数据库
NL2SQL实践系列(2):2024最新模型实战效果(Chat2DB-GLM、书生·浦语2、InternLM2-SQL等)以及工业级案例教学
NL2SQL实践系列(2):2024最新模型实战效果(Chat2DB-GLM、书生·浦语2、InternLM2-SQL等)以及工业级案例教学
NL2SQL实践系列(2):2024最新模型实战效果(Chat2DB-GLM、书生·浦语2、InternLM2-SQL等)以及工业级案例教学
|
15天前
|
SQL 数据库
数据库SQL语言实战(二)
数据库SQL语言实战(二)
|
22天前
|
SQL 存储 关系型数据库
【MySQL实战笔记】02.一条SQL更新语句是如何执行的-2
【4月更文挑战第5天】两阶段提交是为确保`redo log`和`binlog`逻辑一致,避免数据不一致。若先写`redo log`, crash后数据可能丢失,导致恢复后状态错误;若先写`binlog`,crash则可能导致重复事务,影响数据库一致性。一天一备相较于一周一备,能缩短“最长恢复时间”,但需权衡额外的存储成本。
16 1
|
4月前
|
SQL 数据挖掘 数据库
SQL数据分析实战:从导入到高级查询的完整指南
SQL数据分析实战:从导入到高级查询的完整指南
62 0
|
5月前
|
SQL 大数据 HIVE
每天一道大厂SQL题【Day26】脉脉真题实战(二)活跃时长的均值
每天一道大厂SQL题【Day26】脉脉真题实战(二)活跃时长的均值
24 0
|
5月前
|
SQL 大数据 HIVE
每天一道大厂SQL题【Day23】华泰证券真题实战(五)
每天一道大厂SQL题【Day23】华泰证券真题实战(五)
28 0
|
5月前
|
SQL 大数据 HIVE
每天一道大厂SQL题【Day22】华泰证券真题实战(四)
每天一道大厂SQL题【Day22】华泰证券真题实战(四)
41 0
|
19天前
|
SQL 人工智能 算法
【SQL server】玩转SQL server数据库:第二章 关系数据库
【SQL server】玩转SQL server数据库:第二章 关系数据库
61 10