【数据挖掘】恒生金融有限公司2023届秋招数据ETL工程师笔试题解析

本文涉及的产品
阿里云百炼推荐规格 ADB PostgreSQL,4核16GB 100GB 1个月
简介: 恒生科技2022年9月24号数据ETL工程师岗位的笔试题目及答案汇总,包括了SQL选择题、SQL编程题和业务应用SQL编程题,涵盖了数据库基础知识、SQL语句编写以及数据仓库概念等多个方面。

公司:恒生科技

笔试时间:2022年9月24号

岗位:数据ETL工程师

时间:120分钟

1 不定项选择题

1、SQL 修改表结构的关键词是

A. alter
B. create
C. desc
D. rename

答案:A

2、正确的是

A. 一个表中,主键可以唯标识一行记录
B. 一个事务中的某条sql 命提交时,其他sql命令可以不提交
C. 一个关系表的外键必定是另一个表的主键
D. 回滚可以在任务失败时,回到操作是五千的数据状态

答案:A,C,D

解析:

B错误

4、数据集市和数据仓库的区别

解析:

(1)数据仓库:基于整个企业的数据模型建立,面向企业范围内的主题;
数据集市:按照某一特定部门的数据模型建立的,由于每个部门有自己特定的需求,因此,他们对数据集市的期望也不同。 部门主题与企业主题之间可能存在关联,也可能不存在。

(2)数仓存储整个企业内非常详细的数据;数据集市数据详细程度低一些,包含概要和综合数据多一些。
(3)数据集市的数据组织一般采用星形模型。大型数仓的数据组织,星形或雪花形都可以。
(4)数据集市较少保留历史数据。

6、正确的是

A. 事务特性为原子性(Atomicity)、一致性(Consistency)、隔离性(Isolation)和持久性(Durability)
B. 可重复读会导致脏读
C. 序列化级别最高
D. SQL可以动态调整事务隔离级别

答案:A,C,D

7、为了检查查询,而又不增加数据的存储空间,常用的方法是创建

答案:视图

9、数据仓库常见的模型分为

A. 星型模型
B. 雪花型模型

答案:A,B

10、典型的元数据包括

A. 数据仓库的表结构
B. 数据仓库表的属性
C. 数据仓库的数据源
D. 源数据到数据仓库的映射
E. 数据模型的规格说明
F. 抽取日志
G. 访问数据的公共例行程序

答案:ABCDE是正确的,F,G不知道是否正确

解析:

元数据(Metadata)是关于数据的数据。在数据仓库系统中,元数据是描述数据仓库内数据的结构和建立方法的数据,可将其按用途的不同分为两类:技术元数据(Technical Metadata);业务元数据(Business Metadata)

技术元数据:
  技术元数据是存储关于数据仓库系统技术细节的数据,是用于开发和管理数据仓库使用的数据,它主要包括以下信息:数据仓库结构的描述,包括仓库模式、视图、维、层次结构和导出数据的定义,以及数据集市的位置和内容;业务系统、数据仓库和数据集市的体系结构和模式,汇总用的算法,包括度量和维定义算法,数据粒度、主题领域、聚集、汇总、预定义的查询与报告;由操作环境到数据仓库环境的映射,包括源数据和它们的内容、数据分割、数据提取、清理、转换规则和数据刷新规则、安全(用户授权和存取控制)。

业务元数据:
  业务元数据从业务角度描述了数据仓库中的数据,它提供了介于使用者和实际系统之间的语义层,使得不懂计算机技术的业务人员也能够“读懂”数据仓库中的数据。业务元数据主要包括以下信息:使用者的业务术语所表达的数据模型、对象名和属性名;访问数据的原则和数据的来源;系统所提供的分析方法以及公式和报表的信息;具体包括以下信息:

企业概念模型:这是业务元数据所应提供的重要的信息,它表示企业数据模型的高层信息、整个企业的业务概念和相互关系。以这个企业模型为基础,不懂数据库技术和SQL语句的业务人员对数据仓库中的数据也能做到心中有数。
多维数据模型:这是企业概念模型的重要组成部分,它告诉业务分析人员在数据集市当中有哪些维、维的类别、数据立方体以及数据集市中的聚合规则。这里的数据立方体表示某主题领域业务事实表和维表的多维组织形式。业务概念模型和物理数据之间的依赖:以上提到的业务元数据只是表示出了数据的业务视图,这些业务视图与实际的数据仓库或数据库、多维数据库中的表、字段、维、层次等之间的对应关系也应该在元数据知识库中有所体现。

2 SQL编程题

1、连接查询

答案:

SELECT * FROM A JOIN B ON A.ID = B .ID

2、删除重复行,只保留一条记录

delete from 表名
where 
重复字段名 in (
     SELECT a.重复字段名from(
     select 重复字段名
     from 表名
     group by 重复字段名 having count(1) > 1
     ) a
 )
 and 
 id(只保留id最小的一个) not in (
 SELECT b.id from(
     select min(id) as id
     from 表名 
     group by 重复字段名 having count(1)>1
     ) b
 )

3、将竖表Table_A转换为横表Table_B
在这里插入图片描述

在这里插入图片描述

(1)方法一:聚合函数[max或sum]配合case语句

select 姓名,
sum (case 课程 when '语文' then 成绩 else 0 end) as 语文,
sum (case 课程 when '数学' then 成绩 else 0 end) as 数学,
sum (case 课程 when '英语' then 成绩 else 0 end) as 英语
from Table_A
group by 姓名

(2)方法二:使用pivot

select * from Table_A pivot (max(成绩)for 课程 in(语文,数学,英语)) 临时表

PIVOT用于将列值旋转为列名(即行转列),在SQL Server 2000可以用聚合函数配合CASE语句实现

PIVOT的一般语法是:PIVOT(聚合函数(列) FOR 列 in (…) )AS P

参考:https://www.cnblogs.com/liushen/p/3333936.html

3 业务应用SQL编程题

1、 理财数据库,表结构如下

在这里插入图片描述

说明:除了Fund表的余额Fbalance字段和Investment表的投资金额Iaccount字段为number,其他字段均视为字符串

(1)查询投资过600571的这个产品且单笔投资金额不少于10000的客户的客户号和名字且按姓名降序排列

(2)给Product表新增字段Pvalue,类型未字符串,长度为32位,不允许为空

(3)在投资流水表Investment中,新建客户号、经理人工号和产品代码的唯一索引

(4)为表彰业绩优秀的经理人,请查询投资600571这个产品投资金额在平均值以上的客户的经理人的工号和姓名,现在投在600571这个产品的客户要从自己的资金账户统一追加投资5000元,请操作相关的表。

解析:我自己写的答案,不保证正确性

1、SELECT  client.Cno,cilent.Cname FROM cilent JOIN Investment ON client.Cno = Client.Cno WHERE Investment.Iaccount>10000 AND Investment.Pno ='600571' ORDER BY Client.Cname DESC

2、ALTER TABLE Product add Pvalue char(32) NOT NULL

3、ALTER TABLE Investment ADD UNIQUE INDEX Investment_index (Cno,Mno,Pno)

4、SELECT Manager.Mno,Manager.Mname FROM Manager JOIN Investment WHERE Investment.Pnp = '600571' and Iaccount > (select AVG(Iaccount) FROM Investment GROUP BY Cno)

UPDATE Investment  SET Iaccount =  Iaccount+5000 WHERE Pno ='600571' 
UPDATE Found INNER JOIN Client ON Client.Fno = Found.Fno SET Fbalance  = Fbalance -5000 WHERE Clinent.Cno IN (SELECT Cno FROM Investment  WHERE Pno='600571' )

2、表结构如下

说明:TradeType:B–申购,S–赎回

TradeStatus:T–交易成功个,F–交易失败

TradeDate:格式为YYYYMMDD
在这里插入图片描述

回答下面问题

(1)请给用户表的用户ID增加一个唯一索引

(2)请按日统计2016年10月份各产品的交易金额(含失败),并按交易日期进行降序排序。

(3)将2016年10月31日的所有交易金额大于1000的交易状态更新为交易成功

(4)请列出所有购买过货币基金产品的客户姓名

(5)请列出2016年10鱼粉申购交易前10的产品

解析:我自己写的答案,不保证正确性

1、CREATE UNIQUE INDEX ID_index ON Users(ID)

2、SELECT Amount FROM TradeDetail WHERE month(TradeDate) = '10' and year(TradeDate)='2016' ORDER BY Amount DESC

3、UPDATE TradeDetail SET TradeStatus='T' WHERE TradeDate ='20161031' and Amount >1000

4、SELECT UserName FROM Users WHERE UserId in (SELECT UserId FROM TradeDetail JOIN Product ON TradeDetail.PrdNo = Product.PrdNo WHERE Product.PrdType='C')

5、SELECT PrdName FROM Product JOIN TradeDetail ON Product.PrdNo = TradeDate.PrdNo WHERE month(TradeDate)='10' and year(TradeDate)='2016'
目录
相关文章
|
1月前
|
机器学习/深度学习 数据采集 人工智能
从数据海洋中“淘金”——数据挖掘的魔法与实践
从数据海洋中“淘金”——数据挖掘的魔法与实践
60 13
|
2月前
|
数据采集 JSON 数据可视化
JSON数据解析实战:从嵌套结构到结构化表格
在信息爆炸的时代,从杂乱数据中提取精准知识图谱是数据侦探的挑战。本文以Google Scholar为例,解析嵌套JSON数据,提取文献信息并转换为结构化表格,通过Graphviz制作技术关系图谱,揭示文献间的隐秘联系。代码涵盖代理IP、请求头设置、JSON解析及可视化,提供完整实战案例。
207 4
JSON数据解析实战:从嵌套结构到结构化表格
|
2月前
|
JSON 监控 网络协议
Bilibili直播信息流:连接方法与数据解析
本文详细介绍了自行实现B站直播WebSocket连接的完整流程。解析了基于WebSocket的应用层协议结构,涵盖认证包构建、心跳机制维护及数据包解析步骤,为开发者定制直播数据监控提供了完整技术方案。
|
2月前
|
数据采集 传感器 算法
从数据中挖掘洞见:初探数据挖掘的艺术与科学
从数据中挖掘洞见:初探数据挖掘的艺术与科学
92 11
|
2月前
|
机器学习/深度学习 JSON 算法
淘宝拍立淘按图搜索API接口系列的应用与数据解析
淘宝拍立淘按图搜索API接口是阿里巴巴旗下淘宝平台提供的一项基于图像识别技术的创新服务。以下是对该接口系列的应用与数据解析的详细分析
|
4月前
|
存储 搜索推荐 大数据
数据大爆炸:解析大数据的起源及其对未来的启示
数据大爆炸:解析大数据的起源及其对未来的启示
270 15
数据大爆炸:解析大数据的起源及其对未来的启示
|
3月前
|
Java API 数据处理
深潜数据海洋:Java文件读写全面解析与实战指南
通过本文的详细解析与实战示例,您可以系统地掌握Java中各种文件读写操作,从基本的读写到高效的NIO操作,再到文件复制、移动和删除。希望这些内容能够帮助您在实际项目中处理文件数据,提高开发效率和代码质量。
71 4
|
2月前
|
缓存 监控 搜索推荐
【实战解析】smallredbook.item_get_video API:小红书视频数据获取与电商应用指南
本文介绍小红书官方API——`smallredbook.item_get_video`的功能与使用方法。该接口可获取笔记视频详情,包括无水印直链、封面图、时长、文本描述、标签及互动数据等,并支持电商场景分析。调用需提供`key`、`secret`和`num_iid`参数,返回字段涵盖视频链接、标题、标签及用户信息等。同时,文章提供了电商实战技巧,如竞品监控与个性化推荐,并列出合规注意事项及替代方案对比。最后解答了常见问题,如笔记ID获取与视频链接时效性等。
|
4月前
|
JSON 前端开发 搜索推荐
关于商品详情 API 接口 JSON 格式返回数据解析的示例
本文介绍商品详情API接口返回的JSON数据解析。最外层为`product`对象,包含商品基本信息(如id、name、price)、分类信息(category)、图片(images)、属性(attributes)、用户评价(reviews)、库存(stock)和卖家信息(seller)。每个字段详细描述了商品的不同方面,帮助开发者准确提取和展示数据。具体结构和字段含义需结合实际业务需求和API文档理解。
|
3月前
|
数据采集 前端开发 API
SurfGen爬虫:解析HTML与提取关键数据
SurfGen爬虫:解析HTML与提取关键数据

推荐镜像

更多