胖子哥的大数据之路(9)-数据仓库金融行业数据逻辑模型FS-LDM

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介:

引言:

  大数据不是海市蜃楼,万丈高楼平地起只是意淫,大数据发展还要从点滴做起,基于大数据构建国家级、行业级数据中心的项目会越来越多,大数据只是技术,而非解决方案,同样面临数据组织模式,数据逻辑模式的问题。它山之石可以攻玉,本文就数据仓库领域数据逻辑模型建设最负盛名的FS-LDM进行介绍,旨在抛砖引玉,希望能够给大家以启迪。参与交流请加群:347018601

一、概述

(1)什么是LDM

  逻辑数据模型LDM是数据仓库的数据建设阶段为解决业务需求而定义的数据仓库模型解决方案,它是指导数据仓库进行数据存放、数据组织、以及如何支持应用的蓝图,定义需要追踪和管理的各种重要实体、属性、关系。

(2)为什么需要LDM

  操作型数据库和数据仓库都需要的数据组织模式;

  LDM是构建DW的第一步,是建立BI的基础框架,是提供价值数据分析的重要基础,为复杂的DW系统实施提供了规范和基础结构的蓝图;

  LDM促进业务部门和IT分析人员之间的有效沟通,形成对重要业务定义和术语的统一认识。具备跨部门、中性的特征,能够表达所有的业务;

(3)主流LDM有哪些

  Teradata FS-LDM(金融服务逻辑数据模型):是预先构建的LDM,利用它可以直接开始数据仓库模型设计,它是一个成熟的产品;

  IBM有BDWM(Banking Data Warehouse Model);

二、FS-LDM 金融11个主题模型

1.团体 PARTY
是指银行作为一个金融机构所服务的任意对象和感兴趣进行分析的各种对象。如个人、公司客户、潜在客 户、代理机构、合作伙伴、雇员、分行、部门等。一个团体可以同时是这当中许多种角色。借助团体主题的建立可以实现基于客户基本信息的分析,是实现以客户为 中心的各种分析应用的重要基础。


2.资产 ASSET
用于描述团体的资产,资产主题包含两大类的资产,客户资产和建行自有资产。一个资产可以被多个团体所拥有,一个团体可以与多个资产有关。资产可分为实物资 产、金融资产与无形资产。客户资产信息的来源很多情况下是在客户申请贷款时所提供的各种担保品信息、抵质押品信息等。本主题可以存放从业务系统能够取得到 的所有的客户资产或建行自有资产,可以房地产、存货、机动车辆、在其他金融机构的存款。


3.地域 LOCATION
地域信息存储了希望观察和分析的任何区域,既包括传统类型的地址信息(如区县、街道),又包括如电话、电子邮箱等电子地址信息。


4.产品 PRODUCT
产品(Product):指为拓展市场占有率,满足客户更广泛需求而制定的可营销的交易品种的集合,产品是金融机构向用户销售的或提供给客户所使用的服务。如果有必要,可以包括竞争对手所提供的产品


5.协议 AGREEMENT
是金融机构与团体之间针对某种特定产品或服务而签立的契约关系,它可以是多样化的,如帐户、客户和银行签订的合同等。当金融机构与客户之间针对某种产品或 服务的条款和条件达成协议时,一个协议(AGREEMENT)就会被开立,因此协议是客户和银行往来的重要载体。协议主题与很多应用有关,如:风险敞口的 计算、不同种类协议的评级、资产负债的缺口分析、客户和银行的往来情况(客户贡献、客户买的什么产品、何时购买的产品)等。


6.事件 EVENT
是一个范围很广义的概念,可以记录各种与银行相关的活动的详细情况。既可以与资金相关,也可以与资金无关;既可以有客户参与,也可以没有客户参与;既可以 与帐户相关,也可以与帐户无关;可以由客户发起,也可以由银行发起。总之它可以记录的范围非常广泛,可以记录各种与银行相关的活动的详细情况,包括交易数 据,比如存款、提款、付款、收取信用卡年费、计算利息和费用、投诉、查询产品、查询地址、查询余额、网上交易等。


7.营销活动 CAMPAIGN
营销活动是银行对客户开展的一系列的促销事件以及相应的策略和规划活动的组合,是为了获取、维护、增强金融机构与客户的关系而开展的,其目的可能是为推广某些产品,也可能是为了树立市场形象。


8.渠道 CHANNEL
渠道是银行与客户进行交互和接触的手段和方法,通过它客户与银行进行接触、购买产品、使用服务并交流信息。渠道一般包括ATM、分行柜台、电话、POS、呼叫中心、电视、广播、报纸、网络、信件等。

 

9.财务 FINANCE
主要包括银行的总帐信息,是描述科目组织、控制、内部核算等银行核心科目帐务以及预算管理有关的内容。该主题抽象地描述了银行内部帐务的组织模式,能够适应不同的科目组织体系。

 

10.申请 APPLICATION
申请是一个团体表达与银行建立关系的意图。在团体(或申请者)满足银行的接收标准前,这种意图并不足以建立关系。本主题记录一个团体向银行提交的申请信息以及申请的状态、团体和申请关系历史、申请和资产关系历史、银行对申请的评分等信息。


11.模型 MODEL
存储与模型细节相关的信息类,包括模型细节(模型名称、创建时间等等)、模型指标以及团体、渠道、产品的评分和细分。模型可以有多次运行;一个模型和另一个模型可以有多种关系;模型有多个结果值。

三、模型结构图(7.0版本)

四、工作规划

  大数据不是海市蜃楼,大数据时代带来的技术变革和数据存储技术对传统的数据仓库带来了挑战和机遇,构建大数据时代的数据仓库架构将从数据逻辑模型开始,基本的一个想法是参照传统模式下,做的最好的数据仓库体系,以结合行业应用的模式,进行数据逻辑模型的设计与重构。

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
2月前
|
分布式计算 运维 数据挖掘
MaxCompute是一个强大的云数据仓库服务
【4月更文挑战第1天】MaxCompute是一个强大的云数据仓库服务
70 1
|
1月前
|
存储 分布式计算 大数据
数据仓库与数据湖在大数据架构中的角色与应用
在大数据时代,数据仓库和数据湖分别以结构化数据管理和原始数据存储见长,共同助力企业数据分析。数据仓库通过ETL处理支持OLAP查询,适用于历史分析、BI报表和预测分析;而数据湖则存储多样化的原始数据,便于数据探索和实验。随着技术发展,湖仓一体成为趋势,融合两者的优点,如Delta Lake和Hudi,实现数据全生命周期管理。企业应根据自身需求选择合适的数据架构,以释放数据潜力。【6月更文挑战第12天】
77 5
|
2月前
|
存储 机器学习/深度学习 数据采集
【专栏】在数字化时代,数据仓库和数据湖成为企业管理数据的关键工具
【4月更文挑战第27天】在数字化时代,数据仓库和数据湖成为企业管理数据的关键工具。数据仓库是经过规范化处理的结构化数据集合,适合支持已知业务需求;而数据湖存储原始多类型数据,提供数据分析灵活性。数据仓库常用于企业决策、财务分析,而数据湖适用于大数据分析、机器学习和物联网数据处理。企业需根据自身需求选择合适的数据存储方式,以挖掘数据价值并提升竞争力。理解两者异同对企业的数字化转型至关重要。
|
2天前
|
SQL
为什么使用odps.sql.groupby.skewindata = true优化后,逻辑执行计划会发生改变
为什么使用odps.sql.groupby.skewindata = true优化后,逻辑执行计划会发生改变
|
8天前
|
机器学习/深度学习 分布式计算 大数据
MaxCompute产品使用合集之表的物理存储量和逻辑存储量分别有什么意义
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
1月前
|
存储 SQL Cloud Native
云原生数据仓库AnalyticDB产品使用合集之热数据存储空间在什么地方查看
阿里云AnalyticDB提供了全面的数据导入、查询分析、数据管理、运维监控等功能,并通过扩展功能支持与AI平台集成、跨地域复制与联邦查询等高级应用场景,为企业构建实时、高效、可扩展的数据仓库解决方案。以下是对AnalyticDB产品使用合集的概述,包括数据导入、查询分析、数据管理、运维监控、扩展功能等方面。
|
1月前
|
Cloud Native 关系型数据库 MySQL
云原生数据仓库AnalyticDB产品使用合集之是否支持mysql_fdw 和clickhousedb_fdw外部数据包装器
阿里云AnalyticDB提供了全面的数据导入、查询分析、数据管理、运维监控等功能,并通过扩展功能支持与AI平台集成、跨地域复制与联邦查询等高级应用场景,为企业构建实时、高效、可扩展的数据仓库解决方案。以下是对AnalyticDB产品使用合集的概述,包括数据导入、查询分析、数据管理、运维监控、扩展功能等方面。
124 4
|
1月前
|
监控 Cloud Native 关系型数据库
云原生数据仓库AnalyticDB产品使用合集之如何更新、删除和导入AnalyticDBMySQL数据
阿里云AnalyticDB提供了全面的数据导入、查询分析、数据管理、运维监控等功能,并通过扩展功能支持与AI平台集成、跨地域复制与联邦查询等高级应用场景,为企业构建实时、高效、可扩展的数据仓库解决方案。以下是对AnalyticDB产品使用合集的概述,包括数据导入、查询分析、数据管理、运维监控、扩展功能等方面。
|
1月前
|
运维 Cloud Native 关系型数据库
云原生数据仓库AnalyticDB产品使用合集之一次性最多能查询多少条数据
阿里云AnalyticDB提供了全面的数据导入、查询分析、数据管理、运维监控等功能,并通过扩展功能支持与AI平台集成、跨地域复制与联邦查询等高级应用场景,为企业构建实时、高效、可扩展的数据仓库解决方案。以下是对AnalyticDB产品使用合集的概述,包括数据导入、查询分析、数据管理、运维监控、扩展功能等方面。
|
2月前
|
机器学习/深度学习 人工智能 大数据
AI时代Python金融大数据分析实战:ChatGPT让金融大数据分析插上翅膀
AI时代Python金融大数据分析实战:ChatGPT让金融大数据分析插上翅膀
245 6