胖子哥的大数据之路(9)-数据仓库金融行业数据逻辑模型FS-LDM

简介: 引言:   大数据不是海市蜃楼,万丈高楼平地起只是意淫,大数据发展还要从点滴做起,基于大数据构建国家级、行业级数据中心的项目会越来越多,大数据只是技术,而非解决方案,同样面临数据组织模式,数据逻辑模式的问题。

引言:

  大数据不是海市蜃楼,万丈高楼平地起只是意淫,大数据发展还要从点滴做起,基于大数据构建国家级、行业级数据中心的项目会越来越多,大数据只是技术,而非解决方案,同样面临数据组织模式,数据逻辑模式的问题。它山之石可以攻玉,本文就数据仓库领域数据逻辑模型建设最负盛名的FS-LDM进行介绍,旨在抛砖引玉,希望能够给大家以启迪。参与交流请加群:347018601

一、概述

(1)什么是LDM

  逻辑数据模型LDM是数据仓库的数据建设阶段为解决业务需求而定义的数据仓库模型解决方案,它是指导数据仓库进行数据存放、数据组织、以及如何支持应用的蓝图,定义需要追踪和管理的各种重要实体、属性、关系。

(2)为什么需要LDM

  操作型数据库和数据仓库都需要的数据组织模式;

  LDM是构建DW的第一步,是建立BI的基础框架,是提供价值数据分析的重要基础,为复杂的DW系统实施提供了规范和基础结构的蓝图;

  LDM促进业务部门和IT分析人员之间的有效沟通,形成对重要业务定义和术语的统一认识。具备跨部门、中性的特征,能够表达所有的业务;

(3)主流LDM有哪些

  Teradata FS-LDM(金融服务逻辑数据模型):是预先构建的LDM,利用它可以直接开始数据仓库模型设计,它是一个成熟的产品;

  IBM有BDWM(Banking Data Warehouse Model);

二、FS-LDM 金融11个主题模型

1.团体 PARTY
是指银行作为一个金融机构所服务的任意对象和感兴趣进行分析的各种对象。如个人、公司客户、潜在客 户、代理机构、合作伙伴、雇员、分行、部门等。一个团体可以同时是这当中许多种角色。借助团体主题的建立可以实现基于客户基本信息的分析,是实现以客户为 中心的各种分析应用的重要基础。


2.资产 ASSET
用于描述团体的资产,资产主题包含两大类的资产,客户资产和建行自有资产。一个资产可以被多个团体所拥有,一个团体可以与多个资产有关。资产可分为实物资 产、金融资产与无形资产。客户资产信息的来源很多情况下是在客户申请贷款时所提供的各种担保品信息、抵质押品信息等。本主题可以存放从业务系统能够取得到 的所有的客户资产或建行自有资产,可以房地产、存货、机动车辆、在其他金融机构的存款。


3.地域 LOCATION
地域信息存储了希望观察和分析的任何区域,既包括传统类型的地址信息(如区县、街道),又包括如电话、电子邮箱等电子地址信息。


4.产品 PRODUCT
产品(Product):指为拓展市场占有率,满足客户更广泛需求而制定的可营销的交易品种的集合,产品是金融机构向用户销售的或提供给客户所使用的服务。如果有必要,可以包括竞争对手所提供的产品


5.协议 AGREEMENT
是金融机构与团体之间针对某种特定产品或服务而签立的契约关系,它可以是多样化的,如帐户、客户和银行签订的合同等。当金融机构与客户之间针对某种产品或 服务的条款和条件达成协议时,一个协议(AGREEMENT)就会被开立,因此协议是客户和银行往来的重要载体。协议主题与很多应用有关,如:风险敞口的 计算、不同种类协议的评级、资产负债的缺口分析、客户和银行的往来情况(客户贡献、客户买的什么产品、何时购买的产品)等。


6.事件 EVENT
是一个范围很广义的概念,可以记录各种与银行相关的活动的详细情况。既可以与资金相关,也可以与资金无关;既可以有客户参与,也可以没有客户参与;既可以 与帐户相关,也可以与帐户无关;可以由客户发起,也可以由银行发起。总之它可以记录的范围非常广泛,可以记录各种与银行相关的活动的详细情况,包括交易数 据,比如存款、提款、付款、收取信用卡年费、计算利息和费用、投诉、查询产品、查询地址、查询余额、网上交易等。


7.营销活动 CAMPAIGN
营销活动是银行对客户开展的一系列的促销事件以及相应的策略和规划活动的组合,是为了获取、维护、增强金融机构与客户的关系而开展的,其目的可能是为推广某些产品,也可能是为了树立市场形象。


8.渠道 CHANNEL
渠道是银行与客户进行交互和接触的手段和方法,通过它客户与银行进行接触、购买产品、使用服务并交流信息。渠道一般包括ATM、分行柜台、电话、POS、呼叫中心、电视、广播、报纸、网络、信件等。

 

9.财务 FINANCE
主要包括银行的总帐信息,是描述科目组织、控制、内部核算等银行核心科目帐务以及预算管理有关的内容。该主题抽象地描述了银行内部帐务的组织模式,能够适应不同的科目组织体系。

 

10.申请 APPLICATION
申请是一个团体表达与银行建立关系的意图。在团体(或申请者)满足银行的接收标准前,这种意图并不足以建立关系。本主题记录一个团体向银行提交的申请信息以及申请的状态、团体和申请关系历史、申请和资产关系历史、银行对申请的评分等信息。


11.模型 MODEL
存储与模型细节相关的信息类,包括模型细节(模型名称、创建时间等等)、模型指标以及团体、渠道、产品的评分和细分。模型可以有多次运行;一个模型和另一个模型可以有多种关系;模型有多个结果值。

三、模型结构图(7.0版本)

四、工作规划

  大数据不是海市蜃楼,大数据时代带来的技术变革和数据存储技术对传统的数据仓库带来了挑战和机遇,构建大数据时代的数据仓库架构将从数据逻辑模型开始,基本的一个想法是参照传统模式下,做的最好的数据仓库体系,以结合行业应用的模式,进行数据逻辑模型的设计与重构。

  

 


作者:张子良
出处:http://www.cnblogs.com/hadoopdev
本文版权归作者所有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
1月前
|
机器学习/深度学习 数据可视化 数据挖掘
探索大数据时代的关键技术:数据挖掘、可视化和数据仓库
探索大数据时代的关键技术:数据挖掘、可视化和数据仓库
213 0
|
1月前
|
SQL 存储 分布式计算
【大数据技术Hadoop+Spark】Hive数据仓库架构、优缺点、数据模型介绍(图文解释 超详细)
【大数据技术Hadoop+Spark】Hive数据仓库架构、优缺点、数据模型介绍(图文解释 超详细)
460 0
|
1月前
|
分布式计算 运维 数据挖掘
MaxCompute是一个强大的云数据仓库服务
【4月更文挑战第1天】MaxCompute是一个强大的云数据仓库服务
52 1
|
5天前
|
存储 分布式计算 大数据
数据仓库与数据湖在大数据架构中的角色与应用
在大数据时代,数据仓库和数据湖分别以结构化数据管理和原始数据存储见长,共同助力企业数据分析。数据仓库通过ETL处理支持OLAP查询,适用于历史分析、BI报表和预测分析;而数据湖则存储多样化的原始数据,便于数据探索和实验。随着技术发展,湖仓一体成为趋势,融合两者的优点,如Delta Lake和Hudi,实现数据全生命周期管理。企业应根据自身需求选择合适的数据架构,以释放数据潜力。【6月更文挑战第12天】
27 5
|
1月前
|
存储 数据采集 分布式计算
构建MaxCompute数据仓库的流程
【4月更文挑战第1天】构建MaxCompute数据仓库的流程
43 2
|
1月前
|
分布式计算 大数据 Hadoop
数据仓库(13)大数据数仓经典最值得阅读书籍推荐
从事数仓工作,在工作学习过程也看了很多数据仓库方面的数据,此处整理了数仓中经典的,或者值得阅读的书籍,推荐给大家一下,希望能帮助到大家。建议收藏起来,后续有新的书籍清单会更新到这里。
314 2
数据仓库(13)大数据数仓经典最值得阅读书籍推荐
|
1月前
|
存储 监控 大数据
数据仓库(11)什么是大数据治理,数据治理的范围是哪些
什么是数据治理,数据治理包含哪些方面?大数据时代的到来,给了我们很多的机遇,也有很多的挑战。最基础的调整也是大数据的计算和管理,数据治理是一个特别重要的大数据基础,他保证着数据能否被最好的应用,保证着数据的安全,治理等。那么数据治理到底能治什么,怎么治?
102 0
|
SQL 存储 分布式计算
「大数据系列」:Apache Hive 分布式数据仓库项目介绍
「大数据系列」:Apache Hive 分布式数据仓库项目介绍
|
分布式计算 MaxCompute
《基于阿里云MaxCompute构建企业云数据仓库CDW的最佳实践建议》电子版地址
基于阿里云MaxCompute构建企业云数据仓库CDW的最佳实践建议
246 0
《基于阿里云MaxCompute构建企业云数据仓库CDW的最佳实践建议》电子版地址
|
分布式计算 MaxCompute
《基于阿里云MaxCompute 构建企业云数据仓库CDW的最佳实践建议》电子版地址
基于阿里云MaxCompute 构建企业云数据仓库CDW的最佳实践建议
205 0
《基于阿里云MaxCompute 构建企业云数据仓库CDW的最佳实践建议》电子版地址

热门文章

最新文章