引言:
大数据不是海市蜃楼,万丈高楼平地起只是意淫,大数据发展还要从点滴做起,基于大数据构建国家级、行业级数据中心的项目会越来越多,大数据只是技术,而非解决方案,同样面临数据组织模式,数据逻辑模式的问题。它山之石可以攻玉,本文就数据仓库领域数据逻辑模型建设最负盛名的FS-LDM进行介绍,旨在抛砖引玉,希望能够给大家以启迪。参与交流请加群:347018601
一、概述
(1)什么是LDM
逻辑数据模型LDM是数据仓库的数据建设阶段为解决业务需求而定义的数据仓库模型解决方案,它是指导数据仓库进行数据存放、数据组织、以及如何支持应用的蓝图,定义需要追踪和管理的各种重要实体、属性、关系。
(2)为什么需要LDM
操作型数据库和数据仓库都需要的数据组织模式;
LDM是构建DW的第一步,是建立BI的基础框架,是提供价值数据分析的重要基础,为复杂的DW系统实施提供了规范和基础结构的蓝图;
LDM促进业务部门和IT分析人员之间的有效沟通,形成对重要业务定义和术语的统一认识。具备跨部门、中性的特征,能够表达所有的业务;
(3)主流LDM有哪些
Teradata FS-LDM(金融服务逻辑数据模型):是预先构建的LDM,利用它可以直接开始数据仓库模型设计,它是一个成熟的产品;
IBM有BDWM(Banking Data Warehouse Model);
二、FS-LDM 金融11个主题模型
1.团体 PARTY
是指银行作为一个金融机构所服务的任意对象和感兴趣进行分析的各种对象。如个人、公司客户、潜在客 户、代理机构、合作伙伴、雇员、分行、部门等。一个团体可以同时是这当中许多种角色。借助团体主题的建立可以实现基于客户基本信息的分析,是实现以客户为 中心的各种分析应用的重要基础。
2.资产 ASSET
用于描述团体的资产,资产主题包含两大类的资产,客户资产和建行自有资产。一个资产可以被多个团体所拥有,一个团体可以与多个资产有关。资产可分为实物资 产、金融资产与无形资产。客户资产信息的来源很多情况下是在客户申请贷款时所提供的各种担保品信息、抵质押品信息等。本主题可以存放从业务系统能够取得到 的所有的客户资产或建行自有资产,可以房地产、存货、机动车辆、在其他金融机构的存款。
3.地域 LOCATION
地域信息存储了希望观察和分析的任何区域,既包括传统类型的地址信息(如区县、街道),又包括如电话、电子邮箱等电子地址信息。
4.产品 PRODUCT
产品(Product):指为拓展市场占有率,满足客户更广泛需求而制定的可营销的交易品种的集合,产品是金融机构向用户销售的或提供给客户所使用的服务。如果有必要,可以包括竞争对手所提供的产品
5.协议 AGREEMENT
是金融机构与团体之间针对某种特定产品或服务而签立的契约关系,它可以是多样化的,如帐户、客户和银行签订的合同等。当金融机构与客户之间针对某种产品或 服务的条款和条件达成协议时,一个协议(AGREEMENT)就会被开立,因此协议是客户和银行往来的重要载体。协议主题与很多应用有关,如:风险敞口的 计算、不同种类协议的评级、资产负债的缺口分析、客户和银行的往来情况(客户贡献、客户买的什么产品、何时购买的产品)等。
6.事件 EVENT
是一个范围很广义的概念,可以记录各种与银行相关的活动的详细情况。既可以与资金相关,也可以与资金无关;既可以有客户参与,也可以没有客户参与;既可以 与帐户相关,也可以与帐户无关;可以由客户发起,也可以由银行发起。总之它可以记录的范围非常广泛,可以记录各种与银行相关的活动的详细情况,包括交易数 据,比如存款、提款、付款、收取信用卡年费、计算利息和费用、投诉、查询产品、查询地址、查询余额、网上交易等。
7.营销活动 CAMPAIGN
营销活动是银行对客户开展的一系列的促销事件以及相应的策略和规划活动的组合,是为了获取、维护、增强金融机构与客户的关系而开展的,其目的可能是为推广某些产品,也可能是为了树立市场形象。
8.渠道 CHANNEL
渠道是银行与客户进行交互和接触的手段和方法,通过它客户与银行进行接触、购买产品、使用服务并交流信息。渠道一般包括ATM、分行柜台、电话、POS、呼叫中心、电视、广播、报纸、网络、信件等。
9.财务 FINANCE
主要包括银行的总帐信息,是描述科目组织、控制、内部核算等银行核心科目帐务以及预算管理有关的内容。该主题抽象地描述了银行内部帐务的组织模式,能够适应不同的科目组织体系。
10.申请 APPLICATION
申请是一个团体表达与银行建立关系的意图。在团体(或申请者)满足银行的接收标准前,这种意图并不足以建立关系。本主题记录一个团体向银行提交的申请信息以及申请的状态、团体和申请关系历史、申请和资产关系历史、银行对申请的评分等信息。
11.模型 MODEL
存储与模型细节相关的信息类,包括模型细节(模型名称、创建时间等等)、模型指标以及团体、渠道、产品的评分和细分。模型可以有多次运行;一个模型和另一个模型可以有多种关系;模型有多个结果值。
三、模型结构图(7.0版本)
四、工作规划
大数据不是海市蜃楼,大数据时代带来的技术变革和数据存储技术对传统的数据仓库带来了挑战和机遇,构建大数据时代的数据仓库架构将从数据逻辑模型开始,基本的一个想法是参照传统模式下,做的最好的数据仓库体系,以结合行业应用的模式,进行数据逻辑模型的设计与重构。