数据仓库专题20-案例篇:电商领域数据主题域模型设计v0.2(改进意见征集中)

简介: 一、电商分类(平台+自营+复合) (1)平台型电商:淘宝+天猫+百度Mall等; (2)自营型电商:        2.1 综合型:京东(早期)+当当(早期);        2.2 垂直型:好像这种类型越来越少了;  (3)复合型电商(平台+自营):京东+当当+亚马逊等;  二、平台...

一、电商分类(平台+自营+复合)

 (1)平台型电商:淘宝+天猫+百度Mall等;

 (2)自营型电商:

        2.1 综合型:京东(早期)+当当(早期);

        2.2 垂直型:好像这种类型越来越少了;

 (3)复合型电商(平台+自营):京东+当当+亚马逊等;

 二、平台型电商特点(三无+两有+一核心)

 (1)三无:无商品、无库存、无物流;

 (2)两有:有钱+有人;

 (3)一核心:数据

三、主题域模型-L0级:v.1

 

 

 

四、主题域模型-L1级:v0.1

 

五、主题域模型划分要点

主题域模型设计要点:
1.对标法;
2.归纳法;
以上两种方法都会面临同样的问题,即数据主题域划分的依据和可信度问题。如果针对 熟悉的行业或者相对成熟的行业领域,其实对标法,足够结果问题。而如果是非专业领域,则建议前期不必追究,后续逐步完善的应对策略。在没有对数据进行深入 分析的时候,主题域的分类,肯定是会有问题。即:
1.成熟领域(熟悉):直接对标;
2.非常熟(熟悉)领域:总结归纳,逐步、迭代完善。

 

六、数据分类体系

 1.领域:domain

 2.主题域:subject area;

 3.主题:Topic;

七、未完待续

   未完待续,意见征集中,欢迎回复留言,如果对于分布式数据仓库建设有兴趣,可加群:

分布式数据仓库建模 398419457;
 

 


作者:张子良
出处:http://www.cnblogs.com/hadoopdev
本文版权归作者所有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。

相关文章
|
3月前
|
JSON 数据管理 关系型数据库
【Dataphin V3.9】颠覆你的数据管理体验!API数据源接入与集成优化,如何让企业轻松驾驭海量异构数据,实现数据价值最大化?全面解析、实战案例、专业指导,带你解锁数据整合新技能!
【8月更文挑战第15天】随着大数据技术的发展,企业对数据处理的需求不断增长。Dataphin V3.9 版本提供更灵活的数据源接入和高效 API 集成能力,支持 MySQL、Oracle、Hive 等多种数据源,增强 RESTful 和 SOAP API 支持,简化外部数据服务集成。例如,可轻松从 RESTful API 获取销售数据并存储分析。此外,Dataphin V3.9 还提供数据同步工具和丰富的数据治理功能,确保数据质量和一致性,助力企业最大化数据价值。
170 1
|
机器学习/深度学习 分布式计算 并行计算
大数据开发,如何发掘数据的关系?
数据之中蕴藏关系,数据量足够大,这种关系越逼近真实世界客观规律。 网页之间链接关系蕴藏着网页重要性排序关系,购物车商品清单蕴藏着商品关联关系,通过对这些关系的挖掘,可帮助我们更清晰世界规律,并利用规律提高生产效率,改造世界。
116 0
|
数据采集 存储 监控
电商项目之数据治理流程分析|学习笔记
快速学习电商项目之数据治理流程分析
电商项目之数据治理流程分析|学习笔记
|
数据采集 存储 算法
数据仓库之数据质量建设(深度好文)(一)
数仓建设真正的难点不在于数仓设计,而在于后续业务发展起来,业务线变的庞大之后的数据治理,而数据治理的范围非常广,包含数据本⾝的管理、数据安全、数据质量、数据成本等。在这么多治理内容中,大家想下最重要的治理是什么?当然是数据质量治理,因为数据质量是数据分析结论有效性和准确性的基础,也是这一切的前提。所以如何保障数据质量,确保数据可用性是数据仓库建设中不容忽视的环节。
616 0
数据仓库之数据质量建设(深度好文)(一)
|
数据采集 分布式计算 监控
数据仓库之数据质量建设(深度好文)(二)
数仓建设真正的难点不在于数仓设计,而在于后续业务发展起来,业务线变的庞大之后的数据治理,而数据治理的范围非常广,包含数据本⾝的管理、数据安全、数据质量、数据成本等。在这么多治理内容中,大家想下最重要的治理是什么?当然是数据质量治理,因为数据质量是数据分析结论有效性和准确性的基础,也是这一切的前提。所以如何保障数据质量,确保数据可用性是数据仓库建设中不容忽视的环节。
379 0
数据仓库之数据质量建设(深度好文)(二)
|
SQL 搜索推荐 大数据
客快物流大数据项目(六十七):客户主题(一)
客快物流大数据项目(六十七):客户主题(一)
299 0
客快物流大数据项目(六十七):客户主题(一)
|
缓存 分布式计算 大数据
客快物流大数据项目(六十七):客户主题(二)
客快物流大数据项目(六十七):客户主题(二)
284 0
客快物流大数据项目(六十七):客户主题(二)
|
存储 数据建模 数据挖掘
境外银行-数仓建模方法简要总结
背景:因近期境外银行业务全面提速,各种业务项目、建站项目并行推进,数据团队数据资产建设的需求也接踵而至,但我们一直跟随业务快速开发迭代,数据资产特别是中间层资产缺少统一的方法指导,造成各个项目负责同学被动建设,数据资产无法体系化,为后续使用和维护上带来很多困难,所以本次先从数仓建模方法方面为大家进行简单的总结介绍,希望帮助大家形成相对统一的数仓建模方法论。常见的两种数仓建模理论:【维度建模】维度建
440 0
|
大数据 数据挖掘
阿里小贷:封闭流程与数据挖掘
    随着新年后资金面的舒缓,货币基金收益率开始了持续的回落,货币基金投资方式的必然调整也加剧了风险收益比的不确定性。更为严峻的是明显的竞争加剧,随着一些大型商业银行让夺利益推出类似产品,始终无法进入线下支付的支付宝和财付通并不占优势。
2999 0
|
Web App开发 监控 大数据
解析业务数据的特征——《企业大数据实践路线》之三
阿里云MVP戚俊带你分析数据类型,进行大数据实战
2492 0