备案控制台

开发者社区问答正文

hive在数仓建模的好处是什么？

hive在数仓建模的好处是什么？

展开

收起

芯在这 2021-12-12 12:35:28 471 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

真的很搞笑

数仓建模的好处从关系模型和维度模型的对比中可以看出

关系建模

严格遵循第三范式（3NF），较为松散、零碎，物理表数量多，而数据冗余程度低。由于数据分布于众多的表中，这些数据可以更为灵活地被应用，功能性较强。关系模型主要应用与OLTP系统中，为了保证数据的一致性以及避免冗余，所以大部分业务系统的表都是遵循第三范式的。

OLTP系统中,数据多保存在关系型数据库(Mysql)中,一方面数据的冗余会造成数据库难以保存,另一方面表格太大不利于Mysql的快速响应,拆分为多个零碎小表的格式更利于查询使用

维度建模

主要应用于OLAP系统中，通常以某一个事实表为中心进行表的组织，主要面向业务，特征是可能存在数据的冗余，但是能方便的得到数据。

关系模型虽然冗余少，但是在大规模数据，跨表分析统计查询过程中，会造成多表关联，这会大大降低执行效率。在使用hive进行数仓项目的数据管理时,由于地层使用FDFS分布式存储,磁盘空间充足,冗余的数据不会造成困扰,另一方面,hive查询引擎的原因,过多表格直接的join会引发spark产生过多的shuffle流程(如果使用MR会产品过多的mapreduce),造成性能的下降

2021-12-12 12:41:26

赞同展开评论

问答分类：

SQL HIVE 云原生数据仓库AnalyticDB MySQL版

问答标签：

云原生数据仓库AnalyticDB MySQL版hive Hive数仓 hive云原生数据仓库AnalyticDB MySQL版云原生数据仓库AnalyticDB MySQL版建模 Hive建模

问答地址：

开发者社区 > 数据库 > 问答

相关问答

AnalyticDB MySQL如何对Hive数据进行读写

89

1

0

DataWorks埋点日志的数据在数仓中怎么建模比较好，用datavault还是星型模型呢？

147

1

0

在传统数仓基于Hive表的实现中，处理SCD场景存在哪些主要问题？

115

2

0

AnalyticDB MySQL读取Hive TEXT格式数据

98

1

0

你好，想问下Dataphin如果选择hive作为数仓，每个派生指标计算完是把结果值update到汇？

198

4

0

友友们，flinksql跑批任务调度怎么做像离线数仓hive做任务调度

402

2

0

菜鸟的数仓建模是基于DataWorks 做定制化开发吗？

446

1

0

各位，Flink 的离线计算的数据是怎么存放的？是存在 HDFS（或Hive）上的吗？

1876

6

0

flink1.16不支持hive2.1了吗？

905

1

0

flink CDC可以直接将mysql中的数据直接写入到hive中吗？

796

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

通义灵码启动异常，可点击按钮进行一键修复，如仍无法解决，请参考[问题排查指南](https://he

关于idea lingma欺骗的对话。请开发者尽快修复

怎么搭建本地文生图工作流

通义灵码提示看起来我们今天已经有了很多的对话，我很感谢你的热情，但我现在需要稍微休息一下。提前抱

阿里云CDN价格表，CDN如何收费的？

相关文章

十一、Hive JOIN 连接查询

Postgresql入门之psql用法详解（一）- 命令行参数详解

Data Agent 的隐形账单：为什么看起来“最重”的语义建模，反而是企业最省钱的选择？

网站如何制作网站,从零搭建网站完成的步骤

别让大数据任务“互相等着死” ——聊聊任务依赖与 DAG 设计的江湖规矩

还有其他疑问?