开发者社区> 问答> 正文

[@小川游鱼][¥20]基于hive建设数据仓库的问题?

想建设一个数据仓库,查阅了很多数仓建设方案,现在分层方案已经有了,具体物理上基于hive如何构建还是比较迷惑。主要疑问这几点:

1、在hive中建立多个库来分别代表不同的层吗?

2、hive中可以用多个数据库吗?

3、物理上每一层都是隔离的吗,在不同的机器上?

本着谋求当下最佳实践经验,不求最好,但求最适合。

展开
收起
晓生寒 2018-12-14 16:11:14 2240 0
1 条回答
写回答
取消 提交回答
    1. 可以建立多个库
    2. hive 是对特定格式文件的数据处理,虽然语法类似SQL,但是底层存储不是数据库. 一般会把数据库和HIVE搭配使用
    3. 不知题主所谓的分层是什么意思,最好贴出自己的方案. hive本身不过是对mapreduce或spark计算框架的转换, 底层还是mapreduce.
    2019-07-17 23:21:06
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
Hive Bucketing in Apache Spark 立即下载
spark替代HIVE实现ETL作业 立即下载
2019大数据技术公开课第五季—Hive迁移到MaxCompute最佳实践 立即下载