Hive可以拥有其元数据并在那里存储表,列,分区信息。如果我不想使用hive.Can我们创建一个与hive相同的spark元数据。我想查询spark SQL(不使用数据帧),如Hive(select,from和where)我们可以这样做吗?如果是,我们可以将哪个关系数据库用于元数据存储?
我们可以为hive创建与spark相同的元数据。
Spark为您做到了这一点,您不必单独安装Hive,也不必使用其中的一部分(例如Hive Metastore)。
无论您使用何种安装的Apache Spark,Spark SQL都会在内部使用Hive Metastore,其目的与Hive相同(但Metastore现在是Spark SQL的一部分)。
如果是,我们可以使用哪个关系数据库进行元数据存储?
Hive支持的任何东西,例如Oracle,MySQL,PostgreSQL。配置与使用单独的Hive安装(在这种企业安装中通常就是这种情况)非常相似。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。