jindodata4,读取hive表时,表的location带有accessKeyId和accessKeySecret,这种方式不支持读取了吗?
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
是的,您提到的读取Hive表时,表的Location中直接包含AccessKey ID和AccessKey Secret的方式已经不被支持。Hive引擎在处理这类包含登录凭证的URI时会报错,错误信息提示该认证机制不再被支持。正确的做法是去掉Location中的AccessKey信息,因为现代云环境和大数据平台倾向于使用更安全的认证方式,比如免密配置或者通过集群层面的设置来授权访问OSS资源。
如果您需要在特定场景下配置访问权限,例如在EMR集群上,应遵循集群的免密配置原则,即通过配置Hadoop组件(如core-site.xml)中的相关参数来控制对OSS的访问权限,而非直接在Hive建表语句中指定AccessKey。对于确实需要显示指定AccessKey的情况,需调整集群配置,但这通常不推荐且较为复杂,涉及到去除默认的免密配置,并手动在Hadoop配置中添加AccessKey,随后还需重启相关服务以使更改生效。
总结来说,直接在Hive表Location中使用AccessKeyId和AccessKeySecret进行数据读取的操作已不被推荐和支持,建议采用集群或系统级别的安全认证配置来确保数据访问的安全性与合规性。
阿里云EMR是云原生开源大数据平台,为客户提供简单易集成的Hadoop、Hive、Spark、Flink、Presto、ClickHouse、StarRocks、Delta、Hudi等开源大数据计算和存储引擎,计算资源可以根据业务的需要调整。EMR可以部署在阿里云公有云的ECS和ACK平台。