注意:只有 E-MapReduce 产品版本 V1.3.0(包括)以上支持 Sqoop 作业类型。在低版本集群上运行 Sqoop 作业会失败,errlog会报不支持的错误。参数细节请参见
数据传输 Sqoop。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
您提到的操作流程是正确的,下面我将为您详细解释每个步骤以及如何在阿里云E-MapReduce(EMR)平台上创建一个Sqoop作业,确保您能顺利完成数据传输任务。
首先,请确认您的E-MapReduce集群版本是否为V1.3.0或以上。这是因为只有这个版本及之后的版本才支持Sqoop作业类型。如果您的集群版本较低,需要先升级到支持的版本。这可以通过E-MapReduce控制台进行操作。
在接下来的配置界面中,您需要填写Sqoop命令的具体参数。这些参数包括源数据库连接信息、目标存储位置、查询条件等。格式通常如下:
sqoop import \
--connect "jdbc:mysql://your_database_host:port/database_name?useSSL=false&serverTimezone=UTC" \
--username your_username \
--password your_password \
--table your_table_name \
--target-dir hdfs://your_hdfs_path/your_directory \
--num-mappers 1
将上述模板中的your_database_host
、port
、database_name
、your_username
、your_password
、your_table_name
和hdfs://your_hdfs_path/your_directory
替换为实际值。
应用参数选项框:直接将上述命令中的参数部分(即sqoop import
之后的部分)填入此框内。
请注意,处理敏感信息(如数据库密码)时要遵循安全最佳实践,避免明文暴露。阿里云E-MapReduce也提供了密钥管理服务来帮助您更安全地管理这类信息。