基于DataIDE数据集成实现香港ECS上的MySQL数据同步到数加MaxCompute-阿里云开发者社区

基于DataIDE数据集成实现香港ECS上的MySQL数据同步到数加MaxCompute

2017-06-06 4817

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

云原生大数据计算服务 MaxCompute，5000CU*H 100GB 3个月

云原生大数据计算服务MaxCompute，500CU*H 100GB 3个月

简介： 最近有朋友问，客户在香港ECS上搭建的MySQl，大概有100GB以上的数据，能否通过MaxCompute做海量数据分析，我的回答是YES！但客户担心香港与大陆之前数据连通性问题，我的回答依然是YES！为了让更多个客户不再困扰，笔者做了一份教程，可以通过大数据开发套件中的经典网络进行同步数据

最近有朋友问，客户在香港ECS上搭建的MySQl，大概有100GB以上的数据，能否通过MaxCompute做海量数据分析，我的回答是YES！

但客户担心香港与大陆之间数据连通性问题，我的回答依然是YES！

为了让更多个客户不再困扰，笔者做了一份教程，可以通过大数据开发套件中的经典网络进行同步数据，有图为证！

准备工作

1、注册并开通阿里云账号、Access id、Access Key；开通方法：

2、购买并开通香港区域经典网络ECS；购买地址：https://ecs.console.aliyun.com/#/create/prepay/?data=eyJkYXRhIjp7InZtX3JlZ2lvbl9ubyI6ImNuLWhvbmdrb25nLWFtNC1jMDQifX0%3D

3、下载并搭建MySQL 5.7 ；下载地址：https://dev.mysql.com/downloads/windows/installer/5.7.html

4、购买并开通MaxCompute、大数据开发套件；开通方法：

跨区域数据同步

1、设置ECS安全组

进入ECS管控台->ECS管理，设置安全组，添加外网3306 IP访问权限；

2、添加数据源

通过控制台进入大数据开发套件；

点击数据集成->左侧列表"数据源"页面->点击右上交“新增数据源”；

输入数据源MySQL57_hk，选择MySQL 经典网络，MySQL的JDBC地址、账号信息；

点击连通性验证网络；如果不通，请参照本文常见问题；

3、创建并设置同步任务

点击进入同步任务，选择需要导入的源表；

数据源MySQL57_hk，选择或通过搜索框查找"movie_info_mysql_hk"，点击下一步；

选择目标数据库opds_first，点击快速建表，同步表结构，修改脚本中的表名，改为movie_info，点击提交；

分区信息默认为时间变量，点下一步；

字段自动映射，跳过即可；

通道控制默认，点击下一步；

预览后，点击保存；

点击保存后，命名数据同步任务名称hk_mysql_data1；

4、执行并验证数据

手动执行数据同步，点击运行，选择当天时间戳；

执行完成后，我们去验证一下数据；

进入大数据开发套件->数据开发；

验证导入的数据；

select * from movie_info ;

实验遇到的问题

Q：大数据开发套件(数据集成)中连接不上ECS上的MySQL ，提示：测试连接失败,测试数据源连通性失败:连接数据库失败, 数据库连接串:jdbc:mysql://47.90.89.23:3306/MySQL57-hk, 用户名:root, 异常消息:Communications link failure The last packet sent successfully to the server was 0 milliseconds ago. The driver has not received any packets from the server.

A：进入ECS安全组规则->设置网络入口访问权限，测试的话可以设置为0.0.0.0/0；

Q：大数据开发套件(数据集成)中连接不上ECS上的MySQL ，提示：测试连接失败,测试数据源连通性失败:连接数据库失败, 数据库连接串:jdbc:mysql://47.90.89.23:3306/mysql, 用户名:root, 异常消息:null, message from server: "Host '121.43.110.160' is not allowed to connect to this MySQL server"

A：MySQL设置远程访问权限，参照：http://kouss.com/aliyun-ecs-mysql-allow-navicat.html

相关实践学习

基于MaxCompute的热门话题分析

本实验围绕社交用户发布的文章做了详尽的分析，通过分析能得到用户群体年龄分布，性别分布，地理位置分布，以及热门话题的热度。

SaaS 模式云数据仓库必修课

本课程由阿里云开发者社区和阿里云大数据团队共同出品，是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法，从场景到实践，体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库，助力开发者学习了解先进的技术栈，并能在实际业务中敏捷的进行大数据分析，赋能企业业务。通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景，可应用MaxCompute实现数仓搭建，快速进行大数据分析。适合大数据工程师、大数据分析师大量数据需要处理、存储和管理，需要搭建数据仓库？学它！没有足够人员和经验来运维大数据平台，不想自建IDC买机器，需要免运维的大数据平台？会SQL就等于会大数据？学它！想知道大数据用得对不对，想用更少的钱得到持续演进的数仓能力？获得极致弹性的计算资源和更好的性能，以及持续保护数据安全的生产环境？学它！想要获得灵活的分析能力，快速洞察数据规律特征？想要兼得数据湖的灵活性与数据仓库的成长性？学它！出品人：阿里云大数据产品及研发团队专家产品 MaxCompute 官网 https://www.aliyun.com/product/odps 

基于DataIDE数据集成实现香港ECS上的MySQL数据同步到数加MaxCompute

大数据计算 MaxCompute

热门文章

最新文章

相关产品

相关课程

相关电子书

相关实验场景

推荐镜像