1、需求如下
2、在进行ETL开发之前,先创建一个edw用户。
3、创建一个test_aggregation文件夹,用于完成本次项目
注意:每个作业相当于是一个工程project,创建文件夹方便我们管理项目,同时ETL开发流程步骤太多,放在同一个文件夹下显得更为合适了。
4、ETL开发流程如下
整个ETL开发流程的详细步骤,可以参考我的另外一篇文章:https://blog.csdn.net/weixin_41261833/article/details/103625414
1)定义源表
2)定义目标表
① 利用源表生成目标表;
② 双击该表,给目标表重新命名;
③ 对源表中的列进行筛选,保留或者自定义我们想要的列;
④ 生成并执行sql后,目标表中才会生成这个表的表结构(这一步很关键!!!);
⑤ 针对上述“生成数据库对象”表,做如下操作;
⑥ 执行完成以后,可以去edw用表下面查看已经生成了edw_ITEMS表;
3)创建映射
① 创建映射;
② 将源表和目标表都拖拉到右侧的灰色区域;