datahub往maxcompute用Connector同步数据为啥自动生成了一个rowkey得列
DataHub支持将数据同步到MaxCompute对应的数据表中,同时支持分区表和非分区表,一般情况下推荐用户使用分区表进行数据同步以方便MaxCompute数据处理;关于字段对应如图 目前DataHub并不能完全支持MaxCompute所有的数据类型,所以需要根据DataHub数据类型创建MaxCompute表结构,对于BLOB数据类型,需要要求MaxCompute表结构仅需要包含一列STRING类型的column即可,另外为了方便数据追踪和问题排查,建议用户在创建MaxCompute表结构时,增加一列__rowkey__ STRING字段,DataHub会自动将DataHub对应数据的trace信息同步到该列中,以方便后续数据排查。因此你说的增加了__rowkey__这一列,本身没有业务意义,只是在同步时为了更好的方便数据追踪和问题排查而存在的,无需理会,关于更多DataHub同步数据到MaxCompute可以参考文档:https://help.aliyun.com/document_detail/158808.html,其他同步数据至MaxCompute可以参考文档https://help.aliyun.com/document_detail/195949.html
通过你的描述可以看出造成自动生成了一个rowkey的列的问题,应该是映射不正确,还有就是点位设置的问题造成的,楼主排查一下。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。