开发者社区> 问答> 正文

Dataphin中逻辑表的数据重复了 怎么去删除?

"Dataphin中逻辑表的数据重复了 怎么去删除?我大概是物理表的数据 cvs文件倒了两次 这种情况 怎么处理?物理表这里不能覆盖导入吗?
这里上传的数据:
6dadb881697e8431753b8b0c2356cb9c.png
导入时候最好能有选择 是新增还是覆盖?"

展开
收起
十一0204 2023-12-05 19:00:14 34 0
2 条回答
写回答
取消 提交回答
  • 意中人就是我呀!

    "逻辑表数据来源于物理表,确保物理表数据不重复就行了;重新再给逻辑表该分区补数据,会覆盖写入数据。清表再导入数据,或者找下你们数据库同学看下。执行下sql,先truncate清空表数据,再重新导入。底座引擎是MaxCompute吗?参考MaxCompute的语法就行。
    https://help.aliyun.com/zh/maxcompute/user-guide/sql-references/?spm=a2c4g.11186623.0.0.704a7636TDXsmm。
    此群整理至钉群“Dataphin公共云答疑群”。"

    2023-12-05 22:57:32
    赞同 展开评论 打赏
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    在Dataphin中处理逻辑表数据重复的问题,你可以首先尝试使用数据质量管理功能。在Dataphin首页,单击顶部菜单栏的"资产",然后进入"添加监控对象"对话框。在此,你可以配置质量规则以帮助你检测并处理重复的数据。

    如果你的数据是物理表中的数据,并且你曾经两次从CSV文件导入,你可以考虑先在开发环境中删除这些重复的数据,然后再将这些更改同步到生产环境。注意,直接在生产环境中修改数据可能会带来一些不可预见的风险,因此在操作之前请确保你明白所做的更改以及可能的影响。

    2023-12-05 20:24:22
    赞同 展开评论 打赏
来源圈子
更多
收录在圈子:
问答排行榜
最热
最新

相关电子书

更多
构建企业级好数据(Dataphin智能数据建设与治理白皮书) 立即下载
低代码开发师(初级)实战教程 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载