MaxCompute筛检重复数据,将新数据存储到mysql数据库中-问答-阿里云开发者社区-阿里云

开发者社区> 问答> 正文

MaxCompute筛检重复数据,将新数据存储到mysql数据库中

arvinlbc 2017-05-15 14:10:59 2344

大家好,我这儿有个基于MaxCompute的数据分析的项目,想通过程序筛检MaxCompute中的冗余数据,并且存储到mysql中.求个合作.

存储 分布式计算 关系型数据库 MySQL 数据挖掘 MaxCompute 数据库
分享到
取消 提交回答
全部回答(1)
  • 牧明
    2019-09-27 10:08:58
    1、查找表中多余的重复记录,重复记录是根据单个字段(peopleId)来判断 select * from peoplewhere peopleId in (select   peopleId from   people group by   peopleId having count (peopleId) > 1) 2、删除表中多余的重复记录,重复记录是根据单个字段(peopleId)来判断,只留有rowid最小的记录 delete from people where peopleId in (select   peopleId from people group by   peopleId   having count (peopleId) > 1)and rowid not in (select min(rowid) from   people group by peopleId having count(peopleId )>1) 3、查找表中多余的重复记录(多个字段)  select * from vitae awhere (a.peopleId,a.seq) in   (select peopleId,seq from vitae group by peopleId,seq having 
    

    扩展资料 FROM子句指定SELECT语句查询及与查询相关的表或视图。在FROM子句中最多可指定256个表或视图,它们之间用逗号分隔。 在FROM子句同时指定多个表或视图时,如果选择列表中存在同名列,这时应使用对象名限定这些列所属的表或视图。 例如在usertable和citytable表中同时存在cityid列,在查询两个表中的cityid时应使用下面语句格式加以限定: SELECTusername,citytable.cityid FROMusertable,citytable WHEREusertable.cityid=citytable.cityid 在FROM子句中可用以下两种格式为表或视图指定别名: 表名 as 别名 表名 别名

    “答案来源于网络,供您参考” 希望以上信息可以帮到您!

    0 0
数据库
使用钉钉扫一扫加入圈子
+ 订阅

分享数据库前沿,解构实战干货,推动数据库技术变革

推荐文章
相似问题
推荐课程