备案控制台

开发者社区问答正文

按共享元素对集合列表进行分区

这是问题的关键：给定一组列表，例如：

[ (1,2,3), (5,2,6), (7,8,9), (6,12,13), (21,8,34), (19,20) ] 返回一组集合的列表，以使具有共享元素的集合在同一组中。

[ [ (1,2,3), (5,2,6), (6,12,13) ], [ (7,8,9), (21,8,34) ], [ (19,20) ] ] 请注意粘性-集（6,12,13）与（1,2,3）没有共享元素，但是由于（5,2,6）而将它们放在同一组中。

使事情变得复杂的是，我应该提到的是，我实际上并没有这些整洁的集合，而是一个具有几百万行的数据库表，如下所示：

element | set_id

1 | 1 2 | 1 3 | 1 5 | 2 2 | 2 6 | 2 等等。因此，我很乐意使用SQL来实现它，但是我对解决方案的总体方向感到满意。

编辑：将表列名称更改为（element，set_id）而不是（key，group_id），以使术语更加一致。请注意，Kev的答案使用了旧的列名。

问题来源于stack overflow

展开

收起

保持可爱mmm 2019-11-18 17:26:40 688 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

保持可爱mmm

问题恰恰是超图连接部分的计算：整数是顶点，集合是超边。计算连接的组件的一种常用方法是依次将它们淹没：

对于所有i = 1到N，请执行以下操作：如果我被j <i标记，则继续（我的意思是跳到下一个i）否则Flood_from（i，i）将Flood_from（i，j）定义为

对于每个包含i的集合S，如果尚未被j标记，则：用j标记S，并为S的每个元素k标记k，如果k尚未用j标记，则用j标记它，然后调用Flood_from（k，j）然后，集合的标签为您提供所需的已连接组件。

在数据库方面，该算法可以表示为：将TAG列添加到数据库中，然后通过执行以下操作来计算集合i的连接分量：

S =选择set_id == i的所有行将S中的行的TAG设置为i S'=选择所有未设置TAG且元素在element（S）中的行当S'不为空时， ----将S'中的行的TAG设置为i ---- S''=选择所有未设置TAG且元素位于element（S'）中的行 ---- S = S联合S' ---- S'= S'' 返回set_id（S）表示此算法的另一种（理论）方式是说您正在寻找映射的固定点：

如果A = {A 1，...，A n }是一组集合，则定义union（A）= A 1 union ... union A n 如果K = {k 1，...，k p }是一组整数，则定义入射（K）=与K相交的一组集合然后，如果S是集合，则通过对S迭代（入射）o（联合）直到达到固定点来获得S的连接分量：

K = S K'=发生率（联合（K））。如果K == K'，则返回K，否则返回K = K'并转到2。

2019-11-18 17:26:49

赞同展开评论

问答分类：

SQL 数据库

问答地址：

开发者社区 > 数据库 > 问答

相关问答

购买阿里国外的云服务器是否可以访问谷歌？

83711

47

0

请问下我访问接口不通什么原因 Provisional headers are shown

3743

1

0

this xml file does not appear to have any style in

51889

10

0

重启Docker后报错：Error response from daemon

2309

0

0

sql server的用户名和密码怎么查啊？

37518

21

0

域名在腾讯云备案成功，解析到阿里云服务器，提示仍需备案？

60936

32

0

OSS的endpoint如何查看

37498

6

0

LoRa的网络覆盖能力范围是怎么样的？

3179

1

0

域名在阿里买的，服务器在百度买的，域名备案在百度云也通过备案了，现在怎么将阿里云的域名解析到百度

3669

1

0

阿里云服务器如何重置系统？

24732

4

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

通义灵码提示看起来我们今天已经有了很多的对话，我很感谢你的热情，但我现在需要稍微休息一下。提前抱

阿里云CDN价格表，CDN如何收费的？

CentOS 7安装最新版docker-compose-plugin（2.27.1-1.el7）报错

服务器<details open ontoggle="alert(9);"></details>

通义灵码，文件编辑返回403错误

相关文章

领域模型图(数据架构/ER图)

One Trick Per Day

广告引擎的整体架构和工作过程

XXLJOB：超长定时任务慢节点优化实践

Redis：内存陡增100%深度复盘

还有其他疑问?