开发者社区> 问答> 正文

查找SQL Server中几乎重复的重复项和条目

我有一个带有数千个文本条目的SQL表。在此表中,有些条目是完全重复的。然后是几乎几乎是重复的条目,如下所示:

Text

Hi my name is John. I am 25 years old. How are you? 
Hi my name is John.
这些几乎重复的是较长文本的较短变体。

现在,我想编写一条select语句,该语句选择表中的所有内容,但不包括重复项。另外,我想选择几乎重复的较长版本。

是否有可能在一句话中做到这一点?

编辑:我忘记添加数据在同一列中,而不是在两个不同的列中。

展开
收起
祖安文状元 2020-01-05 14:47:00 482 0
1 条回答
写回答
取消 提交回答
  • 我相信以下内容应完全满足您的要求:

    1. select distinct t.text
    from t
    where not exists (select 1
                      from t t2
                      where t2.text like concat(t.text, '_%')
                     );
    
    2020-01-05 14:47:08
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
SQL Server 2017 立即下载
GeoMesa on Spark SQL 立即下载
原生SQL on Hadoop引擎- Apache HAWQ 2.x最新技术解密malili 立即下载