DATE和TINYINT之间的性能差异_问答-阿里云开发者社区

2个类似的查询导致完全不同的执行时间。

我有2个类似的表格。它们之间的唯一区别是，一个包含DATE数据类型，另一个包含TINYINT。这是表格的样子。它们是临时表，主键是唯一索引。

CREATE TABLE #Carrier_DOB(
    Carrier_Record_ID INT NOT NULL PRIMARY KEY CLUSTERED,
    DOB_DT DATE NOT NULL,
    Cohort_Person_ID INT NULL
)
CREATE INDEX IX_Carrier_DOB ON #Carrier_DOB(Cohort_Person_ID)

CREATE TABLE #Carrier_Race(
    Carrier_Record_ID INT NOT NULL PRIMARY KEY CLUSTERED,
    BENE_RACE_CD TINYINT NOT NULL,
    Cohort_Person_ID INT NULL
)
CREATE INDEX IX_Carrier_Race ON #Carrier_Race(Cohort_Person_ID)
这是通过sp_spaceused进行的内容：

name            rows                    reserved    data        index_size  unused
#Carrier_DOB    75836908                2038528 KB  2029088 KB  7456 KB 1984 KB
#Carrier_Race   72139975                1647744 KB  1639552 KB  6016 KB 2176 KB
这是我很好奇的查询：

--Query1
SELECT *
INTO #DOB_Differences
FROM   #Carrier_DOB
WHERE  Cohort_Person_ID IN ( 
    SELECT a.Cohort_Person_ID FROM #Carrier_DOB a
    INNER JOIN #Carrier_DOB b 
       ON b.Cohort_Person_ID = a.Cohort_Person_ID 
       AND b.DOB_DT <> a.DOB_DT
    GROUP BY a.Cohort_Person_ID ) --466464 rows in 19:30

--Query2
SELECT #
INTO #Race_Differences
FROM #Carrier_Race
WHERE  Cohort_Person_ID IN ( 
    SELECT a.Cohort_Person_ID FROM #Carrier_Race a
    INNER JOIN #Carrier_Race b 
      ON b.Cohort_Person_ID = a.Cohort_Person_ID 
      AND b.BENE_RACE_CD <> a.BENE_RACE_CD
    GROUP BY a.Cohort_Person_ID ) -- 3476884 rows in  0:13

这两个查询之间的主要区别是，一个正在比较DATE字段，另一个正在比较CHAR（1）。我很惊讶Query1需要19分钟，而Query2仅花费13秒。这正常吗？我通常不处理7500万行表，因此我以前从未注意到过。我没有添加更多索引，因为这只是我过程中的一步。这是查询计划。它们是完全不同的，但是我不明白为什么。这是实际的查询计划以及我添加的索引，如上所述。索引将两个查询的时间缩短为12:24分钟，但是我仍然不明白为什么Query1比Query1慢得多。

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

DATE和TINYINT之间的性能差异

相关文章