什么时候应该在数据库中使用复合索引? 使用综合索引对性能有何影响? 为什么要使用复合索引? 例如,我有一张homes桌子:
CREATE TABLE IF NOT EXISTS homes
( home_id
int(10) unsigned NOT NULL auto_increment, sqft
smallint(5) unsigned NOT NULL, year_built
smallint(5) unsigned NOT NULL, geolat
decimal(10,6) default NULL, geolng
decimal(10,6) default NULL, PRIMARY KEY (home_id
), KEY geolat
(geolat
), KEY geolng
(geolng
), ) ENGINE=InnoDB ; 对geolat和都使用复合索引对我来说是否有意义geolng:
我取代:
KEY geolat
(geolat
), KEY geolng
(geolng
), 与:
KEY geolat_geolng
(geolat
, geolng
) 如果是这样的话:
为什么? 使用复合索引对性能有何影响? 更新:
由于许多人说它完全取决于我执行的查询,因此以下是执行的最常见的查询:
SELECT * FROM homes WHERE geolat BETWEEN ??? AND ??? AND geolng BETWEEN ??? AND ??? 更新2:
使用以下数据库架构:
CREATE TABLE IF NOT EXISTS homes
( home_id
int(10) unsigned NOT NULL auto_increment, primary_photo_group_id
int(10) unsigned NOT NULL default '0', customer_id
bigint(20) unsigned NOT NULL, account_type_id
int(11) NOT NULL, address
varchar(128) collate utf8_unicode_ci NOT NULL, city
varchar(64) collate utf8_unicode_ci NOT NULL, state
varchar(2) collate utf8_unicode_ci NOT NULL, zip
mediumint(8) unsigned NOT NULL, price
mediumint(8) unsigned NOT NULL, sqft
smallint(5) unsigned NOT NULL, year_built
smallint(5) unsigned NOT NULL, num_of_beds
tinyint(3) unsigned NOT NULL, num_of_baths
decimal(3,1) unsigned NOT NULL, num_of_floors
tinyint(3) unsigned NOT NULL, description
text collate utf8_unicode_ci, geolat
decimal(10,6) default NULL, geolng
decimal(10,6) default NULL, display_status
tinyint(1) NOT NULL, date_listed
timestamp NOT NULL default CURRENT_TIMESTAMP, contact_email
varchar(100) collate utf8_unicode_ci NOT NULL, contact_phone_number
varchar(15) collate utf8_unicode_ci NOT NULL, PRIMARY KEY (home_id
), KEY customer_id
(customer_id
), KEY city
(city
), KEY num_of_beds
(num_of_beds
), KEY num_of_baths
(num_of_baths
), KEY geolat
(geolat
), KEY geolng
(geolng
), KEY account_type_id
(account_type_id
), KEY display_status
(display_status
), KEY sqft
(sqft
), KEY price
(price
), KEY primary_photo_group_id
(primary_photo_group_id
) ) ENGINE=InnoDB DEFAULT CHARSET=utf8 COLLATE=utf8_unicode_ci AUTO_INCREMENT=8 ; 使用以下SQL:
EXPLAIN SELECT homes.home_id, address, city, state, zip, price, sqft, year_built, account_type_id, num_of_beds, num_of_baths, geolat, geolng, photo_id, photo_url_dir FROM homes LEFT OUTER JOIN home_photos ON homes.home_id = home_photos.home_id AND homes.primary_photo_group_id = home_photos.home_photo_group_id AND home_photos.home_photo_type_id = 2 WHERE homes.display_status = true AND homes.geolat BETWEEN -100 AND 100 AND homes.geolng BETWEEN -100 AND 100 EXPLAIN返回:
1 SIMPLE homes ref geolat,geolng,display_status display_status 1 const 2 Using where 1 SIMPLE home_photos ref home_id,home_photo_type_id,home_photo_group_id home_photo_group_id 4 homes.primary_photo_group_id 4
我不太了解如何阅读EXPLAIN命令。这看起来好还是坏。现在,我没有为geolat和geolng使用复合索引。我可以做?
使用组合索引时,应使用组合索引。如下所示的复合索引:
index( column_A, column_B, column_C ) 使用这些字段进行联接,过滤和有时选择的查询将受益匪浅。使用该组合中最左边的列子集的查询也将受益。因此上述索引也将满足需要的查询
index( column_A, column_B, column_C ) index( column_A, column_B ) index( column_A ) 但这不会(至少不能直接解决,如果没有更好的索引可能会有所帮助)对需要查询的查询有所帮助
index( column_A, column_C ) 请注意如何缺少column_B。
在您的原始示例中,两个维度的复合索引将最有利于对两个维度或最左边的维度本身进行查询,但对最右边的维度本身不进行查询。如果您始终在查询两个维度,那么复合索引是必经之路,并不重要(首先是哪个)。来源:stack overflow
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。