久久国产成人av_抖音国产毛片_a片网站免费观看_A片无码播放手机在线观看,色五月在线观看,亚洲精品m在线观看,女人自慰的免费网址,悠悠在线观看精品视频,一级日本片免费的,亚洲精品久,国产精品成人久久久久久久

分享

關(guān)于數(shù)據(jù)庫索引,必須掌握的知識(shí)點(diǎn)

 丹楓無跡 2022-02-16

MySQL的索引是數(shù)據(jù)庫非常重要的知識(shí)點(diǎn),,這些知識(shí)點(diǎn)你都掌握了嗎,?如果有幫到你可以點(diǎn)贊收藏呦。

推薦閱讀這些必會(huì)的計(jì)算機(jī)網(wǎng)絡(luò)知識(shí)點(diǎn)你都掌握了嗎

什么是索引,?

百度百科的解釋:索引是對(duì)數(shù)據(jù)庫表的一列或者多列的值進(jìn)行排序一種結(jié)構(gòu),,使用索引可以快速訪問數(shù)據(jù)表中的特定信息。

索引的優(yōu)缺點(diǎn),?

優(yōu)點(diǎn):

  • 大大加快數(shù)據(jù)檢索的速度。
  • 將隨機(jī)I/O變成順序I/O(因?yàn)锽+樹的葉子節(jié)點(diǎn)是連接在一起的)
  • 加速表與表之間的連接

缺點(diǎn):

  • 從空間角度考慮,,建立索引需要占用物理空間
  • 從時(shí)間角度 考慮,創(chuàng)建和維護(hù)索引都需要花費(fèi)時(shí)間,,例如對(duì)數(shù)據(jù)進(jìn)行增刪改的時(shí)候都需要維護(hù)索引,。

索引的數(shù)據(jù)結(jié)構(gòu),?

索引的數(shù)據(jù)結(jié)構(gòu)主要有B+樹和哈希表,,對(duì)應(yīng)的索引分別為B+樹索引和哈希索引。InnoDB引擎的索引類型有B+樹索引和哈希索引,,默認(rèn)的索引類型為B+樹索引,。

  • B+樹索引

    熟悉數(shù)據(jù)結(jié)構(gòu)的同學(xué)都知道,B+樹,、平衡二叉樹,、紅黑樹都是經(jīng)典的數(shù)據(jù)結(jié)構(gòu)。在B+樹中,,所有的記錄節(jié)點(diǎn)都是按照鍵值大小的順序放在葉子節(jié)點(diǎn)上,,如下圖。

在這里插入圖片描述

從上圖可以看出 ,,因?yàn)锽+樹具有有序性,,并且所有的數(shù)據(jù)都存放在葉子節(jié)點(diǎn),所以查找的效率非常高,,并且支持排序和范圍查找,。

B+樹的索引又可以分為主索引和輔助索引。其中主索引為聚簇索引,,輔助索引為非聚簇索引,。聚簇索引是以主鍵作為B+ 樹索引的鍵值所構(gòu)成的B+樹索引,聚簇索引的葉子節(jié)點(diǎn)存儲(chǔ)著完整的數(shù)據(jù)記錄,;非聚簇索引是以非主鍵的列作為B+樹索引的鍵值所構(gòu)成的B+樹索引,,非聚簇索引的葉子節(jié)點(diǎn)存儲(chǔ)著主鍵值。所以使用非聚簇索引進(jìn)行查詢時(shí),,會(huì)先找到主鍵值,,然后到根據(jù)聚簇索引找到主鍵對(duì)應(yīng)的數(shù)據(jù)域,。上圖中葉子節(jié)點(diǎn)存儲(chǔ)的是數(shù)據(jù)記錄,為聚簇索引的結(jié)構(gòu)圖,,非聚簇索引的結(jié)構(gòu)圖如下:

在這里插入圖片描述

上圖中的字母為數(shù)據(jù)的非主鍵的列值,,假設(shè)要查詢該列值為B的信息,則需先找到主鍵7,,在到聚簇索引中查詢主鍵7所對(duì)應(yīng)的數(shù)據(jù)域,。

  • 哈希索引

    哈希索引是基于哈希表實(shí)現(xiàn)的,對(duì)于每一行數(shù)據(jù),,存儲(chǔ)引擎會(huì)對(duì)索引列通過哈希算法進(jìn)行哈希計(jì)算得到哈希碼,,并且哈希算法要盡量保證不同的列值計(jì)算出的哈希碼值是不同的,將哈希碼的值作為哈希表的key值,,將指向數(shù)據(jù)行的指針作為哈希表的value值,。這樣查找一個(gè)數(shù)據(jù)的時(shí)間復(fù)雜度就是o(1),一般多用于精確查找,。

Hash索引和B+樹的區(qū)別?

因?yàn)閮烧邤?shù)據(jù)結(jié)構(gòu)上的差異導(dǎo)致它們的使用場景也不同,,哈希索引一般多用于精確的等值查找,,B+索引則多用于除了精確的等值查找外的其他查找。在大多數(shù)情況下,,會(huì)選擇使用B+樹索引,。

  • 哈希索引不支持排序,因?yàn)楣1硎菬o序的,。
  • 哈希索引不支持范圍查找,。
  • 哈希索引不支持模糊查詢及多列索引的最左前綴匹配。
  • 因?yàn)楣1碇袝?huì)存在哈希沖突,,所以哈希索引的性能是不穩(wěn)定的,,而B+樹索引的性能是相對(duì)穩(wěn)定的,每次查詢都是從根節(jié)點(diǎn)到葉子節(jié)點(diǎn)

索引的類型有哪些?

MySQL主要的索引類型主要有FULLTEXT,,HASH,,BTREE,RTREE,。

  • FULLTEXT

    FULLTEXT即全文索引,,MyISAM存儲(chǔ)引擎和InnoDB存儲(chǔ)引擎在MySQL5.6.4以上版本支持全文索引,一般用于查找文本中的關(guān)鍵字,,而不是直接比較是否相等,,多在CHAR,VARCHAR,,TAXT等數(shù)據(jù)類型上創(chuàng)建全文索引,。全文索引主要是用來解決WHERE name LIKE "%zhang%"等針對(duì)文本的模糊查詢效率低的問題,。

  • HASH

    HASH即哈希索引,哈希索引多用于等值查詢,,時(shí)間復(fù)雜夫?yàn)閛(1),,效率非常高,但不支持排序,、范圍查詢及模糊查詢等,。

  • BTREE

    BTREE即B+樹索引,INnoDB存儲(chǔ)引擎默認(rèn)的索引,,支持排序,、分組、范圍查詢,、模糊查詢等,,并且性能穩(wěn)定。

  • RTREE

    RTREE即空間數(shù)據(jù)索引,,多用于地理數(shù)據(jù)的存儲(chǔ),相比于其他索引,,空間數(shù)據(jù)索引的優(yōu)勢在于范圍查找

索引的種類有哪些?

  • 主鍵索引:數(shù)據(jù)列不允許重復(fù),,不能為NULL,,一個(gè)表只能有一個(gè)主鍵索引
  • 組合索引:由多個(gè)列值組成的索引。
  • 唯一索引:數(shù)據(jù)列不允許重復(fù),,可以為NULL,,索引列的值必須唯一的,如果是組合索引,,則列值的組合必須唯一,。
  • 全文索引:對(duì)文本的內(nèi)容進(jìn)行搜索。
  • 普通索引:基本的索引類型,,可以為NULL

B樹和B+樹的區(qū)別?

B樹和B+樹最主要的區(qū)別主要有兩點(diǎn):

  • B樹中的內(nèi)部節(jié)點(diǎn)和葉子節(jié)點(diǎn)均存放鍵和值,,而B+樹的內(nèi)部節(jié)點(diǎn)只有鍵沒有值,,葉子節(jié)點(diǎn)存放所有的鍵和值。

  • B+樹的葉子節(jié)點(diǎn)是通過相連在一起的,,方便順序檢索,。

    兩者的結(jié)構(gòu)圖如下。

    在這里插入圖片描述

    在這里插入圖片描述

數(shù)據(jù)庫為什么使用B+樹而不是B樹,?

  • B樹適用于隨機(jī)檢索,,而B+樹適用于隨機(jī)檢索和順序檢索
  • B+樹的空間利用率更高,因?yàn)锽樹每個(gè)節(jié)點(diǎn)要存儲(chǔ)鍵和值,,而B+樹的內(nèi)部節(jié)點(diǎn)只存儲(chǔ)鍵,,這樣B+樹的一個(gè)節(jié)點(diǎn)就可以存儲(chǔ)更多的索引,從而使樹的高度變低,,減少了I/O次數(shù),,使得數(shù)據(jù)檢索速度更快。
  • B+樹的葉子節(jié)點(diǎn)都是連接在一起的,,所以范圍查找,,順序查找更加方便
  • B+樹的性能更加穩(wěn)定,因?yàn)樵贐+樹中,,每次查詢都是從根節(jié)點(diǎn)到葉子節(jié)點(diǎn),,而在B樹中,要查詢的值可能不在葉子節(jié)點(diǎn),,在內(nèi)部節(jié)點(diǎn)就已經(jīng)找到,。

那在什么情況適合使用B樹呢,因?yàn)锽樹的內(nèi)部節(jié)點(diǎn)也可以存儲(chǔ)值,,所以可以把一些頻繁訪問的值放在距離根節(jié)點(diǎn)比較近的地方,,這樣就可以提高查詢效率。綜上所述,,B+樹的性能更加適合作為數(shù)據(jù)庫的索引,。

什么是聚簇索引,,什么是非聚簇索引?

聚簇索引和非聚簇索引最主要的區(qū)別是數(shù)據(jù)和索引是否分開存儲(chǔ),。

  • 聚簇索引:將數(shù)據(jù)和索引放到一起存儲(chǔ),,索引結(jié)構(gòu)的葉子節(jié)點(diǎn)保留了數(shù)據(jù)行。
  • 非聚簇索引:將數(shù)據(jù)進(jìn)和索引分開存儲(chǔ),,索引葉子節(jié)點(diǎn)存儲(chǔ)的是指向數(shù)據(jù)行的地址,。

在InnoDB存儲(chǔ)引擎中,默認(rèn)的索引為B+樹索引,,利用主鍵創(chuàng)建的索引為主索引,,也是聚簇索引,在主索引之上創(chuàng)建的索引為輔助索引,,也是非聚簇索引,。為什么說輔助索引是在主索引之上創(chuàng)建的呢,因?yàn)檩o助索引中的葉子節(jié)點(diǎn)存儲(chǔ)的是主鍵,。

在MyISAM存儲(chǔ)引擎中,,默認(rèn)的索引也是B+樹索引,,但主索引和輔助索引都是非聚簇索引,也就是說索引結(jié)構(gòu)的葉子節(jié)點(diǎn)存儲(chǔ)的都是一個(gè)指向數(shù)據(jù)行的地址,。并且使用輔助索引檢索無需訪問主鍵的索引,。

可以從非常經(jīng)典的兩張圖看看它們的區(qū)別(圖片來源于網(wǎng)絡(luò)):

在這里插入圖片描述

在這里插入圖片描述

非聚簇索引一定會(huì)進(jìn)行回表查詢嗎,?

上面是說了非聚簇索引的葉子節(jié)點(diǎn)存儲(chǔ)的是主鍵,,也就是說要先通過非聚簇索引找到主鍵,再通過聚簇索引找到主鍵所對(duì)應(yīng)的數(shù)據(jù),,后面這個(gè)再通過聚簇索引找到主鍵對(duì)應(yīng)的數(shù)據(jù)的過程就是回表查詢,,那么非聚簇索引就一定會(huì)進(jìn)行回表查詢嗎?

答案是不一定的,,這里涉及到一個(gè)索引覆蓋的問題,,如果查詢的數(shù)據(jù)再輔助索引上完全能獲取到便不需要回表查詢。例如有一張表存儲(chǔ)著個(gè)人信息包括id,、name,、age等字段。假設(shè)聚簇索引是以ID為鍵值構(gòu)建的索引,,非聚簇索引是以name為鍵值構(gòu)建的索引,,select id,name from user where name = 'zhangsan';這個(gè)查詢便不需要進(jìn)行回表查詢因?yàn)椋ㄟ^非聚簇索引已經(jīng)能全部檢索出數(shù)據(jù),,這就是索引覆蓋的情況。如果查詢語句是這樣,,select id,name,age from user where name = 'zhangsan';則需要進(jìn)行回表查詢,,因?yàn)橥ㄟ^非聚簇索引不能檢索出age的值。那應(yīng)該如何解決那呢,?只需要將索引覆蓋即可,,建立age和name的聯(lián)合索引再使用select id,name,age from user where name = 'zhangsan';進(jìn)行查詢即可。

所以通過索引覆蓋能解決非聚簇索引回表查詢的問題,。

索引的使用場景有哪些?

  • 對(duì)于中大型表建立索引非常有效,,對(duì)于非常小的表,,一般全部表掃描速度更快些。
  • 對(duì)于超大型的表,,建立和維護(hù)索引的代價(jià)也會(huì)變高,,這時(shí)可以考慮分區(qū)技術(shù)。
  • 如何表的增刪改非常多,,而查詢需求非常少的話,,那就沒有必要建立索引了,,因?yàn)榫S護(hù)索引也是需要代價(jià)的。
  • 一般不會(huì)出現(xiàn)再where條件中的字段就沒有必要建立索引了,。
  • 多個(gè)字段經(jīng)常被查詢的話可以考慮聯(lián)合索引,。
  • 字段多且字段值沒有重復(fù)的時(shí)候考慮唯一索引。
  • 字段多且有重復(fù)的時(shí)候考慮普通索引,。

索引的設(shè)計(jì)原則?

  • 最適合索引的列是在where后面出現(xiàn)的列或者連接句子中指定的列,,而不是出現(xiàn)在SELECT關(guān)鍵字后面的選擇列表中的列,。
  • 索引列的基數(shù)越大,索引的效果越好,,換句話說就是索引列的區(qū)分度越高,,索引的效果越好。比如使用性別這種區(qū)分度很低的列作為索引,,效果就會(huì)很差,,因?yàn)榱械幕鶖?shù)最多也就是三種,大多不是男性就是女性,。
  • 盡量使用短索引,,對(duì)于較長的字符串進(jìn)行索引時(shí)應(yīng)該指定一個(gè)較短的前綴長度,因?yàn)檩^小的索引涉及到的磁盤I/O較少,,并且索引高速緩存中的塊可以容納更多的鍵值,,會(huì)使得查詢速度更快。
  • 盡量利用最左前綴,。
  • 不要過度索引,,每個(gè)索引都需要額外的物理空間,維護(hù)也需要花費(fèi)時(shí)間,,所以索引不是越多越好,。

如何對(duì)索引進(jìn)行優(yōu)化,?

對(duì)索引的優(yōu)化其實(shí)最關(guān)鍵的就是要符合索引的設(shè)計(jì)原則和應(yīng)用場景,,將不符合要求的索引優(yōu)化成符合索引設(shè)計(jì)原則和應(yīng)用場景的索引。

除了索引的設(shè)計(jì)原則和應(yīng)用場景那幾點(diǎn)外,,還可以從以下兩方面考慮,。

  • 在進(jìn)行查詢時(shí),索引列不能是表達(dá)式的一部分,,也不能是函數(shù)的參數(shù),,因?yàn)檫@樣無法使用索引。例如select * from table_name where a + 1 = 2
  • 將區(qū)分度最高的索引放在前面
  • 盡量少使用select*

索引的使用場景、索引的設(shè)計(jì)原則和如何對(duì)索引進(jìn)行優(yōu)化可以看成一個(gè)問題,。

如何創(chuàng)建/刪除索引?

創(chuàng)建索引:

  • 使用CREATE INDEX 語句

    CREATE INDEX index_name ON table_name (column_list);

  • 在CREATE TABLE時(shí)創(chuàng)建

    	CREATE TABLE user(
    	id INT PRIMARY KEY,
    	information text,
    	FULLTEXT KEY (information)
    );
    
  • 使用ALTER TABLE創(chuàng)建索引

    ALTER TABLE table_name ADD INDEX index_name (column_list);

刪除索引:

  • 刪除主鍵索引

    alter table 表名 drop primary key

  • 刪除其他索引

    alter table 表名 drop key 索引名

使用索引查詢時(shí)性能一定會(huì)提升嗎,?

不一定,前面在索引的使用場景和索引的設(shè)計(jì)原則中已經(jīng)提到了如何合理地使用索引,,因?yàn)閯?chuàng)建和維護(hù)索引需要花費(fèi)空間和時(shí)間上的代價(jià),,如果不合理地使用索引反而會(huì)使查詢性能下降。

什么是前綴索引,?

前綴索引是指對(duì)文本或者字符串的前幾個(gè)字符建立索引,這樣索引的長度更短,,查詢速度更快,。

使用場景:前綴的區(qū)分度比較高的情況下。

建立前綴索引的方式

ALTER TABLE table_name ADD KEY(column_name(prefix_length));

這里面有個(gè)prefix_length參數(shù)很難確定,,這個(gè)參數(shù)就是前綴長度的意思,。通常可以使用以下方法進(jìn)行確定,,先計(jì)算全列的區(qū)分度

SELECT COUNT(DISTINCT column_name) / COUNT(*) FROM table_name;

然后在計(jì)算前綴長度為多少時(shí)和全列的區(qū)分度最相似,。

SELECT COUNT(DISTINCT LEFT(column_name, prefix_length)) / COUNT(*) FROM table_name;

不斷地調(diào)整prefix_length的值,直到和全列計(jì)算出區(qū)分度相近,。

什么是最左匹配原則?

最左匹配原則:從最左邊為起點(diǎn)開始連續(xù)匹配,,遇到范圍查詢(<,、>、between,、like)會(huì)停止匹配。

例如建立索引(a,b,c),,大家可以猜測以下幾種情況是否用到了索引,。

  • 第一種

    select * from table_name where a = 1 and b = 2 and c = 3 
    select * from table_name where b = 2 and a = 1 and c = 3
    

    上面兩次查詢過程中所有值都用到了索引,where后面字段調(diào)換不會(huì)影響查詢結(jié)果,,因?yàn)镸ySQL中的優(yōu)化器會(huì)自動(dòng)優(yōu)化查詢順序,。

  • 第二種

    select * from table_name where a = 1
    select * from table_name where a = 1 and b = 2  
    select * from table_name where a = 1 and b = 2 and c = 3
    

    答案是三個(gè)查詢語句都用到了索引,因?yàn)槿齻€(gè)語句都是從最左開始匹配的,。

  • 第三種

    select * from table_name where  b = 1 
    select * from table_name where  b = 1 and c = 2 
    

    答案是這兩個(gè)查詢語句都沒有用到索引,,因?yàn)椴皇菑淖钭筮呴_始匹配的

  • 第四種

    select * from table_name where a = 1 and c = 2 
    

    這個(gè)查詢語句只有a列用到了索引,c列沒有用到索引,因?yàn)橹虚g跳過了b列,,不是從最左開始連續(xù)匹配的,。

  • 第五種

    select * from table_name where  a = 1 and b < 3 and c < 1
    

    這個(gè)查詢中只有a列和b列使用到了索引,而c列沒有使用索引,,因?yàn)楦鶕?jù)最左匹配查詢原則,,遇到范圍查詢會(huì)停止。

  • 第六種

    select * from table_name where a like 'ab%'; 
    select * from table_name where  a like '%ab'
    select * from table_name where  a like '%ab%'
    

    對(duì)于列為字符串的情況,,只有前綴匹配可以使用索引,,中綴匹配和后綴匹配只能進(jìn)行全表掃描。

索引在什么情況下會(huì)失效,?

在上面介紹了幾種不符合最左匹配原則的情況會(huì)導(dǎo)致索引失效,除此之外,,以下這幾種情況也會(huì)導(dǎo)致索引失效,。

  • 條件中有or,例如select * from table_name where a = 1 or b = 3
  • 在索引上進(jìn)行計(jì)算會(huì)導(dǎo)致索引失效,,例如select * from table_name where a + 1 = 2
  • 在索引的類型上進(jìn)行數(shù)據(jù)類型的隱形轉(zhuǎn)換,,會(huì)導(dǎo)致索引失效,例如字符串一定要加引號(hào),,假設(shè) select * from table_name where a = '1' 會(huì)使用到索引,,如果寫成select * from table_name where a = 1 則會(huì)導(dǎo)致索引失效。
  • 在索引中使用函數(shù)會(huì)導(dǎo)致索引失效,,例如select * from table_name where abs(a) = 1
  • 在使用like查詢時(shí)以%開頭會(huì)導(dǎo)致索引失效
  • 索引上使用,!、=,、<>進(jìn)行判斷時(shí)會(huì)導(dǎo)致索引失效,,例如select * from table_name where a != 1
  • 索引字段上使用 is null/is not null判斷時(shí)會(huì)導(dǎo)致索引失效,例如select * from table_name where a is null

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,,所有內(nèi)容均由用戶發(fā)布,,不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式,、誘導(dǎo)購買等信息,,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,,請點(diǎn)擊一鍵舉報(bào),。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請遵守用戶 評(píng)論公約

    類似文章 更多