一、基礎規(guī)范
解讀:支持事務,、行級鎖,、并發(fā)性能更好、CPU及內(nèi)存緩存頁優(yōu)化使得資源利用率更高
解讀:萬國碼,,無需轉碼,,無亂碼風險,節(jié)省空間,,utf8mb4是utf8的超集,,由于近年移動設備的增多,emoji表情以及部分不常見漢字在utf8下會表現(xiàn)為亂碼,,故需要升級至utf8mb4
解讀:N年后誰會知道這個a1,a2,a3字段是干嘛的
解讀:高并發(fā)大數(shù)據(jù)的互聯(lián)網(wǎng)業(yè)務,架構設計思路是“解放數(shù)據(jù)庫CPU,,將計算轉移到服務層”,,并發(fā)量大的情況下,這些功能很可能將數(shù)據(jù)庫拖死,,業(yè)務邏輯放到服務層具備更好的擴展性,,能夠輕易實現(xiàn)“增機器就加性能”。數(shù)據(jù)庫擅長存儲與索引,,CPU計算還是上移吧
解讀:為何要讓數(shù)據(jù)庫做它不擅長的事情,?大文件和照片存儲在文件系統(tǒng),,數(shù)據(jù)庫里存URI多好 二、命名規(guī)范
解讀:雖然IP訪問更快,,域名訪問需要內(nèi)網(wǎng)dns,但是對于大數(shù)據(jù)庫的擴展和遷庫考慮,,域名更好
業(yè)務名稱:xxx 線上環(huán)境:dj.xxx.db 開發(fā)環(huán)境:dj.xxx.rdb 測試環(huán)境:dj.xxx.tdb 從庫在名稱后加-s標識,,備庫在名稱后加-ss標識 線上從庫:dj.xxx-s.db 線上備庫:dj.xxx-sss.db
解讀:見名知意,,方便后續(xù)維護
解讀:見名知意,,方便后續(xù)維護 三,、表和字段設計規(guī)范
解讀:外鍵會導致表與表之間耦合,,update與delete操作都會涉及相關聯(lián)的表,十分影響sql的性能,,甚至會造成死鎖,。高并發(fā)情況下容易造成數(shù)據(jù)庫性能,大數(shù)據(jù)高并發(fā)業(yè)務場景數(shù)據(jù)庫使用以性能優(yōu)先
解讀: a) null的列使索引/索引統(tǒng)計/值比較都更加復雜,,對MySQL來說更難優(yōu)化 b) null這種類型MySQL內(nèi)部需要進行特殊處理,,增加數(shù)據(jù)庫處理記錄的復雜性;同等條件下,,表中有較多空字段的時候,,數(shù)據(jù)庫的處理性能會降低很多 c) null值需要更多的存儲空,無論是表還是索引中每行中的null的列都需要額外的空間來標識 d) 對null的處理時候,,只能采用is null或is not null,,而不能采用=、in,、<,、<>、!=,、not in這些操作符號,。如:where name!='shenjian',,如果存在name為null值的記錄,查詢結果就不會包含name為null值的記錄
解讀:會浪費更多的磁盤和內(nèi)存空間,,非必要的大量的大字段查詢會淘汰掉熱數(shù)據(jù),導致內(nèi)存命中率急劇降低,,影響數(shù)據(jù)庫性能
解讀:曾經(jīng)踩過這樣的坑,100元分3天攤銷,,每天攤銷(100/3)元,,結果得到3個33.33。后來實施對賬系統(tǒng),,始終有幾分錢對不齊,,郁悶了很久(不是幾分錢的事,是業(yè)務方質(zhì)疑的眼神讓研發(fā)很不爽),,最后發(fā)現(xiàn)是除法惹的禍 解決方案:使用“分”作為單位,,這樣數(shù)據(jù)庫里就是整數(shù)了
解讀: a) 涉及到區(qū)號或者國家代號,可能出現(xiàn)+-() b) 手機號會去做數(shù)學運算么,? c) varchar可以支持模糊查詢,,例如:like“138%”
解讀: a) 增加新的ENUM值要做DDL操作 b) ENUM的內(nèi)部實際存儲就是整數(shù),,你以為自己定義的是字符串,?
解讀: a) 主鍵遞增,,數(shù)據(jù)行寫入可以提高插入性能,,可以避免page分裂,減少表碎片提升空間和內(nèi)存的使用 b) 主鍵要選擇較短的數(shù)據(jù)類型,, Innodb引擎普通索引都會保存主鍵的值,,較短的數(shù)據(jù)類型可以有效的減少索引的磁盤空間,提高索引的緩存效率 c) 無主鍵的表刪除,,在row模式的主從架構,,會導致備庫夯住 四、索引設計規(guī)范
解讀:一個好的索引設計,,可以讓你的效率提高幾十甚至幾百倍,,但過多反而適得其反
解讀:字段超過5個時,實際已經(jīng)起不到有效過濾數(shù)據(jù)的作用了
解讀: a) 更新會變更B+樹,,更新頻繁的字段建立索引會大大降低數(shù)據(jù)庫性能 b) "性別"這種區(qū)分度不大的屬性,建立索引是沒有什么意義的,,不能有效過濾數(shù)據(jù),,性能與全表掃描類似
解讀:能夠更加有效的過濾數(shù)據(jù) 五、SQL使用規(guī)范
解讀: a) 讀取不需要的列會增加CPU、IO,、NET消耗 b) 不能有效的利用覆蓋索引 c) 使用SELECT *容易在增加或者刪除字段后出現(xiàn)程序BUG
解讀:容易在增加或者刪除字段后出現(xiàn)程序BUG
解讀:SELECT uid FROM t_user WHERE phone=13812345678 會導致全表掃描,而不能命中phone索引,,猜猜為什么,? int數(shù)據(jù)類型優(yōu)先級高于archer, 該查詢會把phone轉換為int,,因此需要把表中所有數(shù)據(jù)改成int,,所以必須全盤掃描 phone是varchar類型,SQL語句帶入的是整形,,故不會命中索引,,加個引號就好了: SELECT uid FROM t_user WHERE phone='13812345678'
解讀:SELECT uid FROM t_user WHERE from_unixtime(day)>='2017-02-15' 會導致全表掃描 正確的寫法是:SELECT uid FROM t_user WHERE day>= unix_timestamp('2017-02-15 00:00:00')
解讀:會產(chǎn)生臨時表,,消耗較多內(nèi)存與CPU,,極大影響數(shù)據(jù)庫性能,大表指的是數(shù)據(jù)量在1000萬以上的表
解讀:舊版本Mysql的OR查詢是不能命中索引的,,即使能命中索引,為何要讓數(shù)據(jù)庫耗費更多的CPU幫助實施查詢優(yōu)化呢,?
解讀: a) 負向查詢條件:NOT、!=,、<>,、!<、!>,、NOT IN,、NOT LIKE等,會導致全表掃描 b) %開頭的模糊查詢,,會導致全表掃描 一般來說,,WHERE過濾條件不會只帶這么一個“負向查詢條件”,還會有其他過濾條件,,舉個例子:查詢沈劍已完成訂單之外的訂單(好拗口): SELECT oid FROM t_order WHERE uid=123 AND status != 1; 訂單表5000w數(shù)據(jù),,但uid=123就會迅速的將數(shù)據(jù)量過濾到很少的級別(uid建立了索引),此時再接上一個負向的查詢條件就無所謂了,掃描的行數(shù)本身就會很少 但如果要查詢所有已完成訂單之外的訂單: SELECT oid FROM t_order WHERE status != 1; 這就掛了,,立馬CPU100%,,status索引會失效,負向查詢導致全表掃描
解讀:方便維護,,及時“查漏補缺” 總結:大數(shù)據(jù)量高并發(fā)的互聯(lián)網(wǎng)業(yè)務,極大影響數(shù)據(jù)庫性能的都不讓用,,不讓用喲,。 |
|
來自: 張小龍net館藏 > 《數(shù)據(jù)庫》