墨墨導(dǎo)讀:2020數(shù)據(jù)技術(shù)嘉年華于11月21日落下帷幕,大會(huì)歷時(shí)兩天,,來(lái)自全國(guó)各地的數(shù)據(jù)領(lǐng)域?qū)W術(shù)精英,、領(lǐng)袖人物、技術(shù)專家,、從業(yè)者和技術(shù)愛(ài)好者相聚北京,,見(jiàn)證了個(gè)人的快速成長(zhǎng)、技術(shù)的迭代進(jìn)步,、行業(yè)的蓬勃發(fā)展,、生態(tài)的融合共贏,以及市場(chǎng)的風(fēng)云變遷,。 2020數(shù)據(jù)技術(shù)嘉年華近50個(gè)PPT下載,、視頻回放已上傳墨天輪平臺(tái),可在“數(shù)據(jù)和云”公眾號(hào)回復(fù)關(guān)鍵詞“2020DTC”獲得,! 本文根據(jù) 鞏飛 老師在 2020數(shù)據(jù)技術(shù)嘉年華 分享的主題《大規(guī)模多種數(shù)據(jù)庫(kù)熱點(diǎn)SQL質(zhì)量分析》整理而成,。 摘要 在企業(yè)級(jí)運(yùn)維工作中,,我們面對(duì)的往往是多種數(shù)據(jù)庫(kù),,數(shù)十甚至數(shù)百套數(shù)據(jù)庫(kù),需要在有異動(dòng)時(shí)能快速響應(yīng),,更需要能提前感知,,在問(wèn)題產(chǎn)生前就找出風(fēng)險(xiǎn)點(diǎn)并消除,。在數(shù)據(jù)庫(kù)運(yùn)維中,大多數(shù)問(wèn)題都是由SQL引發(fā)的,,今天和大家分享的內(nèi)容就是一種能夠同時(shí)對(duì)數(shù)百套Oracle,、MySQL、DB2,、SQL Server、PostgreSQL,、OceanBase數(shù)據(jù)庫(kù)抓取TopSQL,,分析SQL質(zhì)量,找出風(fēng)險(xiǎn)點(diǎn)的方法,。 一直以來(lái),大部分?jǐn)?shù)據(jù)庫(kù)性能問(wèn)題都是由應(yīng)用開(kāi)發(fā)產(chǎn)生的不良SQL,、不良表設(shè)計(jì)(低效,、不規(guī)范)所致,并且在測(cè)試,、開(kāi)發(fā)過(guò)程中缺乏有效的審核管理和流程規(guī)范,,導(dǎo)致SQL問(wèn)題不能及時(shí)有效解決。當(dāng)應(yīng)用發(fā)布上線以后,,爆發(fā)各種性能問(wèn)題和安全問(wèn)題,,DBA陷于各種救火工作。 質(zhì)量管理的核心思想是提前把事情做對(duì),,通過(guò)一定的質(zhì)量管理投入來(lái)分析SQL質(zhì)量,,優(yōu)化問(wèn)題SQL,將SQL問(wèn)題消滅在萌芽階段,,避免影響業(yè)務(wù)高效穩(wěn)定運(yùn)行,。 既然SQL質(zhì)量分析是很值得做的事情,,那要做哪些,?是將所有運(yùn)行的SQL均進(jìn)行分析?這樣量太大,,成本太高,。是隨機(jī)采樣SQL進(jìn)行分析?這樣覆蓋率有限,,很容易錯(cuò)過(guò)嚴(yán)重風(fēng)險(xiǎn),。
從執(zhí)行次數(shù)、執(zhí)行時(shí)長(zhǎng),、消耗資源等不同維度,,提取TopSQL作為分析對(duì)象。提取Top 10,,Top 20還是Top 50,?每小時(shí),每天還是每業(yè)務(wù)周期提取一次,?分析時(shí)采用專家模型還是機(jī)器學(xué)習(xí)模型,?展示時(shí)列表式,報(bào)表式,,圖形式還是告警式,?這些都可以隨著需求場(chǎng)景,靈活設(shè)定,。 通過(guò)采集、分析,、展示三大環(huán)節(jié),,就可以實(shí)現(xiàn)大規(guī)模多種數(shù)據(jù)庫(kù)熱點(diǎn)SQL質(zhì)量分析的目標(biāo)。 采集:實(shí)現(xiàn)按需拿到要分析的SQL,。需要包含采集任務(wù)管控,,按頻率調(diào)度,合適的采集腳本,。 分析:實(shí)現(xiàn)對(duì)SQL進(jìn)行全面分析,,判斷其有無(wú)風(fēng)險(xiǎn),具體的風(fēng)險(xiǎn)情況,。需要包含SQL的詞法解析,,語(yǔ)義識(shí)別,提取支撐分析的元數(shù)據(jù),、統(tǒng)計(jì)信息,、執(zhí)行計(jì)劃等,以專家經(jīng)驗(yàn)?zāi)P?,機(jī)器學(xué)習(xí)模型,,或二者結(jié)合進(jìn)行風(fēng)險(xiǎn)分析。 展示:以適合的方式將SQL及其風(fēng)險(xiǎn)點(diǎn),,對(duì)象信息,、統(tǒng)計(jì)信息,、執(zhí)行計(jì)劃進(jìn)行展示。 2. Oracle中如何獲取TopSQL? 3. MySQL中如何獲取TopSQL? 4. DB2中如何獲取TopSQL,? 5. SQL Server中如何獲取TopSQL,? 6. PostgreSQL中如何獲取TopSQL,? 7. OceanBase中如何獲取TopSQL,? 8. 如何做SQL解析,? 上圖為Calcite架構(gòu) 無(wú)論哪種方式,,均需兼容Oracle、MySQL,、DB2,、SQL Server、PostgreSQL,、OceanBase等各種數(shù)據(jù)庫(kù)的SQL語(yǔ)法區(qū)別,,增強(qiáng)元數(shù)據(jù)特征,提取源生執(zhí)行計(jì)劃,。 這里舉個(gè)例子,,比如SQL語(yǔ)句: SELECT * FORM CUSTOMER WHERE IDCARDNO='320113198001003226' 在經(jīng)過(guò)解析后,生成的語(yǔ)法樹(shù)是下面的樣子,。 9. 如何做SQL分析,? 在SQL分析時(shí),主流有兩種做法,,專家經(jīng)驗(yàn)方式,,機(jī)器學(xué)習(xí)方式。 專家經(jīng)驗(yàn)方式,如上圖,,主要就是根據(jù)專家經(jīng)驗(yàn),,將SQL可能存在的風(fēng)險(xiǎn)提煉出來(lái),總結(jié)出每種風(fēng)險(xiǎn)的特征,、危害,、檢測(cè)算法,即規(guī)則,,最后形成規(guī)則庫(kù),,比如: 規(guī)則,是有效經(jīng)驗(yàn)的濃縮,,越豐富可以發(fā)現(xiàn)的風(fēng)險(xiǎn)越多,。應(yīng)支持用戶自定義規(guī)則。 在分析時(shí),,主要是用規(guī)則庫(kù)中每個(gè)規(guī)則算法對(duì)SQL進(jìn)行比對(duì),,確定出其風(fēng)險(xiǎn)點(diǎn)。還可以再根據(jù)風(fēng)險(xiǎn)點(diǎn)清單給SQL生成質(zhì)量評(píng)分,。 機(jī)器學(xué)習(xí)方式,,如上圖,主要就是通過(guò)Agent與環(huán)境不斷試錯(cuò)的過(guò)程的方式進(jìn)行交互,,尋找最優(yōu)決策策略,,以最大化與環(huán)境交互獲得的累計(jì)獎(jiǎng)勵(lì),。在數(shù)學(xué)上可建模為馬爾科夫決策過(guò)程(MDP,,Markov Decision Process),用于在系統(tǒng)狀態(tài)具有馬爾可夫性質(zhì)的環(huán)境中模擬智能體可實(shí)現(xiàn)的隨機(jī)策略與回報(bào),,要素包括狀態(tài),、動(dòng)作、策略和獎(jiǎng)勵(lì),。 實(shí)際執(zhí)行時(shí)間作為Reward進(jìn)行訓(xùn)練,,即執(zhí)行策略的調(diào)整。目標(biāo)是找到查詢執(zhí)行時(shí)間最小的執(zhí)行計(jì)劃,。 10. 為何要建立知識(shí)庫(kù),? 如果你長(zhǎng)期進(jìn)行SQL質(zhì)量分析、SQL優(yōu)化相關(guān)工作,,就會(huì)發(fā)現(xiàn),,SQL雖然可以千奇百怪,寫成各種各樣,,但其底層原理,,高效的原則卻是相同的。所以建立單位內(nèi)部SQL相關(guān)的知識(shí)庫(kù),不僅能總結(jié)過(guò)去,,還可以指導(dǎo)未來(lái),。在分析出風(fēng)險(xiǎn)SQL后,給不擅長(zhǎng)優(yōu)化的同事提供資源支撐,。建議知識(shí)庫(kù)至少涵蓋SQL知識(shí)背景,、SQL優(yōu)化原則、SQL優(yōu)化原理,、SQL優(yōu)化示例,、SQL編寫規(guī)范等,并隨著業(yè)務(wù)發(fā)展不斷積累更新,。 11. 怎么樣支撐大規(guī)模多種數(shù)據(jù)庫(kù)的并SQL質(zhì)量分析,? 平臺(tái)工作區(qū),,即大規(guī)模多種數(shù)據(jù)庫(kù)熱點(diǎn)SQL質(zhì)量分析平臺(tái),分為應(yīng)用層和數(shù)據(jù)層,。應(yīng)用層由反向應(yīng)用代理,、應(yīng)用服務(wù)、數(shù)據(jù)緩存組每種組件均無(wú)單故障點(diǎn),,并可水平擴(kuò)展,。數(shù)據(jù)層由數(shù)據(jù)代理、MySQL主從復(fù)制\集群組成,,每種組件均無(wú)單故障點(diǎn),,并可水平擴(kuò)展。各個(gè)組件的協(xié)作圖示意如下: 至此,,我們的整個(gè)方案思路和要點(diǎn)已經(jīng)介紹完畢,,有能力或精力的朋友們,可以嘗試落地實(shí)踐,,在SQL質(zhì)量分析和管控方面更近一步,。也可以采用成熟的SQL質(zhì)量管控平臺(tái)-SQM。SQM將SQL質(zhì)控按場(chǎng)景工具化,、自動(dòng)化,,和DevOps過(guò)程集成起來(lái),可以高效的實(shí)現(xiàn)質(zhì)控目標(biāo),。 - end - |
|
來(lái)自: 數(shù)據(jù)和云 > 《待分類》