日本熟妇hd丰满老熟妇,中文字幕一区二区三区在线不卡 ,亚洲成片在线观看,免费女同在线一区二区

核心自治技術(shù)案例解析

通過數(shù)據(jù)庫自治服務(wù)DAS,可以幫助企業(yè)節(jié)省90%的數(shù)據(jù)庫管理成本,降低80%的運維風(fēng)險,讓您可以更集中在業(yè)務(wù)創(chuàng)新,讓業(yè)務(wù)持續(xù)行駛在快車道上。本文以雙11期間的實際案例介紹DAS已擁有的核心自治特性:7x24實時異常檢測、故障自愈、自動優(yōu)化、自動彈性、智能壓測。

7x24實時異常檢測

DAS的7x24實時異常檢測通過機器學(xué)習(xí)算法,實時對數(shù)據(jù)庫的Workload進行異常檢測,相比傳統(tǒng)基于閾值的告警方式,能夠更及時的發(fā)現(xiàn)數(shù)據(jù)庫的異常,而不是靠故障驅(qū)動。您可以采集各種數(shù)據(jù),比如從鏈路上采集數(shù)百個數(shù)據(jù)庫性能指標和從鏈路上采集已加載SQL語句的查詢?nèi)罩荆A繑?shù)據(jù)的離在線處理與存儲,基于機器學(xué)習(xí)和數(shù)據(jù)庫領(lǐng)域預(yù)測算法,實現(xiàn)各業(yè)務(wù)數(shù)據(jù)庫實例的持續(xù)模型訓(xùn)練,實時模型預(yù)測和實時異常檢測分析能夠順利運行。相比傳統(tǒng)基于規(guī)則和基于閾值的方式,實時異常檢測具備以下優(yōu)勢:

  • 檢測范圍更廣,例如不僅限監(jiān)控指標, 還包括SQL、日志、鎖等。

  • 實現(xiàn)準實時的檢測,大大超前傳統(tǒng)方式發(fā)現(xiàn)異常。

  • 基于AI和異常驅(qū)動的檢測技術(shù),而非故障驅(qū)動的檢測。

  • 具備周期性識別能力,自適應(yīng)業(yè)務(wù)特征,擁有提前預(yù)測能力。

7*24

現(xiàn)實中常見的workload場景,如毛刺特征、周期性特征、趨勢性特征、均值偏移特征等, 異常檢測服務(wù)都能夠準確自動識別,并支持多種時序特征疊加識別,識別出異常后, 會觸發(fā)基于根因的全局診斷分析,以及后續(xù)的異常恢復(fù)、優(yōu)化自治場景。

222

故障自愈

通過7x24實時異常檢測, 數(shù)據(jù)庫實例異常完成實時檢測發(fā)現(xiàn),DAS自動進行根因分析,自動執(zhí)行相關(guān)止損或修復(fù)操作,幫助數(shù)據(jù)庫自動恢復(fù),減少對企業(yè)業(yè)務(wù)的影響。如下圖為雙11期間自動SQL限流的實際案例:

224

某自治服務(wù)接入實例于2020年11月5日12點31分,活躍會話數(shù)和CPU開始驟然飆升,DAS異常檢測中心于12點33分確定此次飆升為一次數(shù)據(jù)庫異常而非抖動尖刺,觸發(fā)SQL自動限流根因診斷,12點34分診斷完成,共發(fā)現(xiàn)兩條導(dǎo)致該次異常的問題SQL,發(fā)現(xiàn)問題SQL后隨即發(fā)起自動限流,活躍會話數(shù)開始降低,存量已提交問題SQL執(zhí)行結(jié)束后,活躍會話數(shù)開始急速恢復(fù),CPU使用率同時也恢復(fù)到正常。整個過程滿足“1-5-10”異常自愈能力, 即1分鐘發(fā)現(xiàn),5分鐘定位,10分鐘恢復(fù)。

外置式SQL自動優(yōu)化

按照經(jīng)驗,約80%的數(shù)據(jù)庫性能問題可通過SQL優(yōu)化手段解決,但SQL優(yōu)化一直以來都是一個非常復(fù)雜的過程,需要多方面的數(shù)據(jù)庫領(lǐng)域?qū)<抑R和經(jīng)驗,另外,由于SQL工作負載不斷變化,SQL優(yōu)化還是一項非常耗時繁重的任務(wù),這些都決定了SQL優(yōu)化是一項高門檻,高投入且非常專業(yè)的工作。

數(shù)據(jù)庫自治服務(wù)DAS基于全局workload和真實的業(yè)務(wù)場景,持續(xù)對數(shù)據(jù)庫進行SQL Review和優(yōu)化,就像有一個不知疲倦的專業(yè)DBA一直在守護著您的數(shù)據(jù)庫,將SQL優(yōu)化推向了更高的境界。同時,DAS的SQL診斷能力有與傳統(tǒng)不同的技術(shù)特征,如:

  • DAS采用外置式的,基于代價模型方式,實現(xiàn)索引、語句改寫推薦,以及性能瓶頸問題識別和推薦,避免傳統(tǒng)規(guī)則式的,過于機械化,推薦質(zhì)量無法保證,無法量化性能提升收益等問題。

  • DAS在這些方面提供了足夠覆蓋度的場景:測試用例的正式特征庫、在線用例的自動反饋提取、阿里巴巴多樣化的應(yīng)用場景。

  • 基于全局的Workload優(yōu)化,基于Workload特征,例如SQL執(zhí)行頻率,讀寫比等進行優(yōu)化,最大限度地消除局部優(yōu)化的片面性弊端。

225

下面是雙11期間自動SQL優(yōu)化一個實際案例:某自治服務(wù)接入實例, DAS于11月7日通過負載異常檢測到因慢SQL引起的負載異常,自動觸發(fā)SQL優(yōu)化閉環(huán),SQL語句優(yōu)化上線后,經(jīng)過持續(xù)24小時優(yōu)化效果跟蹤完成優(yōu)化收益評估,優(yōu)化效果顯著,如優(yōu)化之前后的平均RT及掃描行數(shù)如下圖所示,據(jù)統(tǒng)計,在優(yōu)化之前,被優(yōu)化SQL的平均掃描行數(shù)為148889.198,平均RT為505.561毫秒。而優(yōu)化之后,平均掃描行數(shù)為12.132,大約降為優(yōu)化前的萬分之一,而平均RT降至0.471毫秒,也大約降低到優(yōu)化前的千分之一。

  • 自動SQL優(yōu)化前平均RT及掃描行數(shù):s

  • 自動SQL優(yōu)化后平均RT及掃描行數(shù):;

自動彈性

云上數(shù)據(jù)庫提供基于計算規(guī)格的選項以及存儲容量供用戶選擇,當用戶業(yè)務(wù)Workload規(guī)模變化時可適當進行彈性擴縮容,但對于云原生應(yīng)用而言,數(shù)據(jù)庫能夠根據(jù)業(yè)務(wù)Workload的變化自動決定最合適的規(guī)格,使用最小的資源完成業(yè)務(wù)所需的數(shù)據(jù)庫容量。DAS基于AI的時序列預(yù)測,能夠自動對數(shù)據(jù)庫的業(yè)務(wù)模型、容量水位進行計算和預(yù)測,實現(xiàn)及時按需(或先知先覺式)自動擴縮容。

DAS的自動彈性實現(xiàn)了一套完整的數(shù)據(jù)閉環(huán),包含性能采集、決策中心、算法模型、規(guī)格建議模塊、管控執(zhí)行以及任務(wù)跟蹤評估等。

  • 性能采集負責對實例進行實時性能數(shù)據(jù)采集,涉及數(shù)據(jù)庫的多項性能指標信息、規(guī)格配置信息、實例運行會話信息等。

  • 決策中心模塊則會根據(jù)當前性能數(shù)據(jù)、實例會話列表數(shù)據(jù)等信息進行全局判斷,以基于根因的全局自治,例如可通過SQL限流來解決當前計算資源不足的問題則會采取限流處理。若確實為突增的業(yè)務(wù)流量,則會繼續(xù)進行彈性服務(wù)流程。

  • 算法模型是整個DAS 自動彈性服務(wù)的核心,負責對數(shù)據(jù)庫實例的業(yè)務(wù)負載異常檢測和容量規(guī)格模型推薦進行計算,解決核心的擴容時機、擴容方式、計算規(guī)格選擇問題。

  • 規(guī)格推薦和驗證模塊生成具體的推薦規(guī)范,并檢查推薦的規(guī)范是否適合數(shù)據(jù)庫實例的部署類型和實際運行環(huán)境。該模塊還會重復(fù)檢查推薦的規(guī)范是否可以在當前區(qū)域購買,這確保了推薦的規(guī)范可以在管理端順利使用。

  • 管控執(zhí)行負責按照產(chǎn)出的規(guī)格建議進行分發(fā)執(zhí)行。

  • 狀態(tài)跟蹤最后用于衡量和跟蹤規(guī)格變更前后數(shù)據(jù)庫實例上的性能變化情況。

下圖是雙11期間自動SQL優(yōu)化一個實際案例,某自治服務(wù)接入實例,用戶的業(yè)務(wù)流量不斷上升,PolarDB實例的CPU使用率不斷飆高并達到了高負載狀態(tài),此時DAS的Autoscaling算法精確的識別出了實例當前的異常狀態(tài),于是自動為實例增加了兩個只讀節(jié)點,實例的CPU使用率成功降到了較低的水位;在維持該狀態(tài)兩個小時后,用戶實例的流量依然在不斷上升,并第二次觸發(fā)DAS的Autoscaling,DAS Autoscaling將實例的規(guī)格從4核8GB升級到8核16GB,并平穩(wěn)持續(xù)了10多個小時,幫助用戶順利度過了業(yè)務(wù)高峰期。s

智能壓測

DAS提供的智能壓測服務(wù)能夠幫助您在上云或在業(yè)務(wù)大促前評估所需的數(shù)據(jù)庫規(guī)格容量。規(guī)格自動擴容AutoScale能力能夠幫助您在根據(jù)配置的數(shù)據(jù)庫性能閾值,或根據(jù)DAS內(nèi)置智能化策略自動觸發(fā)擴縮容動作,從而一定程度上解決了做規(guī)格評估和管理的負擔。

傳統(tǒng)的壓測方案大部分基于現(xiàn)有的壓測工具,如sysbench、TPCC等,其最大的問題是這些壓測工具對應(yīng)的SQL與真實業(yè)務(wù)差距太大,壓測結(jié)果無法準確反映出真實業(yè)務(wù)的性能和穩(wěn)定性。DAS提供的智能壓測服務(wù)是基于用戶真實業(yè)務(wù)的workload,因此壓測結(jié)果可以直接體現(xiàn)在不同壓力下的性能和穩(wěn)定性變化。達到該目標,智能壓測需要解決如下挑戰(zhàn):

  • 在不能采集大量SQL的情況,如何提供長時間壓測,如7x24小時穩(wěn)定性壓測。因為SQL采集需要時間和存儲成本,在給定部分SQL的情況,DAS需要生成滿足業(yè)務(wù)要求的SQL。

  • 并發(fā)回放能力:DAS需要保證和真實業(yè)務(wù)一致的并發(fā),并能夠提供倍速(如2倍速、10倍速等)和峰值壓測功能。

s

DAS通過自動學(xué)習(xí)業(yè)務(wù)模型,自動生成符合壓測時間的真實業(yè)務(wù)Workload,同時提供給用戶更豐富的壓測場景,幫助用戶解決大促、數(shù)據(jù)庫選型等問題。