相關(guān)性分析函數(shù)
針對(duì)系統(tǒng)中的多個(gè)觀測(cè)指標(biāo),可以快速找出與某個(gè)指標(biāo)項(xiàng)相關(guān)或者時(shí)序序列相關(guān)的指標(biāo)名稱。
函數(shù)列表
函數(shù) | 說明 |
| 針對(duì)系統(tǒng)中的多個(gè)觀測(cè)指標(biāo),快速找出和某個(gè)指標(biāo)項(xiàng)相關(guān)的指標(biāo)名稱。 |
| 針對(duì)系統(tǒng)中的多個(gè)觀測(cè)指標(biāo),快速找出和用戶輸入的時(shí)序序列相關(guān)的指標(biāo)名稱。 |
ts_association_analysis
函數(shù)格式:
select ts_association_analysis(stamp, params, names, indexName, threshold)
參數(shù)說明如下:
參數(shù) | 說明 | 取值 |
stamp | long 類型,表示UnixTime時(shí)間戳。 | - |
params | array(double)類型,表示待分析的指標(biāo)維度。 | 例如:Latency,QPS,NetFlow等。 |
names | array(varchar )類型,表示待分析的指標(biāo)名稱。 | 例如:Latency,QPS,NetFlow等。 |
indexName | varchar 類型,表示分析目標(biāo)指標(biāo)的名稱。 | 例如:Latency。 |
threshold | double 類型,表示其它分析指標(biāo)與目標(biāo)指標(biāo)間的相關(guān)性閾值。 | 取值范圍在:[0,1]。 |
結(jié)果輸出:
name:指標(biāo)的名稱。
score:該指標(biāo)與目標(biāo)指標(biāo)之間的相關(guān)性值,范圍在[0,1]之間。
代碼示例
* | select ts_association_analysis(
time,
array[inflow, outflow, latency, status],
array['inflow', 'outflow', 'latency', 'status'],
'latency',
0.1) from log;
結(jié)果示例:
| results |
| --------------------- |
| ['latency', '1.0'] |
| ['outflow', '0.6265'] |
| ['status', '0.2270'] |
ts_similar
函數(shù)格式一:
select ts_similar(stamp, value, ts, ds)
select ts_similar(stamp, value, ts, ds, metricType)
參數(shù)說明一:
參數(shù) | 說明 | 取值 |
stamp | long 類型,表示UnixTime時(shí)間戳。 | - |
value | double 類型,表示某指標(biāo)對(duì)應(yīng)的值。 | - |
ts | array(double)類型,表示指定曲線的時(shí)間序列信息。 | - |
ds | array(double)類型,表示指定曲線的數(shù)值序列信息。 | - |
metricType | varchar 類型,表示度量曲線間相關(guān)性的類型。 | 類型如下: SHAPE,RMSE,PEARSON,SPEARMAN,R2,KENDALL |
函數(shù)格式二:
select ts_similar(stamp, value, startStamp, endStamp, step, ds)
select ts_similar(stamp, value, startStamp, endStamp, step, ds, metricType )
參數(shù)說明二:
參數(shù) | 說明 | 取值 |
stamp | long 類型,表示UnixTime時(shí)間戳。 | - |
value | double 類型,表示某指標(biāo)對(duì)應(yīng)的值。 | - |
startStamp | long 類型,表示指定曲線的開始時(shí)間戳。 | - |
endStamp | long 類型,表示指定曲線的結(jié)束時(shí)間戳。 | - |
step | long類型,表示時(shí)序中相鄰兩個(gè)點(diǎn)之間的時(shí)間間隔。 | - |
ds | array(double)類型,表示指定曲線的數(shù)值序列信息。 | - |
metricType | varchar 類型,表示度量曲線間相關(guān)性的類型。 | 類型如下: SHAPE,RMSE,PEARSON,SPEARMAN,R2,KENDALL |
輸出結(jié)果:
score:該指標(biāo)與目標(biāo)指標(biāo)之間的相關(guān)性值,范圍在[-1, 1]之間。
代碼示例:
* | select vhost, metric, ts_similar(time, value, 1560911040, 1560911065, 5, array[5.1,4.0,3.3,5.6,4.0,7.2], 'PEARSON') from log group by vhost, metric;
結(jié)果示例:
| vhost | metric | score |
| ------ | --------------- | -------------------- |
| vhost1 | redolog | -0.3519082537204182 |
| vhost1 | kv_qps | -0.15922168009772697 |
| vhost1 | file_meta_write | NaN |