国产美女大量吞精在线播放,亚洲av日韩av动漫在线,亚洲欧美v不卡在线

Distributed MapJoin是MapJoin的升級版，適用于大表Join中表的場景，二者的核心目的都是為了減少大表側的Shuffle和排序。

注意事項

Join兩側的表數據量要求不同，大表側數據在10 TB以上，中表側數據在[1 GB, 100 GB]范圍內。
小表側的數據需要均勻分布，沒有明顯的長尾，否則單個分片會產生過多的數據，導致OOM（Out Of Memory）及RPC（Remote Procedure Call）超時問題。
SQL任務運行時間在20分鐘以上，建議使用Distributed MapJoin進行優化。
由于在執行任務時，需要占用較多的資源，請避免在較小的Quota組運行。
說明
您可以在配額（Quota）管理頁面，修改配額組，詳情請參見Quota管理（新版）。

使用方法

您需要在select語句中使用Hint提示/*+distmapjoin(<table_name>(shard_count=<n>,replica_count=<m>))*/才會執行distmapjoin。shard_count和replica_count共同決定任務運行的并發度，即并發度=shard_count * replica_count。

參數說明
- table_name：目標表名。
- shard_count=<n>：設置小表數據的分片數，小表數據分片會分布至各個計算節點處理。n即為分片數，一般按奇數設置。
  說明
  - shard_count值建議手動指定，shard_count值可以根據小表數據量來大致估算，預估一個分片節點處理的數據量范圍是[200 MB, 500 MB]。
  - shard_count設置過大，性能和穩定性會受影響；shard_count設置過小，會因內存使用過多而報錯。
- replica_count=<m>：設置小表數據的副本數。m即為副本數，默認為1。
  說明
  為了減少訪問壓力以及避免單個節點失效導致整個任務失敗，同一個分片的數據，可以有多個副本。當并發過多，或者環境不穩定導致運行節點頻繁重啟，可以適當提高replica_count，一般建議為2或3。

語法示例

-- 推薦，指定shard_count（replica_count默認為1）
/*+distmapjoin(a(shard_count=5))*/

-- 推薦，指定shard_count和replica_count
/*+distmapjoin(a(shard_count=5,replica_count=2))*/

-- distmapjoin多個小表
/*+distmapjoin(a(shard_count=5,replica_count=2),b(shard_count=5,replica_count=2)) */

-- distmapjoin和mapjoin混用
/*+distmapjoin(a(shard_count=5,replica_count=2)),mapjoin(b)*/

使用示例

為了便于理解，本文以向分區表tmall_dump_lasttable插入數據為例，為您演示Distributed MapJoin的用法。

常規寫法。

insert OVERWRITE table tmall_dump_lasttable partition(ds='20211130')
select t1.*
from
(
    select nid, doc,type
    from search_ods.dump_lasttable where ds='20211203'
)t1
join
(
    select distinct item_id
    from tbcdm.dim_tb_itm
    where ds='20211130'
    and bc_type='B'
    and is_online='Y'
)t2
on t1.nid=t2.item_id;

優化后寫法。

insert OVERWRITE table tmall_dump_lasttable partition (ds='20211130')
select /*+ distmapjoin(t2(shard_count=35)) */ t1.*
from
(
    select nid, doc, type
    from search_ods.dump_lasttable where ds='20211203'
)t1
join
(
    select distinct item_id
    from tbcdm.dim_tb_itm
    where ds='20211130'
    and bc_type='B'
    and is_online='Y'
)t2
on t1.nid=t2.item_id;

日本熟妇hd丰满老熟妇,中文字幕一区二区三区在线不卡 ,亚洲成片在线观看,免费女同在线一区二区

DISTRIBUTED MAPJOIN

注意事項

使用方法

使用示例