日本熟妇hd丰满老熟妇,中文字幕一区二区三区在线不卡 ,亚洲成片在线观看,免费女同在线一区二区

基于TairRoaring實現(xiàn)人群圈選方案

您可以通過Tair(企業(yè)版)的TairRoaring數(shù)據(jù)結(jié)構(gòu)快速搭建高性能的目標用戶篩選服務(wù)。

TairRoaring簡介

用戶標簽篩選場景往往應(yīng)用于個性化推薦、精準營銷等具體業(yè)務(wù)場景,通過不同的標簽輔以不同的運營營銷,從而實現(xiàn)資源投放方的商業(yè)利益最大化。

該類業(yè)務(wù)通常具備如下特點:

  • 用戶標簽極多,需要較高的存儲空間及良好的擴展能力。

  • 用戶規(guī)模大,需按照眾多維度添加標簽,數(shù)據(jù)分布較為離散。

  • 計算量大,應(yīng)用會根據(jù)不同策略需選取不同標簽的用戶,且對性能、實時性均有較高要求。

用戶圈選

Bitmap(又名Bitset)數(shù)據(jù)結(jié)構(gòu)可以較好地實現(xiàn)以上需求,使用少量的存儲空間來實現(xiàn)海量數(shù)據(jù)的查詢優(yōu)化。Redis開源版支持Bitmap運算,但是原生Bitmap往往難以應(yīng)付超大規(guī)模的人群打標問題:

  • 原生Bitmap受限于keyspace的大小,對于稀疏場景會出現(xiàn)空間效率急劇降低的情況。

  • 使用string進行Bitmap操作時,很多計算邏輯需要上載到用戶代碼邏輯中執(zhí)行,一來一回增加了3次額外的RTT(Round-Trip Time,往返時延)。

  • 原生Redis存儲Bitmap時極易產(chǎn)生大key,會對集群穩(wěn)定性帶來極大的挑戰(zhàn)。

Roaring屬于高度工程優(yōu)化的Bitmap實現(xiàn):

  • 通過2層索引和多種動態(tài)容器(Container),平衡了多種場景下性能和空間效率。

  • 使用了包括SIMD instructions、Vectorization、PopCnt算法等多種工程優(yōu)化,提升了計算效率,實現(xiàn)了高效的時空效率。

  • 基于Tair提供的強大計算性能和極高的穩(wěn)定性,為用戶場景保駕護航。

相比較原生Bitmap,TairRoaring具有更低的內(nèi)存占用、更高的集合計算效率,同時依托Tair高性能,提供更低的延遲和更高的吞吐。

目標用戶篩選流程

人群篩選類業(yè)務(wù)往往包括模型的生成和篩選等多個步驟。

TairRoaring應(yīng)用

  1. 用戶特征的原始數(shù)據(jù)往往存儲在關(guān)系型數(shù)據(jù)庫中,通過行schema存儲用戶的不同維度特征。

  2. 按需對原始數(shù)據(jù)進行處理,生成用戶UID到人群Tag信息的映射關(guān)系。

  3. 定時更新(導(dǎo)入)用戶UID到標簽信息的映射關(guān)系到TairRoaring引擎中(一般為T+1,表示業(yè)務(wù)的第二天導(dǎo)入前一天的數(shù)據(jù))。

  4. 通過TairRoaring加速業(yè)務(wù)計算:

    • 查詢目標用戶與人群Tag的關(guān)系。

      例如,判斷用戶(user1)是否屬于人群Tag-A (編號 16161)。

      TR.GETBIT user1 16161
    • 通過ANDORDIFF等操作構(gòu)造邏輯人群,并對邏輯人群信息進行計算。

      例如,獲取同時屬于人群Tag-B和Tag-C的所有目標用戶。

      TR.BITOP result AND Tag-B Tag-C
    • 也存在部分從Tag信息到用戶UID映射關(guān)系的場景,如風(fēng)險控制場景等。

      例如,查詢用戶(user1)是否屬于某個人群Tag-A中。

      TR.GETBIT Tag-A user1