日本熟妇hd丰满老熟妇,中文字幕一区二区三区在线不卡 ,亚洲成片在线观看,免费女同在线一区二区

在推薦系統中應用FeatureStore管理特征

本文以FeatureStore的特征表為例,為您介紹FeatureStore從創建與注冊到最終上線的過程,幫助您了解如何從零開始搭建并上線一套完整的推薦系統。

背景信息

推薦系統是一種能夠根據用戶的興趣和偏好,向用戶推薦個性化的內容或產品的系統。在推薦系統中,提取和配置用戶或物品的特征信息非常重要。通過本文提供的解決方案,您可以了解如何使用FeatureStore搭建推薦系統,以及FeatureStore在推薦系統中如何通過各個版本的SDK與其他推薦系統產品進行交互。具體表現為:在FeatureStore中創建項目,注冊特征表,創建模型特征,導出訓練樣本表,從離線數據源同步特征到在線數據源,利用訓練樣本表訓練模型,部署EAS模型服務,以及如何使用PAI-REC中的FeatureStore中的相關配置等整個推薦系統流程。

對于熟悉代碼的用戶,您可以通過直接運行Python Notebook查看具體配置流程,具體操作詳情請參見DSW Gallery

更多關于FeatureStore的信息,請參見FeatureStore概述

如果您在配置或使用過程中有任何問題,可以搜索釘釘群號:34415007523,進入答疑群聯系技術人員進行咨詢。

前提條件

在開始執行操作前,請確認您已完成以下準備工作。

依賴產品

具體操作

人工智能平臺 PAI

已開通PAI服務并創建PAI工作空間,操作詳情請參見開通PAI并創建默認工作空間

云原生大數據計算服務 MaxCompute

實時數倉 Hologres

大數據開發治理平臺 DataWorks

推薦全鏈路深度定制開放平臺 PAI-REC

已開通PAI-REC服務,操作詳情請參見全鏈路服務初始化和權限開通介紹

對象存儲 OSS

已開通OSS服務,操作詳情請參見控制臺快速入門

步驟一:準備數據

同步數據表

一般對于推薦場景,需要準備三張數據表:user側的特征表item側的特征表以及Label

為方便實踐操作,我們在MaxComputepai_online_project項目中提前準備了模擬生成的用戶表、物料表和Label表進行示例說明。其中,用戶表、物料表每個分區大約有10萬條數據,在MaxCompute中分別占用約70 MB;Label表每個分區約45萬條數據,在MaxCompute中占用約5 MB。

您需要在DataWorks中執行SQL命令,將用戶表、物料表、Label表從pai_online_project項目同步到自己的MaxCompute中。具體操作步驟如下:

  1. 登錄DataWorks控制臺

  2. 在左側導航欄單擊數據開發與治理 > 數據開發

  3. 選擇已創建的DataWorks工作空間后,單擊進入數據開發

  4. 鼠標懸停至新建,選擇新建節點 > MaxCompute > ODPS SQL,在彈出的頁面中配置節點參數。

    參數

    取值建議

    引擎實例

    選擇已創建的MaxCompute引擎。

    節點類型

    ODPS SQL

    路徑

    業務流程/Workflow/MaxCompute

    名稱

    可自定義名稱。

  5. 單擊確認

  6. 在新建節點區域運行以下SQL命令,將用戶表、物料表、Label表從pai_online_project項目同步到自己的MaxCompute中。資源組選擇已創建的獨享資源組。

    同步用戶表:rec_sln_demo_user_table_preprocess_all_feature_v1(單擊查看詳情)

    CREATE TABLE IF NOT EXISTS rec_sln_demo_user_table_preprocess_all_feature_v1
    like pai_online_project.rec_sln_demo_user_table_preprocess_all_feature_v1
    STORED AS ALIORC  
    LIFECYCLE 90;
    
    INSERT OVERWRITE TABLE rec_sln_demo_user_table_preprocess_all_feature_v1
    PARTITION(ds='${bdp.system.bizdate}')
    SELECT * except(ds)
    FROM pai_online_project.rec_sln_demo_user_table_preprocess_all_feature_v1
    WHERE ds = '${bdp.system.bizdate}';

    其中,${bdp.system.bizdate}是參數,可以通過補數據執行獲取以下三個分區的數據:

    ds=20231022

    ds=20231023

    ds=20231024

    同步物料表:rec_sln_demo_item_table_preprocess_all_feature_v1(單擊查看詳情)

    CREATE TABLE IF NOT EXISTS rec_sln_demo_item_table_preprocess_all_feature_v1
    like pai_online_project.rec_sln_demo_item_table_preprocess_all_feature_v1
    STORED AS ALIORC  
    LIFECYCLE 90;
    
    INSERT OVERWRITE TABLE rec_sln_demo_item_table_preprocess_all_feature_v1
    PARTITION(ds='${bdp.system.bizdate}')
    SELECT * except(ds)
    FROM pai_online_project.rec_sln_demo_item_table_preprocess_all_feature_v1
    WHERE ds = '${bdp.system.bizdate}';

    其中,${bdp.system.bizdate}是參數,可以通過補數據執行獲取以下三個分區的數據:

    ds=20231022

    ds=20231023

    ds=20231024

    同步Label表:rec_sln_demo_label_table(單擊查看詳情)

    CREATE TABLE IF NOT EXISTS rec_sln_demo_label_table
    like pai_online_project.rec_sln_demo_label_table
    STORED AS ALIORC  
    LIFECYCLE 90;
    
    INSERT OVERWRITE TABLE rec_sln_demo_label_table
    PARTITION(ds='${bdp.system.bizdate}')
    SELECT * except(ds)
    FROM pai_online_project.rec_sln_demo_label_table
    WHERE ds = '${bdp.system.bizdate}';

    其中,${bdp.system.bizdate}是參數,可以通過補數據執行獲取以下三個分區的數據:

    ds=20231022

    ds=20231023

    ds=20231024

  7. 對已同步的表進行補數據操作。

    1. DataWorks控制臺界面,單擊左側導航欄的數據開發與治理 > 運維中心,在下拉框中選擇對應工作空間后單擊進入運維中心

    2. 在左側導航欄單擊周期任務運維 > 周期任務,進入周期任務頁面。

    3. 單擊周期任務列表中的目標任務,打開該任務的DAG圖。

    4. 右鍵單擊目標節點,選擇補數據 > 當前節點,選擇相應的補數據模式。

    5. 業務日期選擇2023-10-222023-10-24,單擊確定

完成上述操作后,您可以在自己的工作空間內查看用戶表rec_sln_demo_user_table_preprocess_all_feature_v1、物料表rec_sln_demo_item_table_preprocess_all_feature_v1Labelrec_sln_demo_label_table,后續的實踐操作將以這三張表為例進行說明。

配置數據源

FeatureStore一般需要配置兩個數據源:離線數據源(MaxCompute)和在線數據源(Hologres/GraphCompute/TableStore)。本文以MaxComputeHologres為例進行說明。

  1. 登錄PAI控制臺,在左側導航欄單擊數據準備 > 特征平臺(FeatureStore)

  2. 選擇工作空間后,單擊進入FeatureStore

  3. 配置MaxCompute數據源。

    1. 數據源頁簽,單擊新建數據源,在彈出的頁面中配置MaxCompute數據源具體參數。

      參數

      取值建議

      類型

      MaxCompute

      名稱

      可自定義名稱。

      MaxCompute項目名

      選擇已創建的MaxCompute項目。

    2. 請復制語句并單擊立即前往,同步數據至Hologres,在DataWorks執行該語句后,即可完成授權。

      說明

      授權操作需要您的賬號擁有admin權限,具體操作詳情請參見通過命令管理用戶權限通過控制臺管理用戶權限

    3. 完成后單擊提交

  4. 配置Hologres數據源。

    1. 數據源頁簽,單擊新建數據源,在彈出的頁面中配置Hologres數據源具體參數。

      參數

      取值建議

      類型

      Hologres

      名稱

      可自定義名稱。

      實例ID

      選擇已創建的Hologres實例名稱。

      數據庫名稱

      選擇已創建的實例數據庫。

    2. 完成后單擊提交

    3. Hologres進行授權,具體操作詳情請參見配置數據源

安裝FeatureStore Python SDK

  1. 登錄DataWorks控制臺界面。

  2. 在左側導航欄單擊資源組

  3. 獨享資源組頁簽中,單擊相應調度資源后的image,選擇運維助手

  4. 單擊創建命令,在彈出的頁面中配置命令參數。

    參數

    取值建議

    命令名稱

    可自定義名稱。本文以install為例進行說明。

    命令類型

    手動輸入(無法使用pip命令安裝第三方包)

    命令內容

    /home/tops/bin/pip3 install -i https://pypi.tuna.tsinghua.edu.cn/simple https://feature-store-py.oss-cn-beijing.aliyuncs.com/package/feature_store_py-1.3.1-py3-none-any.whl

    超時時間

    可自定義時間。

  5. 單擊創建,完成命令創建。

  6. 單擊運行命令,在彈出的頁面中單擊運行

  7. 可單擊刷新查看最新執行狀態,待狀態為成功時,即表示完成安裝。

步驟二:創建并注冊FeatureStore

您可以根據實際需求選擇通過控制臺或者SDK兩種方式創建并注冊FeatureStore。由于后續導出Training Set和同步數據都需要使用SDK,所以如果選擇控制臺操作的方式,完成控制臺配置后,仍需要使用FeatureStore Python SDK。

方式一:控制臺操作

  1. 創建FeatureStore項目

    1. 登錄PAI控制臺,在左側導航欄單擊數據準備 > 特征平臺(FeatureStore)

    2. 選擇工作空間后,單擊進入FeatureStore

    3. 項目頁簽,單擊新建項目,在彈出的頁面中配置項目參數。

      參數

      取值建議

      名稱

      可自定義名稱。本文以fs_demo為例進行說明。

      描述

      可自定義描述。

      離線數據源(Offline Store)

      選擇已創建的MaxCompute數據源。

      在線數據源(Online Store)

      選擇已創建的Hologres數據源。

    4. 單擊提交,完成FeatureStore項目創建。

  2. 創建特征實體(Feature Entity)

    1. FeatureStore項目列表頁面,單擊項目名稱,進入項目詳情頁面。

    2. 特征實體頁簽中單擊新建特征實體,在彈出的頁面中配置user特征實體參數。

      參數

      取值建議

      特征實體名稱

      可自定義名稱。本文以user為例進行說明。

      Join Id

      user_id

    3. 單擊提交

    4. 單擊新建特征實體,在彈出的頁面中配置item特征實體參數。

      參數

      取值建議

      特征實體名稱

      可自定義名稱。本文以item為例進行說明。

      Join Id

      item_id

    5. 單擊提交,完成特征實體創建。

  3. 創建特征視圖(Feature View)

    1. 在特征項目詳情頁面的特征視圖頁簽,單擊新建特征視圖,在彈出的頁面中配置user特征視圖參數。

      參數

      取值建議

      視圖名稱

      可自定義名稱。本文以user_table_preprocess_all_feature_v1為例進行說明。

      類型

      離線

      寫入方式

      使用離線表

      數據源

      選擇已創建的MaxCompute數據源。

      特征表

      選擇已準備的用戶表rec_sln_demo_user_table_preprocess_all_feature_v1

      特征字段

      勾選user_id主鍵。

      同步在線特征表

      特征實體

      user

      特征生命周期(秒)

      保持默認。

    2. 單擊提交

    3. 單擊新建特征視圖,在彈出的頁面中配置item特征視圖。

      參數

      取值建議

      視圖名稱

      可自定義名稱。本文以item_table_preprocess_all_feature_v1為例進行說明。

      類型

      離線

      寫入方式

      使用離線表

      數據源

      選擇已創建的MaxCompute數據源。

      特征表

      選擇已準備的物料表rec_sln_demo_item_table_preprocess_all_feature_v1

      特征字段

      勾選item_id主鍵。

      同步在線特征表

      特征實體

      item

      特征生命周期(秒)

      保持默認。

    4. 完成后單擊提交,完成特征視圖創建。

  4. 創建Label

    1. 在特征項目詳情頁面的Label頁簽,單擊新建Label,在彈出的頁面中配置Label表信息。

      參數

      取值建議

      數據源

      選擇已創建的MaxCompute數據源。

      表名

      選擇已準備的Labelrec_sln_demo_label_table

    2. 單擊提交

  5. 創建模型特征

    1. 在特征項目詳情頁面的模型特征頁簽,單擊新建模型特征,在彈出的頁面中配置模型特征參數

      參數

      取值建議

      模型特征名

      自定義。本文以fs_rank_v1為例進行說明。

      選擇特征

      選擇已創建的user特征視圖和item特征視圖。

      Label表名稱

      選擇已創建的Labelrec_sln_demo_label_table

    2. 單擊提交,完成模型特征創建。

    3. 在模型特征列表頁面,單擊已創建模型右側的詳情

    4. 在彈出的模型特征詳情頁面的基本信息頁簽中,可查看導出表名fs_demo_fs_rank_v1_trainning_set,后續基于該表進行特征生產以及模型訓練。

  6. 安裝FeatureStore Python SDK,具體操作詳情請參見方式二:FeatureStore Python SDK操作

方式二:FeatureStore Python SDK操作

使用SDK的具體操作步驟請參見DSW Gallery

步驟三:導出Training Set并訓練模型

  1. 導出Training Set。

    1. 登錄DataWorks控制臺

    2. 在左側導航欄單擊數據開發與治理 > 數據開發

    3. 選擇已創建的DataWorks工作空間后,單擊進入數據開發

    4. 鼠標懸停至新建,選擇新建節點 > MaxCompute > PyODPS 3,在彈出的頁面中配置節點參數。

      參數

      取值建議

      引擎實例

      選擇已創建的MaxCompute引擎。

      節點類型

      PyODPS 3

      路徑

      業務流程/Workflow/MaxCompute

      名稱

      可自定義名稱。

    5. 單擊確認

    6. 復制以下內容到腳本中。

      from feature_store_py.fs_client import FeatureStoreClient
      from feature_store_py.fs_project import FeatureStoreProject
      from feature_store_py.fs_datasource import LabelInput, MaxComputeDataSource, TrainingSetOutput
      from feature_store_py.fs_features import FeatureSelector
      from feature_store_py.fs_config import LabelInputConfig, PartitionConfig, FeatureViewConfig
      from feature_store_py.fs_config import TrainSetOutputConfig, EASDeployConfig
      import datetime
      import sys
      
      cur_day = args['dt']
      print('cur_day = ', cur_day)
      offset = datetime.timedelta(days=-1)
      pre_day = (datetime.datetime.strptime(cur_day, "%Y%m%d") + offset).strftime('%Y%m%d')
      print('pre_day = ', pre_day)
      
      
      access_key_id = o.account.access_id
      access_key_secret = o.account.secret_access_key
      fs = FeatureStoreClient(access_key_id=access_key_id, access_key_secret=access_key_secret, region='cn-beijing')
      cur_project_name = 'fs_demo'
      project = fs.get_project(cur_project_name)
      
      label_partitions = PartitionConfig(name = 'ds', value = cur_day)
      label_input_config = LabelInputConfig(partition_config=label_partitions)
      
      user_partitions = PartitionConfig(name = 'ds', value = pre_day)
      feature_view_user_config = FeatureViewConfig(name = 'user_table_preprocess_all_feature_v1',
      partition_config=user_partitions)
      
      item_partitions = PartitionConfig(name = 'ds', value = pre_day)
      feature_view_item_config = FeatureViewConfig(name = 'item_table_preprocess_all_feature_v1',
      partition_config=item_partitions)
      feature_view_config_list = [feature_view_user_config, feature_view_item_config]
      train_set_partitions = PartitionConfig(name = 'ds', value = cur_day)
      train_set_output_config = TrainSetOutputConfig(partition_config=train_set_partitions)
      
      
      model_name = 'fs_rank_v1'
      cur_model = project.get_model(model_name)
      task = cur_model.export_train_set(label_input_config, feature_view_config_list, train_set_output_config)
      task.wait()
      print("task_summary = ", task.task_summary)
    7. 單擊右側調度配置,在彈出的頁面中配置調度參數。

      參數

      取值建議

      調度參數

      參數名

      dt

      參數值

      $[yyyymmdd-1]

      資源屬性

      調度資源組

      選擇已創建的獨享資源組。

      調度依賴

      選擇已創建的user表和item表。

    8. 節點配置并測試完成后,保存并提交節點配置。

    9. 執行補數據操作。操作詳情請參見同步數據表

  2. (可選)查看導出任務。

    1. FeatureStore項目列表頁面,單擊項目名稱,進入項目詳情頁面。

    2. 特征實體頁簽中單擊任務中心

    3. 單擊目標任務右側的詳情,即可查看該任務的基本信息、運行配置和任務日志。

  3. 訓練模型

    EasyRec是一個開源的推薦系統框架,可以與FeatureStore無縫銜接,進行訓練模型、導出模型、上線模型的操作。推薦您將fs_demo_fs_rank_v1_trainning_set表作為輸入,使用EasyRec訓練模型。

更多EasyRec相關的問題,請通過釘釘群(32260796)加入阿里云人工智能平臺PAI咨詢群聯系我們。

步驟四:上線模型

訓練并導出模型后,可以進行部署和上線的操作。如果是自建推薦系統,FeatureStore提供FeatureStore Python/Go/Cpp/Java SDK,可以與各式各樣的自建推薦系統進行銜接。您也可以通過釘釘群(32260796)聯系我們咨詢和商討具體方案。如果是阿里云系列產品,可以和FeatureStore無縫銜接,快速搭建推薦系統上線。

本文以阿里云系列產品為例介紹上線模型操作。

步驟一:例行同步數據節點

上線前需要將數據同步節點例行,即例行將數據從離線數據源同步到在線數據源中,在線會實時地從在線數據源中讀取。本示例需要將user特征表和item特征表提交例行,具體操作如下。

  1. 登錄DataWorks控制臺

  2. 在左側導航欄單擊數據開發與治理 > 數據開發

  3. 選擇已創建的DataWorks工作空間后,單擊進入數據開發

  4. 同步例行user表。

    1. 鼠標懸停至新建,選擇新建節點 > MaxCompute > PyODPS 3

    2. 復制以下內容到腳本中,完成user_table_preprocess_all_feature_v1例行同步。

      user_table_preprocess_all_feature_v1 同步例行(單擊查看詳情)

      from feature_store_py.fs_client import FeatureStoreClient
      import datetime
      from feature_store_py.fs_datasource import MaxComputeDataSource
      import sys
      
      cur_day = args['dt']
      print('cur_day = ', cur_day)
      
      access_key_id = o.account.access_id
      access_key_secret = o.account.secret_access_key
      fs = FeatureStoreClient(access_key_id=access_key_id, access_key_secret=access_key_secret, region='cn-beijing')
      cur_project_name = 'fs_demo'
      project = fs.get_project(cur_project_name)
      
      feature_view_name = 'user_table_preprocess_all_feature_v1'
      batch_feature_view = project.get_feature_view(feature_view_name)
      task = batch_feature_view.publish_table(partitions={'ds':cur_day}, mode='Overwrite')
      task.wait()
      task.print_summary()
    3. 單擊右側調度配置,在彈出的頁面中配置調度參數。

      參數

      取值建議

      調度參數

      參數名

      dt

      參數值

      $[yyyymmdd-1]

      資源屬性

      調度資源組

      選擇已創建的獨享資源組。

      調度依賴

      選擇已創建的user表。

    4. 節點配置并測試完成后,保存并提交節點配置。

    5. 執行補數據操作。操作詳情請參見同步數據表

  5. 同步例行item表。

    1. 鼠標懸停至新增,選擇新建節點 > MaxCompute > PyODPS 3,在彈出的頁面中配置節點參數。

    2. 單擊確認

    3. 復制以下內容到腳本中。

      item_table_preprocess_all_feature_v1 同步例行(單擊查看詳情)

      from feature_store_py.fs_client import FeatureStoreClient
      import datetime
      from feature_store_py.fs_datasource import MaxComputeDataSource
      import sys
      
      cur_day = args['dt']
      print('cur_day = ', cur_day)
      
      access_key_id = o.account.access_id
      access_key_secret = o.account.secret_access_key
      fs = FeatureStoreClient(access_key_id=access_key_id, access_key_secret=access_key_secret, region='cn-beijing')
      cur_project_name = 'fs_demo'
      project = fs.get_project(cur_project_name)
      
      feature_view_name = 'item_table_preprocess_all_feature_v1'
      batch_feature_view = project.get_feature_view(feature_view_name)
      task = batch_feature_view.publish_table(partitions={'ds':cur_day}, mode='Overwrite')
      task.wait()
      task.print_summary()
    4. 單擊右側調度配置,在彈出的頁面中配置調度參數。

      參數

      取值建議

      調度參數

      參數名

      dt

      參數值

      $[yyyymmdd-1]

      資源屬性

      調度資源組

      選擇已創建的獨享資源組。

      調度依賴

      選擇已創建的item表。

    5. 節點配置并測試完成后,保存并提交節點配置。

    6. 執行補數據操作。操作詳情請參見同步數據表

  6. 同步完成后,可以在Hologres中查看最新同步的特征。

步驟二:創建與部署EAS模型服務

模型服務是為了接收推薦引擎的請求,根據請求對對應的item進行打分,返回分數。其中EasyRec Processor內部包含了FeatureStore Cpp SDK,可以實現低延時、高性能的取特征操作,EasyRec ProcessorFeature Store Cpp SDK取完特征后,送入到模型進行推理,拿到打分后返回給推薦引擎。

部署模型服務的流程如下。

  1. 登錄DataWorks控制臺

  2. 在左側導航欄單擊數據開發與治理 > 數據開發

  3. 選擇已創建的DataWorks工作空間后,單擊進入數據開發

  4. 鼠標懸停至新增,選擇新建節點 > MaxCompute > PyODPS 3

  5. 復制以下內容到腳本中。

    import os
    import json
    config = {
      "name": "fs_demo_v1",
      "metadata": {
        "cpu": 4,
        "rpc.max_queue_size": 256,
        "rpc.enable_jemalloc": 1,
        "gateway": "default",
        "memory": 16000
      },
      "model_path": f"oss://beijing0009/EasyRec/deploy/rec_sln_demo_dbmtl_v1/{args['ymd']}/export/final_with_fg",  # 訓練模型路徑,可自定義。
      "model_config": {
        "access_key_id": f'{o.account.access_id}',
        "access_key_secret": f'{o.account.secret_access_key}',
        "region": "cn-beijing",  # 請替換為PAI產品實際部署地域,本文以cn-beijing為例進行說明。
        "fs_project": "fs_demo",  # 請替換為您的FeatureStore項目名稱,本文以fs_demo為例進行說明。
        "fs_model": "fs_rank_v1",  # 請替換為您的FeatureStore模型特征名稱,本文以fs_rank_v1為例進行說明。
        "fs_entity": "item",
        "load_feature_from_offlinestore": True,
        "steady_mode": True,
        "period": 2880,
        "outputs": "probs_is_click,y_ln_playtime,probs_is_praise",
        "fg_mode": "tf"
      },
      "processor": "easyrec-1.9",
      "processor_type": "cpp"
    }
    
    with open("echo.json", "w") as output_file:
        json.dump(config, output_file)
    
    # 第一次部署時運行下面這行
    os.system(f"/home/admin/usertools/tools/eascmd -i {o.account.access_id} -k {o.account.secret_access_key} -e pai-eas.cn-beijing.aliyuncs.com create echo.json")
    
    # 例行更新時運行下面這行
    # os.system(f"/home/admin/usertools/tools/eascmd -i {o.account.access_id} -k {o.account.secret_access_key} -e pai-eas.cn-beijing.aliyuncs.com modify fs_demo_v1 -s echo.json")
  6. 單擊右側調度配置,在彈出的頁面中配置調度參數。

    參數

    取值建議

    調度參數

    參數名

    dt

    參數值

    $[yyyymmdd-1]

    資源屬性

    調度資源組

    選擇已創建的獨享資源組。

    調度依賴

    選擇對應的訓練任務和item_table_preprocess_all_feature_v1。

  7. 節點配置并測試完成后,運行查看部署情況。

  8. 部署完成后,注釋掉第34行代碼,并將37行取消注釋,提交任務例行。

  9. (可選)您可以在EAS模型在線服務頁面的推理服務頁簽,查看已部署的服務。操作詳情請參見服務部署:控制臺

  10. (可選)當使用 Hologres 等只能通過指定 VPC 訪問的數據源時,需要打通 EAS 和對應數據源的 VPC 網絡。例如,當使用 Hologres 時,可以在 Hologres 的網絡信息頁面看到指定 VPC 對應的 VPC ID交換機 ID 等信息,需要在 EAS 服務頁面的右上角點擊配置高速鏈接按鈕,填入對應的 VPC ID交換機 ID,最后還需要填寫安全組名稱,可以選擇已有安全組或者新建安全組,注意其放行的端口要符合 Hologres 鏈接的要求,一般 Hologres 鏈接使用80端口,因此選擇的安全組需要開放80端口才能正常連接。都填寫完成后,單擊確定,待服務正常更新完成后即可使用。

步驟三:配置PAI-REC

PAI-REC是推薦引擎服務,其中集成了FeatureStoreGo SDK,可以與FeatureStoreEAS無縫銜接。

具體配置步驟如下。

  1. 配置FeatureStoreConfs。

    • RegionId:修改為產品實際所在區域,此處以cn-beijing為例。

    • ProjectName:已創建的FeatureStore項目名稱,fs_demo

        "FeatureStoreConfs": {
            "pairec-fs": {
                "RegionId": "cn-beijing",
                "AccessId": "${AccessKey}",
                "AccessKey": "${AccessSecret}",
                "ProjectName": "fs_demo"
            }
        },
  2. 配置FeatureConfs。

    • FeatureStoreName :和上一步FeatureStoreConfs中的設置pairec-fs保持一致。

    • FeatureStoreModelName :已創建的模型特征名稱,fs_rank_v1

    • FeatureStoreEntityName :已創建的特征實體名稱,user。表示讓PAI-REC中的FeatureStore Go SDK來取模型fs_rank_v1中特征實體為user側的特征。

        "FeatureConfs": {
            "recreation_rec": {
                "AsynLoadFeature": true,
                "FeatureLoadConfs": [
                    {
                        "FeatureDaoConf": {
                            "AdapterType": "featurestore",
                            "FeatureStoreName": "pairec-fs",
                            "FeatureKey": "user:uid",
                            "FeatureStoreModelName": "fs_rank_v1",
                            "FeatureStoreEntityName": "user",
                            "FeatureStore": "user"
                        }
                    }
                ]
            }
        },
  3. 配置AlgoConfs。

    此配置代表告訴PAI-REC去連接哪一個EAS模型打分服務。

    • Name:和部署的EAS服務名稱一致。

    • UrlAuth:EAS服務給出的信息,您可以在EAS模型在線服務頁面單擊服務名稱,然后在服務詳情頁簽單擊查看調用信息獲取URLToken。更多詳細配置可參見PAI-RECEAS常見問題

        "AlgoConfs": [
            {
                "Name": "fs_demo_v1",
                "Type": "EAS",
                "EasConf": {
                    "Processor": "EasyRec",
                    "Timeout": 300,
                    "ResponseFuncName": "easyrecMutValResponseFunc",
                    "Url": "eas_url_xxx",
                    "EndpointType": "DIRECT",
                    "Auth": "eas_token"
                }
            }
        ],
  4. 配置完成后,關于如何使用PAI-REC,請參見什么是推薦系統開發平臺PAI-Rec