本文為您介紹直播推薦的相關字段,幫助您構建一個全面的直播推薦系統,通過分析用戶的特征、直播內容的特征以及用戶對直播內容的行為,實現個性化推薦。
下表是直播推薦場景建議準備的用戶表、物品表、行為表的字段,字段越完善越豐富,推薦效果會越好。 如能提供下表中沒有涵蓋到的特征字段,可以在后面追加字段。不要求字段名稱與下面表格中的字段名稱完全一致。
用戶側(用戶表)
字段名稱 | 類型 | 是否必選 | 說明 |
user_id | 整數/字符串 | 是 | 用戶的ID,用戶的唯一標識符。 |
age | 整數 | 否 | 用戶的年齡,可以進行分段處理。 例如,0~12,12~18,18~24,25~34等,作為數值特征,離散化之后作為類別特征。 |
gender | 字符串 | 否 | 用戶的性別。 例如,男、女或其他,作為類別特征。 |
occupation | 字符串 | 否 | 用戶的職業信息,作為類別特征。 |
education | 字符串 | 否 | 用戶的教育背景。 例如,高中、本科、碩士等,作為類別特征。 |
income | 整數/字符串 | 否 | 用戶的收入水平。 例如,低、中、高,作為類別特征。 |
user_level | 整數/字符串 | 否 | 用戶在平臺上的等級或會員等級。 |
register_time | 時間戳 | 否 | 用戶注冊賬戶的時間,單位是秒??梢赞D換后按年、月、日分段,作為數值特征,離散化之后作為類別特征。 |
country | 字符串 | 否 | 用戶所在國家,作為類別特征。 |
province | 字符串 | 否 | 用戶所在國家的省,作為類別特征。 |
city | 字符串 | 否 | 用戶所在國家的城市,作為類別特征。 |
active_time | 整數/字符串 | 否 | 用戶在平臺上的活躍時間段。 例如,早晨、下午、晚上等,作為類別特征。 |
device_type | 字符串 | 否 | 用戶使用的設備類型。 例如,PC、手機、平板等,作為類別特征。 |
os | 字符串 | 否 | 用戶設備上的操作系統,作為類別特征。 |
browser | 字符串 | 否 | 用戶使用的瀏覽器類型,作為類別特征。 |
language | 字符串 | 否 | 用戶偏好的語言,作為類別特征。 |
interests | 字符串 | 否 | 用戶的興趣點,作為Tag特征。 |
物品側(主播表)
字段名稱 | 類型 | 是否必選 | 說明 |
anchor_id | 整數/字符串 | 是 | 物品ID,主播的唯一標識符。 |
name | 字符串 | 否 | 主播的姓名。 |
nickname | 字符串 | 否 | 主播的昵稱,一般會顯示在直播頁面。 |
anchor_gender | 字符串/數值 | 否 | 用戶的性別。 例如,男、女或其他,作為類別特征。 |
language | 字符串 | 否 | 主播在直播過程中使用的語言。 包含漢語、英語、日語等。 |
level | 整數 | 否 | 關于該主播在平臺的等級。 |
category | 字符串 | 否 | 主播所屬的主要類別。 例如,才藝表演、游戲解說等,作為類別特征。 |
leaf_category | 字符串 | 否 | 更加細分的類別標簽,作為類別特征。 |
rating | 浮點數 | 否 | 觀眾對主播的整體評價分數,可以轉化為好評、中評、差評等形式,作為類別特征。 |
status | 數值 | 否 | 表示主播當前的狀態,比如是否正在直播。 |
review_count | 整數 | 否 | 關于該主播的所有評論總數。 |
video_type | 字符串 | 否 | 直播的具體形式。 例如,現場直播、錄制回放等。 |
duration | 整數 | 否 | 單次直播的持續時間長度。 |
release_date | 日期 | 否 | 直播開始的確切日期。 |
director | 字符串 | 否 | 如果是預錄節目,則記錄導演名字;否則通常為空。 |
actors | 字符串 | 否 | 參與直播的嘉賓名單。 |
subtitles | 布爾 | 否 | 是否提供了字幕服務。 |
region | 字符串 | 否 | 主播所在的地區。 |
tags | 字符串 | 否 | 與直播主題相關的關鍵詞列表。 |
follow_count | 整數 | 否 | 主播粉絲數量。 |
用戶行為側(用戶行為日志表)
字段名稱 | 類型 | 是否必選 | 說明 |
request_id | 字符串 | 是 | 請求ID,每次推薦的唯一標識符。 |
user_id | 整數/字符串 | 是 | 用戶ID,執行了某項動作的用戶ID。 |
item_id | 整數/字符串 | 是 | 物品ID,受到用戶互動影響的主播ID。 |
event | 字符串 | 是 | 用戶對視頻內容的行為。 例如,曝光(exposure)、點擊(click)、點贊(like)、打賞(gift)、評論(comment)等。 |
event_value | 浮點數 | 是 |
|
event_time | 時間戳 | 否 | 精確到秒的行為發生時刻。 |
ip | 字符串 | 否 | 用戶的IP地址,可以通過IP定位得到所在省、城市特征。 |
rating | 浮點數 | 否 | 用戶給予主播的星級評價或其他形式的反饋。 |
scene | 字符串 | 否 | 區分不同訪問入口。 例如,首頁推薦、搜索結果頁等。 |
device_type | 字符串 | 否 | 用戶進行互動時所使用的終端設備。 |
browser | 字符串 | 否 | 用戶訪問時使用的瀏覽器軟件。 |
mobile_brand | 字符串 | 否 | 用戶移動設備的品牌名稱。 |
os | 字符串 | 否 | 用戶設備上的操作系統。 |
weather | 字符串 | 否 | 根據IP定位獲取的實時天氣情況。 |
holiday | 布爾 | 否 | 用戶行為發生時是否是節假日。 |
season | 字符串 | 否 | 當前的季節。 |
longitude | 浮點數 | 否 | 用戶所在位置的經度。 |
latitude | 浮點數 | 否 | 用戶所在位置的緯度。 |