向量降維服務訓練功能支持結合用戶提供的向量數據,定制訓練向量降維模型。實際業務場景中,先通過向量化模型對文本或者Query向量化,然后結合向量降維模型降低向量維度。
背景信息
隨著技術的提升,開源及商業化向量模型更新迭代增快,底座模型變大變強的同時,用于文本、圖像等模態的Embedding表征模型產出的Embedding維度也越來越大。隨之也帶來更高的使用成本,尤其在超大規模數據向量化場景中,用戶需要承擔高昂的存儲和計算資源開銷。因此,AI搜索開放平臺推出向量降維服務,通過定制向量降維模型,達到在不明顯降低效果的前提下,將高維向量轉化為維度更小的向量,減少使用成本。
費用說明
按照訓練實際消耗的計算資源CU數計費,每CU價格為3.87元,實際消耗的CU數取決于訓練的數據量和維度。按照最小化訓練10萬條1024維數據,需消耗約250個CU,產生費用為250*3.87=967.5元。
操作步驟
在AI搜索開放平臺選擇模型服務>服務配置,然后單擊創建。
如通過RAM賬號進行模型創建、變更配置、查看模型詳情等操作時,需要提前授予RAM賬號模型服務相關的操作權限。
在模型定制頁面,配置以下參數信息。
參數
說明
模型名稱
后續調用向量降維服務時的模型名稱。
類型
訓練模型的類型,選擇向量微調(embedding-tuning)。
基礎模型
用于訓練的基礎模型,如ops-embedding-dim-reduction-001。
訓練數據來源
MaxCompute。
區域
MaxCompute所屬地域。
項目名
MaxCompute中的項目名稱。
AccessKeyId
擁有讀寫MaxCompute權限的阿里云賬號或RAM賬號的AccessKey ID。
您可以進入AccessKey管理頁面獲取AccessKeyId。
Secret
AccessKeyId對應的Secret。
表名
MaxCompute中存儲訓練數據的表的名稱。
表分區
表的分區信息。
訓練字段
需要提前為讀寫MaxCompute表結構的RAM賬號授予GetTableFields(獲取MaxCompute表結構)權限,此處才能選擇主鍵字段和String類型的向量字段,向量字段維度范圍為1024~4096維。
單擊確定,二次彈窗確定后,模型進入預處理狀態,預處理完成后開始訓練。
您也可以在模型定制列表,找到待訓練的模型進行訓練。
模型列表中,狀態為可用的模型,表示訓練完成且模型可被調用,單擊體驗,體驗向量微調模型效果。
服務調用
模型服務效果符合預期時,可以通過API調用服務,請參見向量降維服務API。