日本熟妇hd丰满老熟妇,中文字幕一区二区三区在线不卡 ,亚洲成片在线观看,免费女同在线一区二区

向量降維服務訓練

向量降維服務訓練功能支持結合用戶提供的向量數據,定制訓練向量降維模型。實際業務場景中,先通過向量化模型對文本或者Query向量化,然后結合向量降維模型降低向量維度。

背景信息

隨著技術的提升,開源及商業化向量模型更新迭代增快,底座模型變大變強的同時,用于文本、圖像等模態的Embedding表征模型產出的Embedding維度也越來越大。隨之也帶來更高的使用成本,尤其在超大規模數據向量化場景中,用戶需要承擔高昂的存儲和計算資源開銷。因此,AI搜索開放平臺推出向量降維服務,通過定制向量降維模型,達到在不明顯降低效果的前提下,將高維向量轉化為維度更小的向量,減少使用成本。

費用說明

按照訓練實際消耗的計算資源CU數計費,每CU價格為3.87元,實際消耗的CU數取決于訓練的數據量和維度。按照最小化訓練10萬條1024維數據,需消耗約250個CU,產生費用為250*3.87=967.5元。

操作步驟

  1. AI搜索開放平臺選擇模型服務>服務配置,然后單擊創建。

    如通過RAM賬號進行模型創建、變更配置、查看模型詳情等操作時,需要提前授予RAM賬號模型服務相關的操作權限。

  2. 模型定制頁面,配置以下參數信息。

    參數

    說明

    模型名稱

    后續調用向量降維服務時的模型名稱。

    類型

    訓練模型的類型,選擇向量微調(embedding-tuning)

    基礎模型

    用于訓練的基礎模型,如ops-embedding-dim-reduction-001。

    訓練數據來源

    MaxCompute。

    區域

    MaxCompute所屬地域。

    項目名

    MaxCompute中的項目名稱。

    AccessKeyId

    擁有讀寫MaxCompute權限的阿里云賬號或RAM賬號的AccessKey ID。

    您可以進入AccessKey管理頁面獲取AccessKeyId。

    Secret

    AccessKeyId對應的Secret。

    表名

    MaxCompute中存儲訓練數據的表的名稱。

    表分區

    表的分區信息。

    訓練字段

    需要提前為讀寫MaxCompute表結構的RAM賬號授予GetTableFields(獲取MaxCompute表結構)權限,此處才能選擇主鍵字段和String類型的向量字段,向量字段維度范圍為1024~4096維。

  3. 單擊確定,二次彈窗確定后,模型進入預處理狀態,預處理完成后開始訓練。

    您也可以在模型定制列表,找到待訓練的模型進行訓練。

    模型列表中,狀態為可用的模型,表示訓練完成且模型可被調用,單擊體驗,體驗向量微調模型效果。

服務調用

模型服務效果符合預期時,可以通過API調用服務,請參見向量降維服務API。