本文主要介紹向量檢索服務的名詞釋義。
Client(客戶端)
Client(客戶端),是用戶用于連接DashVector服務端的基礎對象,相當于關系型數據庫中的Connection。通過設置API_KEY即可完成Client對象的創建,即完成與DashVector服務端的連接。通過Client對象可進行Collection操作(如新建Collection、獲取Collection列表等)。
Cluster(實例)
Cluster(實例),是面向售賣的資源管理單位,相當于關系型數據庫中的一個庫,我們提供了不同的實例產品規格以滿足用戶不同的業務需求。用戶可以通過控制臺進行Cluster管理操作(如創建Cluster、升配Cluster、釋放Cluster)等,在創建好的Cluster里,用戶可以進行后續的Collection、Partition等操作。
同一個賬戶支持創建多個Cluster,賬戶內單個Cluster名稱唯一。
每個賬戶同一時間段僅能創建一個免費試用Cluster,免費試用Cluster到期或主動釋放后可以再次創建一個免費試用Cluster。
Collection(集合)
Collection(集合),是一個相同類型Doc組成的集合,相當于關系型數據庫中的一張表。每個Collection必須使用唯一的名稱來標識,通過名稱可唯一獲取Collection對象。Collection對象可進行各種Doc操作(如插入Doc、檢索Doc等)和Partition操作(如新建Partition等)。
Collection名稱在Cluster內必須唯一,不允許兩個相同名稱的Collection同時存在。
付費Cluster最多支持創建32個支持Collection;免費Cluster最多支持創建2個Collection。
Partition(分區)
Partition(分區),是指同一個Collection下的Doc可通過不同的Partition進行分區。各種Doc操作(如插入Doc、檢索Doc等)如若指定Partition,則該操作將限定在該指定的Partition內進行。通過合理的Partition設置,可有效提升Doc操作的效率。
Doc(文檔)
Doc(文檔),是DashVector最基礎的數據單元,相當于關系型數據庫中的一行數據。Doc包含以下屬性:id(主鍵)、vector(向量)、fields(key-value結構的字段名和字段值)。Doc是插入Doc、更新Doc、插入或更新Doc操作的基礎輸入結構,同時也是檢索Doc和獲取Doc操作的輸出結構。
Field(字段)
Field(字段),是組成Doc的基礎單位之一,每個Doc可具備多個Field,相當于關系型數據庫中的列。
Vector(向量)
Vector(向量),Embedding Vector,非結構化數據通過各種AI Embedding模型進行特征的提取,獲取到的多維數據。DashVector中,Vector作為Doc的基礎數據單位之一,用于描述各種非結構化數據的特征。例如,[0.1, 0.2, 0.3, 0.4]
就是一個維度(dimension)為4的向量。
Sparse Vector(稀疏向量)
Sparse Vector(稀疏向量),稀疏向量是指大部分元素為0,僅少量元素非0的向量。在DashVector中,稀疏向量可用來表示詞頻等信息。例如,{1:0.4, 10000:0.6, 222222:0.8}
就是一個稀疏向量,其第1、10000、222222位元素(分別代表三個關鍵字)有非0值(代表關鍵字的權重),其他元素全部為0。
QPS(訪問頻次)
每秒能向DashVector服務的API發起的最大查詢請求次數。QPS越高,同一時段內能夠處理的業務量越多。例如QPS為5時,則在1秒內可以進行5次調用請求。
API-KEY
API-KEY是您訪問向量檢索服務(DashVector)的密鑰。DashVector通過API-KEY進行調用鑒權和計量計費,目前僅支持通過阿里云主賬號進行API-KEY管理,每個賬戶同時可擁有3個有效的API-KEY。
請妥善保存和使用API-KEY,如需進一步了解API-KEY有關的安全信息,請參考保護并正確使用API-KEY。