基本概念
本文介紹基因分析平臺(tái)相關(guān)的基本概念,以便您正確理解和使用產(chǎn)品功能。
基因分析平臺(tái)基礎(chǔ)概念
基因分析平臺(tái)的相關(guān)基礎(chǔ)概念如下表所示:
概念 | 說(shuō)明 |
地域 / region | 基因分析平臺(tái)中的數(shù)據(jù)文件、表格、應(yīng)用以及運(yùn)行等資源,都屬于阿里云公共云上的某個(gè)地域,如華北2(北京)。在用戶進(jìn)行基因計(jì)算時(shí),這些資源也必須處于同一個(gè)地域內(nèi)。請(qǐng)查看平臺(tái)的“使用限制”。 |
工作空間 / Workspace | 用戶在特定地域創(chuàng)建的基因分析平臺(tái)上的一個(gè)工作環(huán)境,用于管理基因數(shù)據(jù),生信應(yīng)用和運(yùn)行任務(wù)等。通常會(huì)是一個(gè)項(xiàng)目,如“1000-genomes”。工作空間可以被用作資源管理,權(quán)限控制,費(fèi)用拆分的一個(gè)基本單位。 |
文件 / File | 基因數(shù)據(jù)文件,存儲(chǔ)在用戶自己的對(duì)象存儲(chǔ)OSS中。基因分析平臺(tái)的工作空間可以關(guān)聯(lián)一個(gè)用戶已有的OSS Bucket,或者由平臺(tái)代為創(chuàng)建一個(gè)全新的OSS Bucket。基因分析平臺(tái)工作空間中的文件,即OSS對(duì)象存儲(chǔ)中的文件,所有OSS操作和工具均可使用。 |
實(shí)體 / Entity | 基因數(shù)據(jù)表格,存儲(chǔ)在用戶的工作空間中,用于表示包含OSS文件信息和元數(shù)據(jù)信息組成的csv表格文件。如用戶可以定義一個(gè)sample的實(shí)體表格,管理每個(gè)sample的名稱、編號(hào)、文庫(kù)類型,測(cè)序文件、分析結(jié)果等數(shù)據(jù)。平臺(tái)支持用戶瀏覽、搜索、批量分析這些生物實(shí)體數(shù)據(jù)。 |
應(yīng)用 / App | 基因分析應(yīng)用,使用流程描述語(yǔ)言(如Workflow Description Language,WDL)編寫的標(biāo)準(zhǔn)的、參數(shù)化的生物信息分析流程,清晰定義了分析的輸入輸出、運(yùn)行環(huán)境和軟件依賴等,通常包含多個(gè)具有依賴關(guān)系的分析步驟。平臺(tái)提供中心化的公共應(yīng)用(Global App),是常見(jiàn)分析流程的最佳實(shí)踐,用戶可以安裝到工作空間直接使用,或者自己創(chuàng)建/編輯應(yīng)用(App) |
運(yùn)行 / Run | 基因分析平臺(tái)的運(yùn)行,是指用戶在工作空間中,選擇基因分析應(yīng)用,輸入基因數(shù)據(jù)文件或表格后,提交到平臺(tái)上的計(jì)算分析的操作記錄。用戶可以通過(guò)運(yùn)行,來(lái)查詢/停止或恢復(fù)已提交的分析請(qǐng)求,并獲取分析進(jìn)度、運(yùn)行日志、輸出結(jié)果等信息。 |
任務(wù) / Task | 單個(gè)運(yùn)行通常包含一到多個(gè)計(jì)算任務(wù),對(duì)應(yīng)分析應(yīng)用中的不同步驟,由應(yīng)用定義了計(jì)算過(guò)程中的環(huán)境依賴、資源消耗、運(yùn)行命令、輸入輸出等關(guān)鍵運(yùn)行時(shí)信息。 |
作業(yè) / Job | 作業(yè)是基因分析平臺(tái)中的最小計(jì)算單元,也是平臺(tái)計(jì)費(fèi)的基本單位。在用戶的運(yùn)行中,普通計(jì)算任務(wù)對(duì)應(yīng)一個(gè)計(jì)算作業(yè),而并行計(jì)算任務(wù)則會(huì)包含多個(gè)計(jì)算作業(yè)。同時(shí)計(jì)算作業(yè)在失敗后,可由平臺(tái)智能重啟調(diào)度,從而生成新的計(jì)算作業(yè)。 |
模板 / Template | 用于批量創(chuàng)建運(yùn)行任務(wù)的模板,包含使用的應(yīng)用和實(shí)體表格信息,可以用于分析表格中的數(shù)據(jù)記錄。 |
投遞 / Submission | 批量運(yùn)行任務(wù)的投遞操作記錄,用于查詢、停止和恢復(fù)該記錄下所有的運(yùn)行任務(wù)。 |
其他相關(guān)云服務(wù)概念
概念 | 說(shuō)明 | 相關(guān)文檔 |
存儲(chǔ)空間 / Bucket | 對(duì)象存儲(chǔ)OSS的存儲(chǔ)空間是用戶用于存儲(chǔ)對(duì)象(Object)的容器,所有的對(duì)象都必須隸屬于某個(gè)存儲(chǔ)空間。 | |
容器鏡像地址 / ACR | 阿里云容器鏡像服務(wù)中Docker的鏡像地址 鏡像地址示例(以容器服務(wù)的公共鏡像為例):
|