日本熟妇hd丰满老熟妇,中文字幕一区二区三区在线不卡 ,亚洲成片在线观看,免费女同在线一区二区

基因分析應(yīng)用

本文介紹基因分析平臺中的應(yīng)用定義,如何在工作空間中創(chuàng)建、編輯和運(yùn)行應(yīng)用。

基因數(shù)據(jù)分析工作,需要用戶使用不同的生物信息學(xué)工具軟件,進(jìn)行一系列復(fù)雜的計算過程,才能得到最終的分析結(jié)果。以遺傳病的數(shù)據(jù)分析舉例,需要進(jìn)行數(shù)據(jù)質(zhì)控、序列比對、變異檢測和變異注釋等多個步驟。

遺傳解讀△圖1: 基因數(shù)據(jù)分析流程(來源/《中華醫(yī)學(xué)遺傳學(xué)雜志》)

我們以工作流(Pipeline or Workflow)來指代這些分析腳本。簡單的來說,它可以是一段由用戶編寫的、會執(zhí)行多個命令的Shell或者Python腳本,能夠從頭到尾完成特定的基因數(shù)據(jù)分析任務(wù)。大多數(shù)分析流程被設(shè)計成在本地運(yùn)行,這使得它們的軟件依賴和流程邏輯通常都與特定的執(zhí)行環(huán)境(如HPC集群)綁定,而無法遷移、無法重復(fù)分析結(jié)果。

流程描述語言,如Snakemake、CWL、WDL、Nextflow等的出現(xiàn),就是為了解決這些問題。他們是一類領(lǐng)域特定語言(Domain-specific Langue, DSL),有著自己的語法和規(guī)則,幫助用戶簡單高效的編寫標(biāo)準(zhǔn)化、可遷移、可重復(fù)的生物信息工具流程。

阿里云基因分析平臺采用GA4GH社區(qū)支持的流程描述語言(Workflow Description Langue,WDL)作為平臺應(yīng)用的定義標(biāo)準(zhǔn),為應(yīng)用的開發(fā)、測試和運(yùn)行提供生產(chǎn)級別的產(chǎn)品支持。

6

借助統(tǒng)一的流程語言標(biāo)準(zhǔn),用戶可以導(dǎo)入研究社區(qū)里公開的WDL流程,也能夠使用平臺開發(fā)者提供的公共應(yīng)用,極大降低生信分析的門檻,簡單高效地完成基因數(shù)據(jù)分析任務(wù)。