PAI-TensorFlow使用指南
PAI-TF是人工智能平臺(tái)PAI為了追求更極致的深度學(xué)習(xí)訓(xùn)練效率,優(yōu)化原生Tensorflow的內(nèi)核并開(kāi)發(fā)周邊工具,推出的一款產(chǎn)品。PAI-TF擁有服務(wù)化、分布式調(diào)度、全局計(jì)算調(diào)度、GPU卡映射及模型在線預(yù)測(cè)等特點(diǎn)。
公共云GPU服務(wù)器即將過(guò)保下線,您可以繼續(xù)提交CPU版本的TensorFlow任務(wù)。如需使用GPU進(jìn)行模型訓(xùn)練,請(qǐng)前往DLC提交任務(wù),具體操作請(qǐng)參見(jiàn)創(chuàng)建訓(xùn)練任務(wù)。
背景
TensorFlow是Google最新的開(kāi)源深度學(xué)習(xí)計(jì)算框架,支持CNN、RNN及LSTM等多種神經(jīng)網(wǎng)絡(luò)模型,對(duì)語(yǔ)音、圖像及文本等領(lǐng)域的模型訓(xùn)練效率極佳。TensorFlow的功能豐富且強(qiáng)大,并擁有高度靈活的API,受到業(yè)界的高度關(guān)注。
PAI-TF是人工智能平臺(tái)PAI為了追求更極致的深度學(xué)習(xí)訓(xùn)練效率,優(yōu)化原生TensorFlow的內(nèi)核并開(kāi)發(fā)周邊工具,推出的一款產(chǎn)品。PAI-TF完全兼容原生TensorFlow的代碼,并且在許多工業(yè)化生產(chǎn)場(chǎng)景的性能更加優(yōu)越。目前,PAI-TF已經(jīng)在人工智能平臺(tái)PAI、阿里云E-MapReduce等產(chǎn)品上線并應(yīng)用。
產(chǎn)品特點(diǎn)
PAI-TF產(chǎn)品的特點(diǎn)如下:
服務(wù)化
MaxCompute是阿里云自主研發(fā)的飛天大數(shù)據(jù)平臺(tái),已經(jīng)支持了數(shù)萬(wàn)企業(yè)及個(gè)人開(kāi)發(fā)者。PAI-TF幫助您直接在MaxCompute中使用TensorFlow的計(jì)算框架。PAI-TF使用的API與開(kāi)源版本一致,您可以直接通過(guò)TensorFlow Training Script接口提交作業(yè)至MaxCompute的計(jì)算集群中執(zhí)行。
分布式調(diào)度
PAI為您提供海量的計(jì)算資源,所有的計(jì)算資源通過(guò)GPU Quota進(jìn)行管理。PAI-TF的作業(yè)都是基于底層的分布式調(diào)度系統(tǒng)動(dòng)態(tài)調(diào)度至不同機(jī)器。當(dāng)您提交PAI-TF作業(yè)時(shí),無(wú)需擔(dān)心是否需要提前申請(qǐng)GPU物理主機(jī),PAI-TF所需要的GPU資源隨作業(yè)的提交動(dòng)態(tài)分配,隨作業(yè)的結(jié)束動(dòng)態(tài)釋放。
全局計(jì)算調(diào)度
當(dāng)您在使用MaxCompute計(jì)算引擎時(shí),您可以在一個(gè)項(xiàng)目中同時(shí)提交SQL作業(yè)和PAI-TF作業(yè)。MaxCompute全局計(jì)算調(diào)度服務(wù)能夠?qū)AI-TF作業(yè)自動(dòng)調(diào)度至相應(yīng)的GPU集群,并將基于CPU集群的數(shù)據(jù)預(yù)處理作業(yè)和基于GPU集群的模型訓(xùn)練作業(yè)連接起來(lái)。
GPU卡映射
PAI-TF支持將不同算子(Operators)指定至特定的CPU或GPU上。基于GPU卡映射,您無(wú)需感知宿主機(jī)的GPU卡物理結(jié)構(gòu),PAI-TF會(huì)將您作業(yè)中申請(qǐng)的GPU卡自動(dòng)映射至作業(yè)進(jìn)程空間,則您感知到的GPU卡為gpu:0、gpu:1….等。
模型在線預(yù)測(cè)
PAI為您提供了在線預(yù)測(cè)服務(wù)EAS。您可以將PAI-TF中訓(xùn)練生成的模型一鍵部署至在線預(yù)測(cè)服務(wù)。在線預(yù)測(cè)服務(wù)支持模型的動(dòng)態(tài)擴(kuò)容、滾動(dòng)更新、A/B測(cè)試、高吞吐及低延時(shí)等特性。
支持的Python三方庫(kù)
PAI-TF已經(jīng)安裝了Numpy及Six等常見(jiàn)的Python三方庫(kù),您可以在TensorFlow作業(yè)中直接導(dǎo)入相關(guān)的庫(kù)。