EAIS實例成功綁定至ECS實例后,您需要遠程登錄該ECS實例,然后使用EAIS實例訓練PyTorch模型。本文為您介紹使用EAIS訓練PyTorch模型的具體操作。
前提條件
已將EAIS實例綁定至ECS實例上。具體操作,請參見綁定ECS實例。
背景信息
目前只有Python腳本可以訓練PyTorch模型,本文介紹使用EAIS實例訓練PyTorch模型的具體操作,如果您使用EAIS訓練過程中遇到問題,請聯系EAIS技術支持。
使用限制
僅支持在1個ECS實例上只綁定了1個EAIS實例的場景下,訓練PyTorch模型。
操作步驟
遠程登錄ECS實例。
安裝eais-tool軟件包,然后查看EAIS實例的相關信息。
具體操作,請參見eais-tool。
安裝CUDA 11.X.X版本軟件包。
執行如下命令,下載并安裝CUDA軟件包。
說明本操作以安裝CUDA 11.7.0版本為例,具體命令以您實際安裝的CUDA版本為準。
wget https://developer.download.nvidia.com/compute/cuda/11.7.0/local_installers/cuda_11.7.0_515.43.04_linux.run sudo sh cuda_11.7.0_515.43.04_linux.run --silent --toolkit
執行如下命令,設置CUDA相關的環境變量。
export PATH=/usr/local/cuda/bin:$PATH export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH
安裝eais-cuda軟件包。
具體操作,請參見eais-cuda。
部署您的訓練程序,然后訓練PyTorch模型。
文檔內容是否對您有幫助?