升級(jí)Tesla或GRID驅(qū)動(dòng)
如果您的NVIDIA Tesla或NVIDIA GRID驅(qū)動(dòng)版本已不適用于當(dāng)前場(chǎng)景,或者您安裝了錯(cuò)誤的驅(qū)動(dòng)類型或版本導(dǎo)致GPU實(shí)例無法使用,您可以通過卸載當(dāng)前驅(qū)動(dòng)再安裝所需驅(qū)動(dòng)的方式,完成Tesla或GRID驅(qū)動(dòng)的升級(jí)操作。
升級(jí)NVIDIA Tesla驅(qū)動(dòng)
升級(jí)Tesla驅(qū)動(dòng)時(shí),需要先卸載相應(yīng)的Tesla驅(qū)動(dòng),然后再根據(jù)需要安裝的驅(qū)動(dòng)類型和操作系統(tǒng),重新安裝新的Tesla驅(qū)動(dòng)。
卸載當(dāng)前Tesla驅(qū)動(dòng)。
具體操作,請(qǐng)參見卸載Tesla驅(qū)動(dòng)。
安裝新的Tesla驅(qū)動(dòng)。
升級(jí)NVIDIA GRID驅(qū)動(dòng)
確認(rèn)是否需要升級(jí)GRID驅(qū)動(dòng)
升級(jí)GRID驅(qū)動(dòng)前,請(qǐng)先判斷當(dāng)前實(shí)例的GRID驅(qū)動(dòng)是否需要升級(jí),然后再根據(jù)實(shí)際情況選擇對(duì)應(yīng)的升級(jí)方式。
Windows系統(tǒng)GPU虛擬化型實(shí)例(vgn5i、vgn6i、vgn6i-vws、vgn7i-vws、sgn7i-vws)
如果實(shí)例的當(dāng)前GRID驅(qū)動(dòng)版本號(hào)不是474.04,則您需要將當(dāng)前驅(qū)動(dòng)升級(jí)到SWL驅(qū)動(dòng)。
如果實(shí)例的當(dāng)前GRID驅(qū)動(dòng)版本號(hào)是474.04,則您需要通過查看License Status判斷是否需要升級(jí)驅(qū)動(dòng)。具體操作如下:
登錄Windows系統(tǒng)GPU虛擬化型實(shí)例(例如vgn7i-vws)。
具體操作,請(qǐng)參見通過密碼或密鑰認(rèn)證登錄Windows實(shí)例。
打開
cmd
,依次執(zhí)行以下命令,查看當(dāng)前驅(qū)動(dòng)License Status。cd C:\Program Files\NVIDIA Corporation\NVSMI nvidia-smi.exe -q | findstr License
輸出結(jié)果如下所示,表示當(dāng)前驅(qū)動(dòng)的License未過期,此時(shí)您無需將當(dāng)前驅(qū)動(dòng)升級(jí)到SWL驅(qū)動(dòng),否則您需要將當(dāng)前驅(qū)動(dòng)升級(jí)到SWL驅(qū)動(dòng)。具體操作,請(qǐng)參見通過更新鏡像升級(jí)vgn5i或vgn6i的GRID驅(qū)動(dòng)或通過云助手升級(jí)GRID驅(qū)動(dòng)。
Windows系統(tǒng)GPU計(jì)算型實(shí)例(gn7i、gn6i、ebmgn7i、ebmgn6i)
您可以通過查看License Status判斷是否需要升級(jí)驅(qū)動(dòng)。具體操作如下:
登錄Windows系統(tǒng)GPU計(jì)算型實(shí)例(例如gn7i)。
具體操作,請(qǐng)參見通過密碼或密鑰認(rèn)證登錄Windows實(shí)例。
打開
cmd
,依次執(zhí)行以下命令,查看當(dāng)前驅(qū)動(dòng)License Status。cd C:\Program Files\NVIDIA Corporation\NVSMI nvidia-smi.exe -q | findstr License
如果輸出結(jié)果如下圖所示,表示當(dāng)前驅(qū)動(dòng)的License未過期,此時(shí)您需要繼續(xù)執(zhí)行下一步。
如果輸出結(jié)果非下圖所示,表示當(dāng)前驅(qū)動(dòng)的License已過期,此時(shí)您需要將當(dāng)前驅(qū)動(dòng)升級(jí)到SWL驅(qū)動(dòng)。具體操作,請(qǐng)參見通過云助手升級(jí)GRID驅(qū)動(dòng)。
(可選)執(zhí)行以下命令,查看License類型是否為NVIDIA RTX Virtual Workstation。
如果當(dāng)前驅(qū)動(dòng)的License未過期,您需要繼續(xù)確認(rèn)License類型是否為NVIDIA RTX Virtual Workstation。
nvidia-smi.exe -q | findstr Product
如果輸出結(jié)果如下圖所示,表示當(dāng)前驅(qū)動(dòng)License類型為NVIDIA RTX Virtual Workstation,此時(shí)您無需將當(dāng)前驅(qū)動(dòng)升級(jí)到SWL驅(qū)動(dòng)。
如果輸出結(jié)果非下圖所示,表示當(dāng)前驅(qū)動(dòng)License類型不是NVIDIA RTX Virtual Workstation,此時(shí)您需要將當(dāng)前驅(qū)動(dòng)升級(jí)到SWL驅(qū)動(dòng)。具體操作,請(qǐng)參見通過云助手升級(jí)GRID驅(qū)動(dòng)。
Linux系統(tǒng)GPU虛擬化型實(shí)例(vgn5i、vgn6i、vgn6i-vws、vgn7i-vws、sgn7i-vws)
如果實(shí)例已安裝的GRID驅(qū)動(dòng)版本號(hào)不是470.161.03,則需要升級(jí)驅(qū)動(dòng)。
如果實(shí)例已安裝的GRID驅(qū)動(dòng)版本號(hào)是470.161.03,則您需要通過查看License Status判斷是否需要升級(jí)驅(qū)動(dòng)。具體操作如下:
登錄Linux系統(tǒng)GPU虛擬化型實(shí)例(例如vgn7i-vws)。
具體操作,請(qǐng)參見通過密碼或密鑰認(rèn)證登錄Linux實(shí)例。
執(zhí)行以下命令,查看當(dāng)前驅(qū)動(dòng)License Status。
# nvidia-smi -q |grep -i license
輸出結(jié)果如下所示,表示當(dāng)前驅(qū)動(dòng)的License未過期,此時(shí)您無需將當(dāng)前驅(qū)動(dòng)升級(jí)到SWL驅(qū)動(dòng),否則您需要將當(dāng)前驅(qū)動(dòng)升級(jí)到SWL驅(qū)動(dòng)。具體操作,請(qǐng)參見通過更新鏡像升級(jí)vgn5i或vgn6i的GRID驅(qū)動(dòng)或通過云助手升級(jí)GRID驅(qū)動(dòng)。
Linux系統(tǒng)GPU計(jì)算型實(shí)例(gn7i、gn6i、ebmgn7i、ebmgn6i)
因?yàn)樵搶?shí)例不需要使用GRID驅(qū)動(dòng)也可以支持圖形加速功能,僅使用NVIDIA官網(wǎng)驅(qū)動(dòng)即可,您無需將當(dāng)前驅(qū)動(dòng)升級(jí)到SWL驅(qū)動(dòng)。
通過更新鏡像升級(jí)vgn5i或vgn6i的GRID驅(qū)動(dòng)
適用實(shí)例
僅適用Windows系統(tǒng)或Linux系統(tǒng)的GPU虛擬化型實(shí)例vgn5i或vgn6i。
自2024年2月1日起,vgn5i和vgn6i實(shí)例且將全面關(guān)閉,更多信息,請(qǐng)參見【公告】vgn5i和vgn6i停售通知。
通過更新鏡像的方式升級(jí)vgn5i或vgn6i規(guī)格的GRID驅(qū)動(dòng),其原因及建議如下所示:
實(shí)例規(guī)格 | 原因 | 建議 |
vgn5i | vgn5i使用的P4顯卡無法使用SWL類型的GRID驅(qū)動(dòng)。 | 將該實(shí)例升配為vgn6i-vws、sgn7i-vws后,然后通過更新鏡像的方式升級(jí)為GRID驅(qū)動(dòng)。 重要 升配過程中,升配后的實(shí)例相比升配前的實(shí)例費(fèi)用要高一些,請(qǐng)提交工單獲取代金券,用于抵扣升配時(shí)需要支付的額外費(fèi)用。 |
vgn6i | vgn6i所在服務(wù)器使用的還是GRID 9,該服務(wù)器無法兼容SWL類型的GIRD驅(qū)動(dòng)。 |
操作步驟
升配實(shí)例規(guī)格。
以vgn6i(ecs.vgn6i-m4.xlarge)實(shí)例升配為sgn7i-vws(ecs.sgn7i-vws-m2.xlarge)實(shí)例為例,vgn6i實(shí)例的升配操作請(qǐng)參考以下步驟。
在左側(cè)導(dǎo)航欄,選擇 。
在頂部菜單欄左上角處,選擇地域。
找到待操作的vgn6i實(shí)例,在操作列,單擊資源變配。
在配置變更頁面的實(shí)例配置頁簽下,選擇更改實(shí)例規(guī)格,然后單擊繼續(xù)。
在更改實(shí)例規(guī)格頁面,選擇更改后的目標(biāo)實(shí)例規(guī)格,然后單擊停止實(shí)例并繼續(xù)。
在彈出的停止實(shí)例頁面,根據(jù)需要選擇停止方式和停止模式選項(xiàng)后,單擊確定。
說明如需了解停止實(shí)例的更多信息,請(qǐng)參見停止實(shí)例。
待實(shí)例升配完成后,單擊啟動(dòng)實(shí)例并返回。
在彈出的啟動(dòng)實(shí)例頁面,單擊確定。
在實(shí)例列表中,單擊升配后的實(shí)例ID,進(jìn)入實(shí)例詳情頁簽,您可以查看到當(dāng)前實(shí)例規(guī)格已變更為
ecs.sgn7i-vws-m2.xlarge
。
將升配后的實(shí)例驅(qū)動(dòng)升級(jí)為SWL GRID驅(qū)動(dòng)。
在實(shí)例列表頁,找到升配后的sgn7i-vws實(shí)例,單擊對(duì)應(yīng)操作列的停止。
在彈出的停止實(shí)例頁面,根據(jù)需要選擇停止方式和停止模式選項(xiàng)后,單擊確定。
說明如需了解停止實(shí)例的更多信息,請(qǐng)參見停止實(shí)例。
找到目標(biāo)實(shí)例,在操作列選擇 。
在更換操作系統(tǒng)對(duì)話框,選中更換系統(tǒng)盤。
仔細(xì)閱讀更換操作系統(tǒng)注意事項(xiàng)并選中我已知曉以上風(fēng)險(xiǎn),然后單擊繼續(xù)更換操作系統(tǒng)。
在鏡像區(qū)域,單擊鏡像市場(chǎng)頁簽,然后單擊從鏡像市場(chǎng)獲取更多選擇(含操作系統(tǒng))。
在彈出的鏡像市場(chǎng)頁面,輸入GRID 13.5后,單擊搜索。
目前支持使用如下Linux操作系統(tǒng)和Windows操作系統(tǒng)的鏡像:
操作系統(tǒng)
已預(yù)裝GRID驅(qū)動(dòng)的鏡像
Linux
Alibaba Cloud Linux 2.1903 LTS 64位預(yù)裝GRID 13.5 SWL驅(qū)動(dòng)鏡像
Alibaba Cloud Linux 3.2104 LTS 64位預(yù)裝GRID 13.5 SWL驅(qū)動(dòng)鏡像
CentOS 7.9 64位預(yù)裝GRID 13.5 SWL驅(qū)動(dòng)鏡像
Ubuntu 18.04 64位預(yù)裝GRID 13.5 SWL驅(qū)動(dòng)鏡像
Ubuntu 20.04 64位預(yù)裝GRID 13.5 SWL驅(qū)動(dòng)鏡像
Ubuntu 22.04 64位預(yù)裝GRID 13.5 SWL驅(qū)動(dòng)鏡像
Windows
Windows Server 2022中文版預(yù)裝GRID 13.5 SWL驅(qū)動(dòng)鏡像
Windows Server 2019中文版預(yù)裝GRID 13.5 SWL驅(qū)動(dòng)鏡像
根據(jù)需要選擇相應(yīng)的已預(yù)裝GRID 13.5 SWL驅(qū)動(dòng)的鏡像,然后單擊使用。
通過云助手升級(jí)GRID驅(qū)動(dòng)
對(duì)于存量的vgn5i和vgn6i實(shí)例,請(qǐng)勿使用云助手方式升級(jí)GRID驅(qū)動(dòng),否則會(huì)導(dǎo)致該實(shí)例不可用。可用的升級(jí)方式請(qǐng)參見通過更新鏡像升級(jí)vgn5i或vgn6i的GRID驅(qū)動(dòng)。
升級(jí)GRID驅(qū)動(dòng)(Windows)
適用實(shí)例
僅以下Windows GPU實(shí)例規(guī)格族支持通過云助手升級(jí)GRID驅(qū)動(dòng):
Windows系統(tǒng)GPU虛擬化型實(shí)例:vgn6i-vws、vgn7i-vws、sgn7i-vws
Windows系統(tǒng)GPU計(jì)算型實(shí)例:gn7i、gn6i、ebmgn7i、ebmgn6i
操作步驟
下文以一臺(tái)華東1(杭州)地域的vgn6i-vws實(shí)例(ecs.vgn6i-m4-vws.xlarge)為例。
在左側(cè)導(dǎo)航欄,選擇 。
在頁面左側(cè)頂部,選擇目標(biāo)資源所在的地域。
在ECS實(shí)例頁簽下的實(shí)例列表,選擇目標(biāo)實(shí)例,單擊對(duì)應(yīng)操作欄下的執(zhí)行命令。
通過創(chuàng)建并執(zhí)行云助手命令升級(jí)GRID驅(qū)動(dòng)。
在創(chuàng)建執(zhí)行命令面板的命令信息區(qū)域,完成參數(shù)配置。
主要參數(shù)配置項(xiàng)如下所示,其他參數(shù)保持默認(rèn),更多信息,請(qǐng)參見命令參數(shù)(控制臺(tái)操作)。
重要參數(shù)取值必須按照下文提供的取值來設(shè)定,否則可能會(huì)導(dǎo)致云助手執(zhí)行失敗。
①命名類型:支持選擇Bat和Power Shell兩種命令類型。取值:PowerShell。
②命令內(nèi)容:編輯或者粘貼您的命令。示例如下:
$InstalledPlugins = $(acs-plugin-manager --list --local) if ($($InstalledPlugins | Select-String "grid_driver_install")) { acs-plugin-manager --remove --plugin grid_driver_install } acs-plugin-manager --fetchTimeout 0 --exec --plugin grid_driver_install
③超時(shí)時(shí)間:設(shè)置命令在實(shí)例中的超時(shí)時(shí)間,當(dāng)執(zhí)行命令的任務(wù)超時(shí)后,云助手將強(qiáng)制終止任務(wù)進(jìn)程。取值:600。
說明超時(shí)時(shí)間僅支持設(shè)置為正整數(shù),單位為秒,取值范圍:10~86,400秒(24小時(shí)),默認(rèn)值為60秒。
單擊執(zhí)行,通過云助手命令升級(jí)GRID驅(qū)動(dòng)。
云助手命令執(zhí)行完成后,在執(zhí)行詳情頁查看如下信息(即舊版GRID驅(qū)動(dòng)需要卸載后才能升級(jí)),表示實(shí)例已安裝舊版GRID驅(qū)動(dòng)。
您需要通過云助手命令先卸載當(dāng)前已安裝的舊版GRID驅(qū)動(dòng),然后必須重啟實(shí)例,再執(zhí)行一次相同的云助手命令才能繼續(xù)升級(jí)GRID驅(qū)動(dòng)。具體操作如下:
重要卸載或重新安裝GRID驅(qū)動(dòng)大概需要5~10分鐘完成,請(qǐng)您耐心等待。
重啟GPU實(shí)例。
具體操作,請(qǐng)參見重啟實(shí)例。
再次執(zhí)行相同的云助手命令重新安裝新的GRID驅(qū)動(dòng)。
通過云助手命令自動(dòng)安裝新的GRID驅(qū)動(dòng)后,您可以在執(zhí)行詳情頁查看執(zhí)行結(jié)果。
驗(yàn)證升級(jí)的GRID驅(qū)動(dòng)是否生效。
重啟GPU實(shí)例。
具體操作,請(qǐng)參見重啟實(shí)例。
遠(yuǎn)程連接GPU實(shí)例。
具體操作,請(qǐng)參見通過密碼或密鑰認(rèn)證登錄Windows實(shí)例。
在登錄頁面空白處,右鍵單擊并打開NVIDIA 控制面板。
顯示結(jié)果如下所示,表示安裝的新GRID驅(qū)動(dòng)已生效。
升級(jí)GRID驅(qū)動(dòng)(Linux)
適用實(shí)例
僅以下Linux GPU實(shí)例規(guī)格族支持通過云助手升級(jí)GRID驅(qū)動(dòng):vgn6i-vws、vgn7i-vws、sgn7i-vws。
操作步驟
下文以一臺(tái)華東1(杭州)地域的vgn6i-vws實(shí)例(ecs.vgn6i-m4-vws.xlarge )為例。
在左側(cè)導(dǎo)航欄,選擇 。
在頁面左側(cè)頂部,選擇目標(biāo)資源所在的地域。
在ECS實(shí)例頁簽下的實(shí)例列表,選擇目標(biāo)實(shí)例,單擊對(duì)應(yīng)操作欄下的執(zhí)行命令。
在創(chuàng)建執(zhí)行命令面板的命令信息區(qū)域,完成參數(shù)配置。
主要參數(shù)配置項(xiàng)如下所示,其他參數(shù)保持默認(rèn)。更多信息,請(qǐng)參見命令參數(shù)(控制臺(tái)操作)。
重要參數(shù)取值必須按照下文提供的取值來設(shè)定,否則可能會(huì)導(dǎo)致云助手執(zhí)行失敗。
①命令類型:選擇Shell。
②命令內(nèi)容:粘貼如下命令。有關(guān)Shell命令的示例,請(qǐng)參見查看實(shí)例系統(tǒng)配置。
if acs-plugin-manager --list --local | grep grid_driver_install > /dev/null 2>&1 then acs-plugin-manager --remove --plugin grid_driver_install fi acs-plugin-manager --exec --plugin grid_driver_install
③超時(shí)時(shí)間:命令執(zhí)行超時(shí)時(shí)間。當(dāng)執(zhí)行命令的任務(wù)超時(shí)后,云助手將強(qiáng)制終止任務(wù)進(jìn)程。取值:600。
說明超時(shí)時(shí)間僅支持設(shè)置為正整數(shù),單位為秒,取值范圍:10~86,400秒(24小時(shí))。
單擊執(zhí)行,通過云助手命令自動(dòng)升級(jí)GRID驅(qū)動(dòng)。
執(zhí)行完成后,您可以在執(zhí)行詳情頁查看執(zhí)行結(jié)果 。
重要如果實(shí)例已安裝了其他版本的GRID驅(qū)動(dòng),云助手會(huì)自動(dòng)卸載當(dāng)前版本GRID驅(qū)動(dòng),并重新安裝最新的SWL GRID驅(qū)動(dòng)。
升級(jí)GRID驅(qū)動(dòng)大概需要5~10分鐘完成,請(qǐng)您耐心等待。
遠(yuǎn)程連接GPU實(shí)例。
具體操作,請(qǐng)參見通過密碼或密鑰認(rèn)證登錄Linux實(shí)例。
執(zhí)行以下命令,查看GRID驅(qū)動(dòng)是否升級(jí)成功。
nvidia-smi
回顯結(jié)果顯示如下,表示已成功升級(jí)GRID驅(qū)動(dòng)。