如果您的NVIDIA Tesla或NVIDIA GRID驅動版本已不適用于當前場景,或者您安裝了錯誤的驅動類型或版本導致GPU實例無法使用,您可以通過卸載當前驅動再安裝所需驅動的方式,完成Tesla或GRID驅動的升級操作。
升級NVIDIA Tesla驅動
升級Tesla驅動時,需要先卸載相應的Tesla驅動,然后再根據需要安裝的驅動類型和操作系統,重新安裝新的Tesla驅動。
卸載當前Tesla驅動。
具體操作,請參見卸載Tesla驅動。
安裝新的Tesla驅動。
Windows:在GPU計算型實例中安裝Tesla驅動(Windows)
升級NVIDIA GRID驅動
確認是否需要升級GRID驅動
升級GRID驅動前,請先判斷當前實例的GRID驅動是否需要升級,然后再根據實際情況選擇對應的升級方式。
Windows系統GPU虛擬化型實例(vgn5i、vgn6i、vgn6i-vws、vgn7i-vws、sgn7i-vws)
如果實例的當前GRID驅動版本號不是474.04,則您需要將當前驅動升級到SWL驅動。
如果實例的當前GRID驅動版本號是474.04,則您需要通過查看License Status判斷是否需要升級驅動。具體操作如下:
登錄Windows系統GPU虛擬化型實例(例如vgn7i-vws)。
具體操作,請參見通過密碼或密鑰認證登錄Windows實例。
打開
cmd
,依次執行以下命令,查看當前驅動License Status。cd C:\Program Files\NVIDIA Corporation\NVSMI nvidia-smi.exe -q | findstr License
輸出結果如下所示,表示當前驅動的License未過期,此時您無需將當前驅動升級到SWL驅動,否則您需要將當前驅動升級到SWL驅動。具體操作,請參見通過更新鏡像升級vgn5i或vgn6i的GRID驅動或通過云助手升級GRID驅動。
Windows系統GPU計算型實例(gn7i、gn6i、ebmgn7i、ebmgn6i)
您可以通過查看License Status判斷是否需要升級驅動。具體操作如下:
登錄Windows系統GPU計算型實例(例如gn7i)。
具體操作,請參見通過密碼或密鑰認證登錄Windows實例。
打開
cmd
,依次執行以下命令,查看當前驅動License Status。cd C:\Program Files\NVIDIA Corporation\NVSMI nvidia-smi.exe -q | findstr License
如果輸出結果如下圖所示,表示當前驅動的License未過期,此時您需要繼續執行下一步。
如果輸出結果非下圖所示,表示當前驅動的License已過期,此時您需要將當前驅動升級到SWL驅動。具體操作,請參見通過云助手升級GRID驅動。
(可選)執行以下命令,查看License類型是否為NVIDIA RTX Virtual Workstation。
如果當前驅動的License未過期,您需要繼續確認License類型是否為NVIDIA RTX Virtual Workstation。
nvidia-smi.exe -q | findstr Product
如果輸出結果如下圖所示,表示當前驅動License類型為NVIDIA RTX Virtual Workstation,此時您無需將當前驅動升級到SWL驅動。
如果輸出結果非下圖所示,表示當前驅動License類型不是NVIDIA RTX Virtual Workstation,此時您需要將當前驅動升級到SWL驅動。具體操作,請參見通過云助手升級GRID驅動。
Linux系統GPU虛擬化型實例(vgn5i、vgn6i、vgn6i-vws、vgn7i-vws、sgn7i-vws)
如果實例已安裝的GRID驅動版本號不是470.161.03,則需要升級驅動。
如果實例已安裝的GRID驅動版本號是470.161.03,則您需要通過查看License Status判斷是否需要升級驅動。具體操作如下:
登錄Linux系統GPU虛擬化型實例(例如vgn7i-vws)。
具體操作,請參見通過密碼或密鑰認證登錄Linux實例。
執行以下命令,查看當前驅動License Status。
# nvidia-smi -q |grep -i license
輸出結果如下所示,表示當前驅動的License未過期,此時您無需將當前驅動升級到SWL驅動,否則您需要將當前驅動升級到SWL驅動。具體操作,請參見通過更新鏡像升級vgn5i或vgn6i的GRID驅動或通過云助手升級GRID驅動。
Linux系統GPU計算型實例(gn7i、gn6i、ebmgn7i、ebmgn6i)
因為該實例不需要使用GRID驅動也可以支持圖形加速功能,僅使用NVIDIA官網驅動即可,您無需將當前驅動升級到SWL驅動。
通過更新鏡像升級vgn5i或vgn6i的GRID驅動
適用實例
僅適用Windows系統或Linux系統的GPU虛擬化型實例vgn5i或vgn6i。
自2024年2月1日起,vgn5i和vgn6i實例且將全面關閉,更多信息,請參見【公告】vgn5i和vgn6i停售通知。
通過更新鏡像的方式升級vgn5i或vgn6i規格的GRID驅動,其原因及建議如下所示:
實例規格 | 原因 | 建議 |
vgn5i | vgn5i使用的P4顯卡無法使用SWL類型的GRID驅動。 | 將該實例升配為vgn6i-vws、sgn7i-vws后,然后通過更新鏡像的方式升級為GRID驅動。 重要 升配過程中,升配后的實例相比升配前的實例費用要高一些,請提交工單獲取代金券,用于抵扣升配時需要支付的額外費用。 |
vgn6i | vgn6i所在服務器使用的還是GRID 9,該服務器無法兼容SWL類型的GIRD驅動。 |
操作步驟
升配實例規格。
以vgn6i(ecs.vgn6i-m4.xlarge)實例升配為sgn7i-vws(ecs.sgn7i-vws-m2.xlarge)實例為例,vgn6i實例的升配操作請參考以下步驟。
將升配后的實例驅動升級為SWL GRID驅動。
在實例列表頁,找到升配后的sgn7i-vws實例,單擊對應操作列的停止。
在彈出的停止實例頁面,根據需要選擇停止方式和停止模式選項后,單擊確定。
說明如需了解停止實例的更多信息,請參見停止實例。
找到目標實例,在操作列選擇 。
在更換操作系統對話框,選中更換系統盤。
仔細閱讀更換操作系統注意事項并選中我已知曉以上風險,然后單擊繼續更換操作系統。
在鏡像區域,單擊鏡像市場頁簽,然后單擊從鏡像市場獲取更多選擇(含操作系統)。
在彈出的鏡像市場頁面,輸入GRID 13.5后,單擊搜索。
目前支持使用如下Linux操作系統和Windows操作系統的鏡像:
操作系統
已預裝GRID驅動的鏡像
Linux
Alibaba Cloud Linux 2.1903 LTS 64位預裝GRID 13.5 SWL驅動鏡像
Alibaba Cloud Linux 3.2104 LTS 64位預裝GRID 13.5 SWL驅動鏡像
CentOS 7.9 64位預裝GRID 13.5 SWL驅動鏡像
Ubuntu 18.04 64位預裝GRID 13.5 SWL驅動鏡像
Ubuntu 20.04 64位預裝GRID 13.5 SWL驅動鏡像
Ubuntu 22.04 64位預裝GRID 13.5 SWL驅動鏡像
Windows
Windows Server 2022中文版預裝GRID 13.5 SWL驅動鏡像
Windows Server 2019中文版預裝GRID 13.5 SWL驅動鏡像
根據需要選擇相應的已預裝GRID 13.5 SWL驅動的鏡像,然后單擊使用。
通過云助手升級GRID驅動
對于存量的vgn5i和vgn6i實例,請勿使用云助手方式升級GRID驅動,否則會導致該實例不可用。可用的升級方式請參見通過更新鏡像升級vgn5i或vgn6i的GRID驅動。
升級GRID驅動(Windows)
適用實例
僅以下Windows GPU實例規格族支持通過云助手升級GRID驅動:
Windows系統GPU虛擬化型實例:vgn6i-vws、vgn7i-vws、sgn7i-vws
Windows系統GPU計算型實例:gn7i、gn6i、ebmgn7i、ebmgn6i
操作步驟
下文以一臺華東1(杭州)地域的vgn6i-vws實例(ecs.vgn6i-m4-vws.xlarge)為例。
登錄ECS管理控制臺。
在左側導航欄,選擇 。
在頁面左側頂部,選擇目標資源所在的地域。
在ECS實例頁簽下的實例列表,選擇目標實例,單擊對應操作欄下的執行命令。
通過創建并執行云助手命令升級GRID驅動。
在創建執行命令面板的命令信息區域,完成參數配置。
主要參數配置項如下所示,其他參數保持默認,更多信息,請參見命令參數(控制臺操作)。
重要參數取值必須按照下文提供的取值來設定,否則可能會導致云助手執行失敗。
①命名類型:支持選擇Bat和Power Shell兩種命令類型。取值:PowerShell。
②命令內容:編輯或者粘貼您的命令。示例如下:
$InstalledPlugins = $(acs-plugin-manager --list --local) if ($($InstalledPlugins | Select-String "grid_driver_install")) { acs-plugin-manager --remove --plugin grid_driver_install } acs-plugin-manager --fetchTimeout 0 --exec --plugin grid_driver_install
③超時時間:設置命令在實例中的超時時間,當執行命令的任務超時后,云助手將強制終止任務進程。取值:600。
說明超時時間僅支持設置為正整數,單位為秒,取值范圍:10~86,400秒(24小時),默認值為60秒。
單擊執行,通過云助手命令升級GRID驅動。
云助手命令執行完成后,在執行詳情頁查看如下信息(即舊版GRID驅動需要卸載后才能升級),表示實例已安裝舊版GRID驅動。
您需要通過云助手命令先卸載當前已安裝的舊版GRID驅動,然后必須重啟實例,再執行一次相同的云助手命令才能繼續升級GRID驅動。具體操作如下:
重要卸載或重新安裝GRID驅動大概需要5~10分鐘完成,請您耐心等待。
重啟GPU實例。
具體操作,請參見重啟實例。
再次執行相同的云助手命令重新安裝新的GRID驅動。
通過云助手命令自動安裝新的GRID驅動后,您可以在執行詳情頁查看執行結果。
驗證升級的GRID驅動是否生效。
重啟GPU實例。
具體操作,請參見重啟實例。
遠程連接GPU實例。
具體操作,請參見通過密碼或密鑰認證登錄Windows實例。
在登錄頁面空白處,右鍵單擊并打開NVIDIA 控制面板。
顯示結果如下所示,表示安裝的新GRID驅動已生效。
升級GRID驅動(Linux)
適用實例
僅以下Linux GPU實例規格族支持通過云助手升級GRID驅動:vgn6i-vws、vgn7i-vws、sgn7i-vws。
操作步驟
下文以一臺華東1(杭州)地域的vgn6i-vws實例(ecs.vgn6i-m4-vws.xlarge )為例。
登錄ECS管理控制臺。
在左側導航欄,選擇 。
在頁面左側頂部,選擇目標資源所在的地域。
在ECS實例頁簽下的實例列表,選擇目標實例,單擊對應操作欄下的執行命令。
在創建執行命令面板的命令信息區域,完成參數配置。
主要參數配置項如下所示,其他參數保持默認。更多信息,請參見命令參數(控制臺操作)。
重要參數取值必須按照下文提供的取值來設定,否則可能會導致云助手執行失敗。
①命令類型:選擇Shell。
②命令內容:粘貼如下命令。有關Shell命令的示例,請參見查看實例系統配置。
if acs-plugin-manager --list --local | grep grid_driver_install > /dev/null 2>&1 then acs-plugin-manager --remove --plugin grid_driver_install fi acs-plugin-manager --exec --plugin grid_driver_install
③超時時間:命令執行超時時間。當執行命令的任務超時后,云助手將強制終止任務進程。取值:600。
說明超時時間僅支持設置為正整數,單位為秒,取值范圍:10~86,400秒(24小時)。
單擊執行,通過云助手命令自動升級GRID驅動。
執行完成后,您可以在執行詳情頁查看執行結果 。
重要如果實例已安裝了其他版本的GRID驅動,云助手會自動卸載當前版本GRID驅動,并重新安裝最新的SWL GRID驅動。
升級GRID驅動大概需要5~10分鐘完成,請您耐心等待。
遠程連接GPU實例。
具體操作,請參見通過密碼或密鑰認證登錄Linux實例。
執行以下命令,查看GRID驅動是否升級成功。
nvidia-smi
回顯結果顯示如下,表示已成功升級GRID驅動。