本文中含有需要您注意的重要提示信息,忽略該信息可能對您的業務造成影響,請務必仔細閱讀。
如果當前NVIDIA Tesla驅動因某種原因需要卸載,請按照驅動的操作系統選擇相應的卸載方法。
GPU實例必須配備了相關驅動才可以正常使用。如果您因某種原因需要卸載當前驅動,請務必再安裝與您實例規格及操作系統相匹配的正確驅動,否則會因GPU實例與安裝的驅動不匹配而造成業務無法正常進行的風險。
在Windows操作系統中卸載Tesla驅動
以操作系統為Windows Server 2019的GPU計算型實例gn6i為例,該實例安裝了472.50版本的Tesla驅動,現因某些原因需要卸載,具體請參考以下操作。
遠程連接GPU實例。
具體操作,請參見通過密碼或密鑰認證登錄Windows實例。
單擊Windows桌面左下角圖標,然后單擊控制面板。
在控制面板中,選擇 。
右鍵單擊待卸載的Tesla驅動(例如
NVIDIA 圖形驅動程序 472.50
),然后單擊卸載/更改(U)。在彈出的NVIDIA 卸載程序對話框,單擊卸載(U)。
卸載完成后,單擊馬上重新啟動(R)。
重啟完成后,則Tesla驅動已卸載成功。
在Linux操作系統中卸載Tesla驅動
由于Tesla驅動的安裝方式不同,其卸載Tesla驅動的方法也有所差異,請您根據實際Tesla驅動的安裝場景選擇對應的卸載方法,以下操作以Tesla驅動470.161.03、CUDA 11.4.1為例。
Linux系統的相關步驟均需要以root
用戶登錄并進行操作,如果您是普通用戶,請使用sudo
命令獲取root
權限后再操作。
(條件必選)步驟1:卸載nvidia-fabricmanager服務
僅當GPU實例的規格族為ebmgn7、ebmgn7e、ebmgn7ex或sccgn7ex時,您需要卸載nvidia-fabricmanager服務。以Tesla驅動版本為470.161.03為例,具體操作如下所示。
如果您創建的GPU實例的規格族不是ebmgn7、ebmgn7e、ebmgn7ex或sccgn7ex時,請直接執行步驟2。
執行以下命令,停止nvidia-fabricmanager服務。
systemctl stop nvidia-fabricmanager systemctl disable nvidia-fabricmanager
執行以下命令,卸載nvidia-fabricmanager安裝包。
根據不同的操作系統,卸載nvidia-fabricmanager安裝包的方式也不同。
CentOS或Alibaba Cloud Linux
#查看安裝包名 rpm -qa | grep nvidia-fabric-manager #執行卸載命令 rpm -e nvidia-fabric-manager-470.161.03-1.x86_64
Ubuntu
#查看安裝包名 dpkg --list |grep nvidia-fabricmanager #執行卸載命令 apt remove nvidia-fabricmanager-470
步驟2:卸載Tesla驅動
如果您在Ubuntu、CentOS、Alibaba Cloud Linux、SUSE操作系統中使用不同安裝包(例如run安裝包、deb安裝包、rpm安裝包)安裝了Tesla驅動,因某種原因需要手動卸載時,請按照Tesla驅動的不同安裝場景選擇對應的卸載方法。
如果在創建GPU實例時同時自動安裝了Tesla驅動,則該驅動的卸載需選擇通過run安裝包的卸載方式。以Tesla驅動470.161.03、CUDA 11.4.1為例,具體操作如下所示。
執行以下命令,卸載Tesla驅動。
/usr/bin/nvidia-uninstall
執行以下命令,卸載CUDA。
/usr/local/cuda/bin/cuda-uninstaller rm -rf /usr/local/cuda-11.4
說明不同CUDA版本,卸載命令可能存在差別,如果未找到cuda-uninstaller文件,請到/usr/local/cuda/bin/目錄下查看是否存在uninstall_cuda開頭的文件。如果有,則將命令中的cuda-uninstaller替換為該文件名。
執行以下命令,重啟實例。
reboot
如果您在Ubuntu操作系統中使用deb安裝包安裝了Tesla驅動,以Tesla驅動470.161.03、CUDA 11.4.1為例,驅動卸載操作如下所示。
執行以下命令,卸載CUDA。
apt-get --purge remove "*cuda*" "*cublas*" "*cufft*" "*cufile*" "*curand*" \ "*cusolver*" "*cusparse*" "*gds-tools*" "*npp*" "*nvjpeg*" "nsight*" "*nvvm*" rm -rf /usr/local/cuda-11.4
執行以下命令,卸載Tesla驅動。
apt-get --purge remove "*nvidia*" "libxnvctrl*"
執行以下命令,卸載所有安裝包并清理。
apt-get autoremove
執行以下命令,重啟實例。
reboot
根據不同操作系統中使用rpm安裝包安裝了Tesla驅動,其驅動卸載方式也不同。
CentOS 7或Alibaba Cloud Linux 2操作系統
如果您在CentOS 7或Alibaba Cloud Linux 2操作系統中使用rpm安裝包安裝了Tesla驅動,以Tesla驅動470.161.03、CUDA 11.4.1為例,驅動卸載操作如下所示。
執行以下命令,卸載CUDA。
yum remove "cuda*" "*cublas*" "*cufft*" "*cufile*" "*curand*" \ "*cusolver*" "*cusparse*" "*gds-tools*" "*npp*" "*nvjpeg*" "nsight*" "*nvvm*" rm -rf /usr/local/cuda-11.4
執行以下命令,卸載Tesla驅動。
yum remove "*nvidia*"
執行以下命令,重啟實例完成驅動卸載。
reboot
CentOS 8或Alibaba Cloud Linux 3操作系統
如果您在CentOS 8或Alibaba Cloud Linux 3中使用rpm安裝包安裝了Tesla驅動,以Tesla驅動470.161.03、CUDA 11.4.1為例,驅動卸載操作如下所示。
執行以下命令,卸載CUDA。
dnf remove "cuda*" "*cublas*" "*cufft*" "*cufile*" "*curand*" \ "*cusolver*" "*cusparse*" "*gds-tools*" "*npp*" "*nvjpeg*" "nsight*" "*nvvm*" rm -rf /usr/local/cuda-11.4
執行以下命令,卸載Tesla驅動。
dnf module remove --all nvidia-driver
執行以下命令,重置Tesla驅動模塊。
dnf module reset nvidia-driver
執行以下命令,重啟實例。
reboot
SUSE操作系統
如果您在SUSE操作系統中使用rpm安裝包安裝Tesla驅動,以Tesla驅動470.161.03、CUDA 11.4.1為例,驅動卸載操作如下所示。
執行以下命令,卸載CUDA。
zypper remove "cuda*" "*cublas*" "*cufft*" "*cufile*" "*curand*" \ "*cusolver*" "*cusparse*" "*gds-tools*" "*npp*" "*nvjpeg*" "nsight*" "*nvvm*" rm -rf /usr/local/cuda-11.4
執行以下命令,卸載Tesla驅動。
zypper remove "*nvidia*"
執行以下命令,重啟實例。
reboot
相關文檔
如果您的實例已安裝了GRID驅動,卻因某種原因需要卸載當前驅動,具體操作,請參見卸載GRID驅動。