如果您想要在GPU云服務器上進行GPU加速計算任務(例如科學計算或大規模并行計算等),則需要安裝CUDA開發運行環境。CUDA提供了一整套工具和庫,可以幫助您進行GPU加速的程序開發,以充分發揮NVIDIA GPU的計算潛力,提高計算性能和加速運行效率。本文為您介紹如何手動安裝CUDA。
背景信息
CUDA(Compute Unified Device Architecture,統一計算設備架構)是由NVIDIA推出的通用并行計算架構,該架構利用GPU(圖形處理器)的處理能力可以解決復雜的計算問題。其包含了CUDA指令集架構(ISA)以及GPU內部的并行計算引擎。目前,CUDA除了可以使用C語言開發外還支持FORTRAN和C++語言,使用該類語言編寫的程序可以在支持CUDA架構的處理器上運行,并且能夠獲得超高的性能。另外,CUDA支持Java、Python等各類語言的接口。
前提條件
已創建GPU實例,具體操作,請參見創建GPU實例。
確保GPU實例的驅動版本與待安裝的CUDA版本相匹配。更多信息,請參見驅動版本與CUDA版本的對應表。
操作步驟
CUDA支持Windows和Linux兩種主流系統。本文以CUDA 12.1.1版本為例,為您介紹在Linux和Windows操作系統GPU實例上安裝CUDA的具體操作。
Linux操作系統
獲取CUDA安裝包。
進入CUDA Toolkit Archive頁面。
選擇驅動對應的CUDA版本。
下圖以CUDA Toolkit 12.1.1為例。
獲取CUDA安裝包下載地址。
選擇需要的操作系統、架構或版本等參數項。
參數項
取值示例
Operating System
Linux
Architecture
X86_64
Distribution
Ubuntu
Version
20.04
Installer Type
runfile(local)
獲取CUDA安裝包下載地址。
安裝CUDA包。
選擇任一方式遠程登錄GPU實例。
連接方式
操作指引
Workbench
VNC
使用
wget
命令,并粘貼步驟1獲取的下載地址,然后執行命令下載CUDA安裝包。wget https://developer.download.nvidia.com/compute/cuda/12.1.1/local_installers/cuda_12.1.1_530.30.02_linux.run
重要下載CUDA安裝包大概需要5分鐘~10分鐘,請您耐心等待。
依次執行以下命令,安裝CUDA軟件包。
說明對于GPU計算型實例,您可以單獨手動安裝Tesla驅動,也可以在安裝CUDA時同步安裝CUDA內自帶的驅動。
對于GPU虛擬化型實例,安裝CUDA時無法同步安裝GRID驅動,您需要自行手動安裝GRID驅動。具體操作,請參見安裝GRID驅動。
交互式安裝方式
sudo chmod +x cuda_12.1.1_530.30.02_linux.run
sudo ./cuda_12.1.1_530.30.02_linux.run
根據提示輸入accept后,請依據實際情況選擇是否安裝CUDA包中自帶的驅動:
如果您的實例為GPU計算型實例,并且該實例已安裝了驅動,請按照下圖操作(使用Enter鍵)取消Driver選項,然后選擇Install繼續安裝。
重要如果未取消Driver選項,則會安裝CUDA包中自帶的驅動來覆蓋實例已安裝的驅動。
如果您的實例為GPU計算型實例,并且您需要使用CUDA包中自帶的驅動,則需要先確認CUDA包內的驅動與該實例的GPU型號是否兼容,更多信息,請參見下載Tesla驅動(Linux)。確認CUDA包內的驅動與GPU型號兼容時,請保持默認選項(即已選中Driver選項)并選擇Install繼續安裝。
如果您的實例為GPU虛擬化型實例,該實例需要安裝GRID驅動。建議您先確認是否已安裝GRID驅動,具體操作,請參見安裝GRID驅動。安裝完GRID驅動后,再重新安裝CUDA并按照下圖操作(使用Enter鍵)取消Driver選項,然后選擇Install繼續安裝。
靜默安裝方式
sudo chmod +x cuda_12.1.1_530.30.02_linux.run
sudo ./cuda_12.1.1_530.30.02_linux.run --toolkit --samples --silent
重要采用靜默安裝方式,不會自動安裝CUDA包自帶的驅動,您需要手動單獨安裝GPU實例所需的驅動。
執行以下命令,重啟GPU實例。
reboot
依次執行以下命令,配置CUDA環境變量。
echo 'export PATH=/usr/local/cuda/bin:$PATH' | sudo tee /etc/profile.d/cuda.sh
source /etc/profile
檢查CUDA是否成功安裝。
執行
nvcc -V
命令,檢查CUDA安裝版本是否正確。依次執行以下命令,測試CUDA Samples,驗證CUDA是否安裝成功。
cd /usr/local/cuda-12.1/extras/demo_suite
./deviceQuery
如果返回結果顯示
Result=PASS
,則表示CUDA安裝成功。
Windows操作系統
登錄Windows操作系統GPU計算型實例。
選擇以下任一方式遠程連接GPU實例。
連接方式
操作指引
Workbench
VNC
選擇待安裝的CUDA版本。
進入CUDA Toolkit Archive頁面。
選擇驅動對應的CUDA版本。
您需要先確認CUDA包內的驅動與實例的GPU型號是否兼容,更多信息,請參見下載Tesla驅動(Windows)。下圖以CUDA Toolkit 12.1.1為例。
選擇需要的操作系統、架構或版本等參數項。
參數項
取值示例
Operating System
Windows
Architecture
X86_64
Version
Server 2022
Installer Type
exe(local)
單擊Download下載對應的CUDA軟件包。
安裝CUDA包。
打開已下載的CUDA所在的文件夾,雙擊安裝文件并開始安裝,按照界面上的提示來安裝程序。
如果出現NVIDIA安裝程序已完成對話框,則表示CUDA安裝成功。