CUDA

CUDA

CUDA VISIBLE DEVICE http://m.itdecent.cn/p/22c0f8ec9a3e

CUDA_VISIBLE_DEVICES=2,3 python my_script.py # Uses GPUs 2 and 3.
代碼里設(shè)置可見顯卡

if args.gpu == 'None':
    config.set_cuda(False)
else:
    try:
        os.environ['CUDA_VISIBLE_DEVICES'] = str(args.gpu)
    except IndexError:
        config.set_cuda(False)

如果要周期性的輸出顯卡的使用情況,可以用watch指令實(shí)現(xiàn):
watch -n 10 nvidia-smi

升級(jí)CUDA版本

看NVIDIA驅(qū)動(dòng)版本
sudo dpkg --list | grep nvidia-*nvidia-smi差不多,以前者為準(zhǔn),然后到 https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html不同版本cuda對(duì)應(yīng)的NVIDIA驅(qū)動(dòng)版本 (mamicode.com) 找對(duì)應(yīng)的 CUDA 版本;
檢查linux版本 sudo dpkg --list | grep nvidia-*
選擇CUDA版本https://developer.nvidia.com/cuda-11.1.0-download-archive?target_os=Linux&target_arch=x86_64&target_distro=WSLUbuntu&target_version=20 或者 https://developer.nvidia.com/cuda-downloads?target_os=Linux

CUDA版本檢測(cè)https://zhuanlan.zhihu.com/p/48641682

當(dāng)CUDA9安裝完成后,需要進(jìn)行檢測(cè):

  1. cat /usr/local/cuda/version.txt #這種方法不太準(zhǔn),得到9.0.176

  2. nvcc --version #這種方法準(zhǔn)。如果nvcc沒有安裝,則sudo apt install nvidia-cuda-toolkit。檢查出來是7.5.17

3)通過代碼來查:

cudaDriverGetVersion(&driver_version); #獲取cuda版本。得到9.0

cudaRuntimeGetVersion(&runtime_version); #獲取cuda運(yùn)行時(shí)版本。得到7.5

4)檢測(cè)顯卡型號(hào)及NVIDIA驅(qū)動(dòng)版本

查看GPU型號(hào) lspci | grep -i nvidia 得到M4000

查看NVIDIA驅(qū)動(dòng)版本 sudo dpkg --list | grep nvidia-* 得到384.130

根據(jù)不同版本cuda對(duì)應(yīng)的NVIDIA驅(qū)動(dòng)版本(不同版本cuda對(duì)應(yīng)的NVIDIA驅(qū)動(dòng)版本 - LearnFromNow - 博客園),這個(gè)驅(qū)動(dòng)應(yīng)該對(duì)應(yīng)cuda9.0

5)進(jìn)一步查是否環(huán)境變量的問題,參見 Ubuntu16.04下安裝多版本cuda和cudnn - tunhuzhuang1836的博客 - CSDN博客

在~/.bashrc中查看有無類似的語句,如有改成下面的樣子,沒有則增加:

export PATH="$PATH:/usr/local/cuda/bin"

export LD_LIBRARY_PATH="$LD_LIBRARY_PATH:/usr/local/cuda/lib64"

export LIBRARY_PATH="$LIBRARY_PATH:/usr/local/cuda/lib64"

然后繼續(xù)nvcc --version還是得到7.5。

6)檢查nvcc

which nvcc,發(fā)現(xiàn)是/usr/bin/nvcc,而實(shí)際上nvcc是應(yīng)該在/usr/local/cuda/bin/nvcc。

所以,sudo gedit /usr/bin/nvcc,把里面的內(nèi)容"exec /usr/lib/nvidia-cuda-toolkit/bin/nvcc" 改成"exec /usr/local/cuda/bin/nvcc"

然后繼續(xù)nvcc --version這次得到9.0

DGL安裝

https://www.dgl.ai/pages/start.html

安裝 base 包

  • 更新pip
    python -m pip install --upgrade pip
  • 安裝 sklearn
    pip install -U scikit-learn
  • 1、使用Pip更新Pytorch和torchvision

列舉pip當(dāng)前可以更新的所有安裝包

pip list --outdated --format=legacy

更新pytorch和torchvision安裝包

pip install --upgrade pytorch torchvision

  • 2、使用conda更新Pytorch和torchvision

建議將其添加soumith為您的Anaconda(或Miniconda)的源服務(wù)器

conda config --add channels soumith

更新pytorch和torchvision安裝包

conda update pytorch torchvision
檢查
import torch
print(torch.version)
torch.cuda.is_available()返回 False
torch.cuda.is_available()返回False,但nvidia-smi正常

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容