執(zhí)行nvidia-smi.exe,顯示的顯存差1G多,比如原本是24G顯存,結果只顯示了22G多。

直接說結論:開啟ECC導致可用顯存少了一部分,那部分用于支持ECC功能了。


(資料圖片僅供參考)

Tesla系列GPU默認開啟了ECC(error correcting code,錯誤檢查和糾正)功能,該功能可以提高數(shù)據(jù)的正確性,隨之而來的是可用內(nèi)存的減少和性能上的損失。

關閉、開啟各有利弊,一般不建議關閉--為了正確性

如果放棄保障正確性而單純追求性能,那就關閉,看你自己

我自己的電腦是rtx2070 super顯卡,8G顯存,執(zhí)行nvidia-smi.exe顯示的顯存是8192MB

執(zhí)行nvidia-smi -q -d ecc查看ecc情況:

我電腦顯卡不支持ecc

nvidia-smi -q -d ecc

通過 nvidia-smi -i n -e 0/1 可關閉(0)/開啟(1)第n號GPU的ECC模式,重啟后該設置生效。

nvidia-smi -L 顯示了一個顯卡,即0號顯卡

關閉ECC:nvidia-smi -i 0 -e 0

開啟ECC:nvidia-smi -i 0 -e 1

可惜我電腦顯卡不支持ecc,消費卡便宜有便宜的道理(企業(yè)卡貴有貴的道理--支持ecc?。?/p>

參考:https://blog.csdn.net/sxjcXiaomin/article/details/78652924

https://www.nvidia.com/content/Control-Panel-Help/vLatest/zh-cn/mergedProjects/nvwksCHS/To_turn_your_GPU_ECC_on_or_off.htm