NVIDIA-SMI가 NVIDIA 드라이버와 통신 할 수 없어서 실패했습니다. 최신 NVIDIA 드라이버가 설치되어 실행 중인지 확인하십시오


23

방금 다음과 같이 노트북에 CUDA를 설치했습니다.

sudo apt-get install cuda

여기에 말했듯 .

컴파일은 잘 작동하지만 실행하려고 할 때 다음과 같은 문제가 발생합니다. file.cu:CU:128 code = 35 (cudaErrorInsufficientDriver) "cudaStreamCreate (& (stream [i]))"오류

내 nvcc 버전 :

nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2016 NVIDIA Corporation
Built on Tue_Jan_10_13:22:03_CST_2017
Cuda compilation tools, release 8.0, V8.0.61

그래픽 카드 정보 :

lspci | egrep 'VGA|3D'
00:02.0 VGA compatible controller: Intel Corporation Skylake Integrated Graphics (rev 06)
02:00.0 3D controller: NVIDIA Corporation GM107M [GeForce GTX 960M] (rev a2)

또한 VirtualGL, bumblebee-nvidia, primus, freeglut3-dev를 설치했습니다. 다음 .

땅벌에서 무언가를 실행하려고 할 때 나는 이것을 얻었습니다 : optirun glxspheres64

[   41.413478] [ERROR]Cannot access secondary GPU - error: Could not load GPU driver
[   41.413520] [ERROR]Aborting because fallback start is disabled.

엔비디아 드라이버가 작동하지 않습니다.

nvidia-smi
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

nvidia 375 버전이 설치되어있는 것처럼 보이지만 작동하지 않습니다.

whereis nvidia
nvidia: /usr/lib/nvidia /usr/share/nvidia /usr/src/nvidia-375-375.66/nvidia

그리고 일부 운전자 정보.

modinfo nvidia_375
filename:       /lib/modules/4.8.0-54-generic/updates/dkms/nvidia_375.ko
alias:          char-major-195-*
version:        375.66
supported:      external
license:        NVIDIA
srcversion:     68751AFD79A210CEFFB8758
alias:          pci:v000010DEd00000E00sv*sd*bc04sc80i00*
alias:          pci:v000010DEd*sv*sd*bc03sc02i00*
alias:          pci:v000010DEd*sv*sd*bc03sc00i00*
depends:        
vermagic:       4.8.0-54-generic SMP mod_unload modversions 
parm:           NVreg_Mobile:int
parm:           NVreg_ResmanDebugLevel:int
parm:           NVreg_RmLogonRC:int
parm:           NVreg_ModifyDeviceFiles:int
parm:           NVreg_DeviceFileUID:int
parm:           NVreg_DeviceFileGID:int
parm:           NVreg_DeviceFileMode:int
parm:           NVreg_UpdateMemoryTypes:int
parm:           NVreg_InitializeSystemMemoryAllocations:int
parm:           NVreg_UsePageAttributeTable:int
parm:           NVreg_MapRegistersEarly:int
parm:           NVreg_RegisterForACPIEvents:int
parm:           NVreg_CheckPCIConfigSpace:int
parm:           NVreg_EnablePCIeGen3:int
parm:           NVreg_EnableMSI:int
parm:           NVreg_TCEBypassMode:int
parm:           NVreg_UseThreadedInterrupts:int
parm:           NVreg_MemoryPoolSize:int
parm:           NVreg_RegistryDwords:charp
parm:           NVreg_RmMsg:charp
parm:           NVreg_AssignGpus:charp

드라이버 버전 문제 일 수 있습니다.

dpkg -l | grep nvidia
ii  bumblebee-nvidia                            3.2.1-10                                      amd64        NVIDIA Optimus support using the proprietary NVIDIA driver
ii  nvidia-375                                  375.66-0ubuntu0.16.04.1                       amd64        NVIDIA binary driver - version 375.66
ii  nvidia-375-dev                              375.66-0ubuntu0.16.04.1                       amd64        NVIDIA binary Xorg driver development files
ii  nvidia-modprobe                             375.51-0ubuntu1                               amd64        Load the NVIDIA kernel driver and create device files
ii  nvidia-opencl-icd-375                       375.66-0ubuntu0.16.04.1                       amd64        NVIDIA OpenCL ICD
ii  nvidia-prime                                0.8.2                                         amd64        Tools to enable NVIDIA's Prime

내가 무엇을 놓치고 있습니까?


드라이버는 어떻게 설치합니까?
찰리 파커

같은 오류가 발생했지만 아무런 대답도 없었습니다. 일한 것은 간단했습니다 $ reboot now.
darthbhyrava

답변:


14

당신이 경우 nvidia-smi통신하지 못했습니다하지만 당신은 드라이버를 너무 여러 번, 확인을 설치했습니다 prime-select.

  1. prime-select query가능한 모든 옵션을 얻으려면 실행하십시오 . 적어도보아야합니다 nvidia | intel.
  2. 를 선택하십시오 prime-select nvidia.
  3. 이라고 표시 nvidia is already selected되면 예를 들어 다른 것을 선택하고 prime-select intel엔비디아로 다시 전환하십시오.prime-select nvidia
  4. 재부팅하고 확인하십시오 nvidia-smi.

나를 도와 주었다. 감사!
야로슬라프 슈베르트

어, prime-select query인텔도 나열하지 않았는데, 지금 2 개의 문제가있는 것 같습니다 ...
Inspi

11

cuda 툴킷을 설치할 수 있습니다. 다음 명령을 사용하여 설치하십시오.

sudo apt install nvidia-cuda-toolkit

설치가 완료되면 머신을 재부팅하십시오. nvidia-smi작동해야합니다.


나를 위해 작동합니다!
x0v

이것은 저에게 효과적입니다
Sundeep

6
그것은 작동하지 않았다
Bill Kotsias

2
cuda> = 10 인 경우이 작업을 수행하지 마십시오. CUDA PPA없이 우분투에서 현재 사용할 수있는 cuda를 9로 다운 그레이드합니다.
loretoparisi

이렇게 sudo apt-get purge nvidia-*하기 전에, 다음 날 위해 관련 위의 줄 고정 모든 것을 CUDA는 CUDA 10.1 (430) 드라이버를 설치
Dinari

6

보안 부팅을 비활성화했으며 꽤 잘 작동했습니다.

@로드 스미스는 aswered 다른 기본적으로 설정 설정이지만, 그는 또한에 그 작업을 수행하는 방법에 대한 좋은 기사 쓰기를 수행하는 방법을 설명하는 질문보다 구체적인를 여기를 .


2
그것은 또한 nvidia driver 390으로 나를 도왔습니다! 나는 그것 때문에 보안 부팅, 들으 :)이 될 거라고 생각하지
samutamm

보안 부팅이 비활성화 된 UEFI 모드는 이미 여기에서 수행됩니다. =) 불행히도 모든 사람에게 적합하지 않은 것 같습니다.
Renan Willian Prado

3

위의 @Rodolfo의 답변에 대해 언급 할 수 없으므로 (평판이 충분하지 않음) 새로운 답변을 추가하고 있습니다.

내 컴퓨터에서 OS에 따라 보안 부팅 을 구성해야했습니다 . Ubuntu 18.04를 실행하는 ASUS 메인 보드가 있고 패키지 된 NVIDIA 드라이버와 함께 NVIDIA CUDA 10.1 업데이트 2를 설치하려고했습니다. 위에서 설명한 것과 동일한 문제에 직면했습니다. 결과적으로 Secure Boot 는 Windows UEFI 모드로 설정되었습니다. 다른 OS로 변경하면 문제가 해결되었습니다.


1
감사 Secure Boot합니다 .Windows / BIOS 자동 업데이트 중에 자동으로 다시 활성화 된 기능 을 비활성화해야했습니다 !!! 이제 엔비디아는 잘 작동합니다.
Bill Kotsias

보안 부팅을 다른 OS로 변경 한 방법을 설명 하시겠습니까?
Inspi

1
@BillKotsias 감사합니다! : D
Marek

0

미래의 독자들을 위해 :

가상 머신 인스턴스 (Google Cloud Platform)에 있습니다.

그리고이 요점 을 따라 VM에 설치 Cuda하고 CuDNn있습니다.

CuDNn부품 을 수동으로 업로드해야했습니다 . (그냥 그냥 둬)

이제 오류가 발생했습니다.

이 문제가 있었지만 인스턴스를 완전히 다시 시작하면 작업이 완료되었습니다. 그리고 완전히 다시 시작한다는 것은 인스턴스를 중지했다가 다시 켜는 것을 의미합니다.

나는 이것이 누군가를 돕기를 바랍니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.