에러 해결
[에러 해결] RuntimeError: CUDA error: no kernel image is available for execution on the device
체봄
2023. 9. 1. 17:40
'RuntimeError: CUDA error: no kernel image is available for execution on the device'
새로운 서버에서 라이브러리들을 설치하고 모델을 학습시키려했더니 위와 같은 에러가 발생했다.
에러 메시지를 보고 CUDA 설치와 관련된 무시무시한 에러인듯 보여서 걱정했는데, 간단히 해결 가능했다.
해결 방법
1.이 에러가 CUDA와 PyTorch 호환 관련된 문제라고 하므로, 설치되어 있는 PyTorch를 삭제한다.
2. https://developer.nvidia.com/cuda-gpus#compute 에 들어가서 본인이 사용중인 GPU를 찾아 Compute Capability 값을 확인한다.
3. $ export TORCH_CUDA_ARCH_LIST=8.6 과 같이 본인의 Compute Capability 값에 맞게 커맨드를 입력해준다.
4. https://pytorch.org/get-started/previous-versions/에 나온 명령어대로 PyTorch를 다시 설치한다.
- 그냥 내 마음대로 $ pip install torch==1.7.1 와 같이 설치를 했을 때는 에러가 해결되지 않았었다. 하지만 링크에 나온대로 $ conda install pytorch==1.7.1 torchvision==0.8.2 torchaudio==0.7.2 cudatoolkit=10.2 -c pytorch 로 설치하니 해결이 되었다. cudatoolkit 설치 여부가 중요한 듯하다.
해결 완료!
참고: https://yjs-program.tistory.com/206
반응형