[에러 해결] RuntimeError: Cannot re-initialize CUDA in forked subprocess. To use CUDA with multiprocessing, you must use the 'spawn' start method

티스토리 뷰

에러 해결

[에러 해결] RuntimeError: Cannot re-initialize CUDA in forked subprocess. To use CUDA with multiprocessing, you must use the 'spawn' start method

체봄 2025. 7. 25. 18:45

(VllmWorkerProcess pid=0) ERROR 07-25 09:33:19 multiproc_worker_utils.py:242] RuntimeError: Cannot re-initialize CUDA in forked subprocess. To use CUDA with multiprocessing, you must use the 'spawn' start method

vllm을 통해 모델 추론을 하려고 하는데, 위와 같은 에러가 발생했다.

https://github.com/vllm-project/vllm/issues/8893

[Bug]: RuntimeError: Cannot re-initialize CUDA in forked subprocess. To use CUDA with multiprocessing, you must use the 'spawn'

I have updated to the latest version and used the “spawn” method, export VLLM_WORKER_MULTIPROC_METHOD=spawn but the error still persists. Could you please help me?

github.com

위 링크에 따르면, 해결 방법은 크게 2가지로 나뉜다.

해결 방법:

import os

os.environ['VLLM_WORKER_MULTIPROC_METHOD'] = 'spawn'

1. 위 코드를 추가한다.

2. 실행하려는 py 파일에서 vLLM 호출 코드를 if __name__ == "__main__": 구문 안에 작성한다.

위 방법을 수행하니 에러가 해결되었다.

저작자표시 (새창열림)

'에러 해결' 카테고리의 다른 글

[에러 해결] pandas to.csv() 사용 시 'OSError: [Errno 27] File too large' 에러 (1)	2025.08.13
[에러 해결] OpenAI 라이브러리 사용 시 TypeError: Client.__init__() got an unexpected keyword argument 'proxies' 에러 (0)	2025.05.29
[에러 해결] Python 3.12에서 kss 설치 오류 (pyyaml 의존성 문제) (7)	2025.03.28
[에러 해결] RuntimeError: ProcessGroupNCCL is only supported with GPUs, no GPUs found! (1)	2023.11.24
[에러해결] 'bash: git: command not found' (0)	2023.11.16

NLP 성장러의 아카이브

티스토리 뷰

[에러 해결] RuntimeError: Cannot re-initialize CUDA in forked subprocess. To use CUDA with multiprocessing, you must use the 'spawn' start method

'에러 해결' 카테고리의 다른 글

티스토리툴바