내가 내 PC의 그래픽카드를 직접 혹사시키기로 결심한 이유
매달 결제하던 미드저니(Midjourney) 구독료가 30달러를 넘어가면서, 블로그 썸네일과 취미용 웹소설 삽화를 뽑는 데 드는 유지비가 꽤 부담스러워졌습니다. 게다가 프롬프트를 아무리 세밀하게 깎아도 제가 원하는 정확한 손동작이나 일관된 캐릭터 얼굴을 연속해서 유지하기가 하늘의 별 따기였죠. ‘비싼 클라우드 서버 대신, 방구석에 있는 내 데스크톱 그래픽카드를 갈구면서 평생 무료로 이미지를 통제할 수는 없을까?’라는 생각에 도달했습니다. 며칠 밤낮을 해외 포럼과 깃허브를 뒤져가며 제 PC에 직접 오픈소스 AI인 ‘스테이블 디퓨전(Stable Diffusion)’을 설치했습니다. 까만 코딩 화면에 지레 겁먹었지만, 막상 부딪혀보니 클릭 몇 번과 명령어 복사-붙여넣기면 끝나는 과정이었습니다. 유료 AI의 과금 감옥에서 탈출해 무제한 무료 이미지 생성의 신세계를 열어준, 가장 직관적인 로컬 설치 가이드를 제 뼈아픈 삽질 경험과 함께 가감 없이 공유합니다.
목차
- 1. 내 PC가 AI 화가가 될 수 있을까? (테스트 환경 및 필수 스펙)
- 2. 실전 설치 가이드: 파이썬 세팅부터 WebUI 구동까지
- 3. 설치 중 마주친 시뻘건 에러 창과 해결 방법 2가지
- 4. 로컬 AI 도입 후 확인한 드라마틱한 비용 절감 수치
- 5. 핵심 3줄 요약 및 이런 분들께 강력히 권합니다
1. 내 PC가 AI 화가가 될 수 있을까? (테스트 환경 및 필수 스펙)
내 컴퓨터 안에서 수십억 개의 파라미터를 가진 이미지 생성 AI를 돌리려면, 안타깝게도 사무용 내장 그래픽 노트북으로는 턱없이 부족합니다. 외부 서버를 빌려 쓰는 방식이 아니기 때문에, 오직 내 PC의 그래픽카드(GPU) 성능과 VRAM(비디오 메모리)에 생성 속도와 해상도가 전적으로 좌우됩니다. 제가 직접 쾌적하게 구동 테스트를 마친 데스크톱 환경은 다음과 같습니다.
- 운영체제: Windows 11 Pro
- 그래픽카드(GPU): NVIDIA GeForce RTX 3060 12GB (VRAM은 최소 8GB 이상, 권장 12GB 이상이어야 메모리 부족 에러가 덜 납니다. AMD 그래픽카드도 가능은 하지만 세팅이 훨씬 까다로워 NVIDIA 환경을 강력히 추천합니다.)
- 메모리(RAM): 32GB (최소 16GB)
- 필수 소프트웨어 버전: Python 3.10.6 (버전이 다르면 의존성 패키지 설치 시 치명적 에러가 발생합니다), Git for Windows
2. 실전 설치 가이드: 파이썬 세팅부터 WebUI 구동까지
이제 검은 터미널 창을 띄워 진짜 내 PC에 전속 AI 화가를 입주시키는 과정을 시작하겠습니다. 가장 대중적이고 플러그인 확장성이 뛰어난 ‘AUTOMATIC1111’ 버전을 기준으로 진행합니다.
1단계: Git과 Python 3.10.6 설치
먼저 깃허브에서 코드를 가져오기 위한 Git을 설치합니다. Git 공식 홈페이지에서 Windows 버전을 다운로드해 모두 ‘Next’를 눌러 설치합니다. 그 다음 파이썬을 설치해야 하는데, AUTOMATIC1111 공식 페이지에 명시된 대로 반드시 Python 3.10.6 버전을 설치해야 다른 라이브러리들과의 충돌이 없습니다.
💡 여기서 주의할 점: 파이썬 설치 파일을 실행했을 때 나타나는 첫 화면 맨 아래에 있는 Add Python 3.10 to PATH 체크박스를 무조건! 체크하셔야 합니다. 이걸 빼먹으면 나중에 컴퓨터가 파이썬 명령어를 전혀 인식하지 못해 처음부터 다시 지우고 깔아야 하는 대참사가 일어납니다.
2단계: Stable Diffusion WebUI 소스코드 가져오기 (Clone)
여유 공간이 충분한 설치 폴더(예: C드라이브 최상단)를 열고 마우스 우클릭 후 ‘Open Git Bash here’ 또는 일반 명령 프롬프트(CMD)를 엽니다. 그리고 아래의 명령어를 복사해 붙여넣기 한 뒤 엔터를 칩니다.
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
약 5~10초 정도면 해당 위치에 stable-diffusion-webui라는 폴더가 통째로 복제되어 생성됩니다.
3단계: 모델(Checkpoint) 다운로드 및 폴더에 넣기
WebUI 프로그램만으로는 그림을 그릴 수 없습니다. 화가의 뇌이자 ‘화풍’을 결정하는 모델 파일이 필요합니다. 전 세계 AI 그림 공유 1위 사이트인 ‘Civitai(시비타이)’에 접속하여 실사풍(Realistic)이든 애니풍(Anime)이든 마음에 드는 모델(확장자 .safetensors)을 다운로드합니다.
다운로드한 수 GB 크기의 파일을 방금 생성된 stable-diffusion-webui\models\Stable-diffusion 폴더 안에 그대로 복사해서 넣어줍니다.
4단계: 대망의 첫 실행 및 필수 라이브러리 자동 설치
다시 stable-diffusion-webui 폴더 최상단으로 돌아와서, webui-user.bat 이라는 윈도우 배치 파일을 더블클릭합니다. 검은색 명령 프롬프트 창이 뜨면서 알아서 수기가바이트(GB)에 달하는 필수 파이썬 딥러닝 라이브러리(PyTorch 등)를 다운로드하고 설치하기 시작합니다. 컴퓨터 사양과 인터넷 속도에 따라 10분에서 30분 정도 소요될 수 있습니다.
설치가 모두 끝나면 터미널 창 마지막에 Running on local URL: http://127.0.0.1:7860 이라는 문구가 나타납니다. 웹 브라우저를 열고 이 주소를 복사해 들어가면, 마침내 직관적인 스테이블 디퓨전 인터페이스가 화면에 펼쳐집니다!
5단계: 첫 번째 이미지 생성 테스트
상단 좌측의 ‘Stable Diffusion checkpoint’ 드롭다운 메뉴에서 아까 폴더에 넣은 모델을 선택합니다. Prompt(프롬프트) 입력창에 1girl, solo, masterpiece, best quality, wearing white shirt, standing in a sunny garden 이라고 입력한 뒤 우측의 주황색 ‘Generate’ 버튼을 누릅니다. 약 10~20초 뒤, 내 그래픽카드가 직접 연산해서 그려낸 세상에 단 하나뿐인 고퀄리티 이미지가 화면에 나타납니다.
3. 설치 중 마주친 시뻘건 에러 창과 해결 방법 2가지
유튜브 튜토리얼 영상만 보면 클릭 몇 번에 뚝딱 완성되는 것 같지만, 제 로컬 설치 과정은 결코 순탄치 않았습니다. 제가 이틀 밤을 새우며 직접 맞은 두 가지 치명적 에러와 그 탈출구를 공유합니다.
첫 번째 좌절: RuntimeError: CUDA out of memory (VRAM 부족 현상)
처음 세팅을 마치고 해상도를 가로세로 1024픽셀로 무리하게 높여서 ‘Generate’를 눌렀더니, 터미널 창에 붉은 글씨로 CUDA 메모리가 부족하다는 에러가 뜨며 프로그램이 완전히 뻗어버렸습니다. 제 12GB VRAM으로도 고해상도 연산 시에는 메모리가 넘쳤던 것이죠. 구글링을 거듭한 끝에, webui-user.bat 파일을 메모장으로 우클릭해 열고 set COMMANDLINE_ARGS= 뒷부분에 --xformers --medvram 이라는 마법의 명령어를 추가했습니다. xformers는 이미지 생성 속도와 메모리 효율을 극적으로 높여주는 옵션입니다. 이 한 줄을 추가하고 재실행하니 메모리 부족 에러가 거짓말처럼 사라지고 고해상도 그림도 척척 뽑아냈습니다.
두 번째 멘붕: ModuleNotFoundError: No module named ‘torch’
처음 webui-user.bat을 실행했을 때, 파이토치(torch) 모듈을 찾을 수 없다며 설치가 아예 진행되지 않는 현상을 겪었습니다. 원인은 아주 어이없게도, 제가 1단계에서 파이썬을 설치할 때 ‘Add to PATH’ 체크박스를 누르지 않아서 내장된 가상환경(venv)이 파이썬 시스템 경로를 꼬아버린 탓이었습니다. 파이썬을 제어판에서 완전히 삭제 후 체크박스를 켜고 재설치한 뒤, stable-diffusion-webui 폴더 안에 잘못 생성되었던 venv 폴더를 통째로 삭제하고 다시 bat 파일을 실행했습니다. 그제야 정상적으로 필수 딥러닝 라이브러리 다운로드가 쭉쭉 진행되었습니다.
4. 로컬 AI 도입 후 확인한 드라마틱한 비용 절감 수치
이 험난한 삽질 과정을 거쳐 내 PC에 스테이블 디퓨전을 안착시킨 지 벌써 두 달이 넘었습니다. 제 작업 환경과 통장 잔고에는 놀라운 수치 변화가 생겼습니다.
- 월 고정 비용 100% 증발: 매달 눈물을 머금고 결제하던 미드저니 스탠다드 플랜 30달러(약 4만 원)를 즉시 해지했습니다. 1년이면 약 48만 원의 비용을 아끼는 셈이며, 이제 수천 장을 뽑든 오직 PC 전기세만 나갈 뿐입니다.
- 이미지 생성 속도와 작업량의 폭발적 증가: 클라우드 서버의 트래픽 눈치를 보며 대기열을 기다릴 필요 없이, 내 그래픽카드만 혹사시키면 됩니다. 512×512 기본 해상도 기준 1장 생성에 단 6~8초밖에 걸리지 않으며, 밤새 ‘Generate forever’ 기능을 켜두고 자면 아침에 수백 장의 썸네일 시안이 폴더에 쌓여 있습니다.
- 디테일 통제력의 끝판왕: 단순히 프롬프트 무작위 뽑기가 아니라, ControlNet(컨트롤넷) 확장 기능을 활용해 인물의 정확한 포즈(뼈대)를 강제하고, inpaint 기능으로 손가락 묘사가 망가진 부분만 마스킹하여 부분적으로 다시 그리게 되면서, 원고에 딱 맞는 삽화를 건지는 타율이 기존 10% 미만에서 95% 이상으로 수직 상승했습니다.
5. 핵심 3줄 요약 및 이런 분들께 강력히 권합니다
내 방구석 로컬 AI 화가 입주 프로젝트를 간단히 요약하자면 다음과 같습니다.
- Python 3.10.6(PATH 체크 필수)과 Git을 설치한 후 소스코드를 복제(Clone)합니다.
- Civitai에서 화풍을 결정하는 모델을 다운받아 넣고,
webui-user.bat파일을 실행하면 로컬 서버가 구동됩니다. - 고해상도 생성 시 VRAM 에러가 난다면 bat 파일에
--xformers옵션을 넣어 메모리 효율을 극대화할 수 있습니다.
이 방법은 블로그나 유튜브 수익 창출을 위해 저작권 문제없는 일관된 이미지가 대량으로 필요한 크리에이터, 매월 나가는 미드저니 구독료가 아까운 1인 개발자 및 웹소설 작가분들께 제 경험을 걸고 강력하게 추천합니다. 단 한 번의 세팅 고생이 평생의 무제한 아트워크를 보장합니다. 반면, 본인의 컴퓨터가 내장 그래픽을 쓰는 가벼운 사무용 노트북이거나 검은색 터미널 창만 보면 알레르기가 올라오시는 비테크 성향이시라면, 무리해서 로컬 설치를 하기보다는 구글 코랩(Colab)을 이용하거나 그냥 속 편하게 유료 웹 서비스(Midjourney, DALL-E 3 등)를 유지하시는 것이 정신 건강에 훨씬 이로울 것입니다.