웹사이트 검색

PC에서 안정적인 확산을 실행하여 AI 이미지를 생성하는 방법


요약: Stable Diffusion을 PC에서 로컬로 실행하려면 GitHub에서 Stable Diffusion 및 HuggingFace.co에서 최신 체크포인트를 다운로드하고 설치합니다. 그런 다음 Miniconda를 사용하여 특수 Python 환경에서 Stable Diffusion을 실행합니다.

인공 지능(AI) 예술은 현재 대유행이지만 대부분의 AI 이미지 생성기는 클라우드에서 실행됩니다. Stable Diffusion은 다릅니다. 자신의 PC에서 실행하고 원하는 만큼 많은 이미지를 생성할 수 있습니다. Windows에서 Stable Diffusion을 설치하고 사용하는 방법은 다음과 같습니다.

안정적인 확산이란 무엇입니까?

Stable Diffusion은 텍스트에서 이미지를 생성하거나, 텍스트를 기반으로 이미지를 수정하거나, 저해상도 또는 디테일이 낮은 이미지의 세부 정보를 채울 수 있는 오픈 소스 기계 학습 모델입니다. 수십억 개의 이미지에 대해 훈련되었으며 DALL-E 2 및 MidJourney에서 얻을 수 있는 결과와 비슷한 결과를 생성할 수 있습니다. Stability AI에서 개발했으며 2022년 8월 22일에 처음 공개되었습니다.

Stable Diffusion은 (아직) 일부 AI 이미지 생성기처럼 깔끔한 사용자 인터페이스가 없지만 매우 허용적인 라이선스가 있으며 무엇보다도 자신의 PC(또는 Mac)에서 완전히 무료로 사용할 수 있습니다.

Stable Diffusion이 현재 명령줄 인터페이스(CLI)에서 실행된다는 사실에 겁먹지 마십시오. 시작하고 실행하는 것은 매우 간단합니다. 실행 파일을 두 번 클릭하고 상자에 입력할 수 있으면 몇 분 안에 실행할 수 있습니다.

PC에서 안정적인 확산을 실행하려면 무엇이 필요합니까?

Stable Diffusion은 휴대폰이나 대부분의 노트북에서 실행되지 않지만 2022년에는 일반 게임용 PC에서 실행될 것입니다. 요구 사항은 다음과 같습니다.

  • 최소한 6GB의 VRAM이 있는 GPU
    • 여기에는 대부분의 최신 NVIDIA GPU가 포함됩니다

    • Stable Diffusion은 Linux 및 macOS에서도 실행할 수 있습니다.

    하드웨어가 없는 경우 웹 기반 AI 이미지 생성기를 사용하는 것이 좋습니다. 웹에서 Stable Diffusion의 데모를 실행할 수도 있습니다.

    Windows에서 Stable Diffusion을 설치하고 실행하는 방법

    필요한 소프트웨어는 Git과 Miniconda3 두 가지입니다.

    힘내 설치

    Git은 개발자가 개발 중인 소프트웨어의 다양한 버전을 관리할 수 있는 도구입니다. 중앙 리포지토리에서 작업 중인 여러 버전의 소프트웨어를 동시에 유지 관리하고 다른 개발자가 프로젝트에 기여하도록 허용할 수 있습니다.

    개발자가 아닌 경우 Git은 이러한 프로젝트에 액세스하고 다운로드할 수 있는 편리한 방법을 제공하며 이 경우에는 Git을 사용합니다. Git 웹 사이트에서 Windows x64 설치 프로그램을 다운로드한 다음 실행하여 Git을 설치합니다.

    설치 프로그램이 실행되는 동안 선택하라는 메시지가 표시되는 몇 가지 옵션이 있습니다. 기본 설정으로 두십시오. 하나의 옵션 페이지인 PATH 환경 조정이 특히 중요합니다. 명령줄 및 타사 소프트웨어에서 Git으로 설정해야 합니다.

    미니콘다3 설치

    Stable Diffusion은 몇 가지 다른 Python 라이브러리를 사용합니다. Python에 대해 잘 모른다면 걱정하지 마십시오. 라이브러리는 컴퓨터가 이미지를 변환하거나 복잡한 수학을 수행하는 것과 같은 특정 기능을 수행하는 데 사용할 수 있는 소프트웨어 패키지일 뿐입니다.

    Miniconda3는 기본적으로 편의 도구입니다. 많은 수동 개입 없이 Stable Diffusion이 작동하는 데 필요한 모든 라이브러리를 다운로드, 설치 및 관리할 수 있습니다. Stable Diffusion을 실제로 사용하는 방법이기도 합니다.

    Miniconda3 다운로드 페이지로 이동하여 Miniconda3 Windows 64-bit를 클릭하여 최신 설치 프로그램을 다운로드하십시오.

    다운로드가 완료되면 실행 파일을 두 번 클릭하여 설치를 시작합니다. Miniconda3의 설치는 Git보다 페이지 클릭이 적지만 이 옵션을 주의해야 합니다.

    다음을 클릭하고 설치를 마치기 전에 모든 사용자를 선택했는지 확인하십시오.

    Git 및 Miniconda3를 설치한 후 컴퓨터를 다시 시작하라는 메시지가 표시됩니다. 우리는 그것이 필요하다고 생각하지 않았지만, 당신이 그렇게 해도 아프지 않을 것입니다.

    Stable Diffusion GitHub 리포지토리 및 최신 체크포인트 다운로드

    필수 소프트웨어를 설치했으므로 Stable Diffusion을 다운로드하여 설치할 준비가 되었습니다.

    최신 체크포인트를 먼저 다운로드하세요. 버전 1.4는 거의 5GB이므로 시간이 걸릴 수 있습니다. 체크포인트를 다운로드하려면 계정을 만들어야 하지만 이름과 이메일 주소만 있으면 됩니다. 다른 모든 것은 선택 사항입니다.

    sd-v1-4.ckpt를 클릭하여 다운로드를 시작합니다.

    그런 다음 GitHub에서 Stable Diffusion을 다운로드해야 합니다. 녹색 코드 버튼을 클릭한 다음 ZIP 다운로드를 클릭합니다. 또는 이 직접 다운로드 링크를 사용할 수 있습니다.

    이제 Stable Diffusion의 모든 파일을 압축 해제할 몇 개의 폴더를 준비해야 합니다. 시작 버튼을 클릭하고 시작 메뉴 검색 표시줄에 miniconda3를 입력한 다음 열기를 클릭하거나 Enter 키를 누릅니다.

    명령줄을 사용하여 stable-diffusion이라는 폴더를 만들 것입니다. 아래 코드 블록을 복사하여 Miniconda3 창에 붙여넣은 다음 Enter 키를 누릅니다.

    cd C:/
    mkdir stable-diffusion
    cd stable-diffusion

    모든 것이 잘 되었다면 다음과 같이 표시됩니다.

    Miniconda3 창을 열어 두십시오. 잠시 후에 다시 필요합니다.

    좋아하는 파일 보관 프로그램에서 GitHub에서 다운로드한 ZIP 파일 stable-diffusion-main.zip을 엽니다. 또는 ZIP 파일이 없는 경우 Windows에서 자체적으로 ZIP 파일을 열 수도 있습니다. ZIP 파일을 한 창에 열어 둔 다음 다른 파일 탐색기 창을 열고 방금 만든 C:\stable-diffusion 폴더로 이동합니다.

    ZIP 파일의 stable-diffusion-main 폴더를 stable-diffusion 폴더로 끌어다 놓습니다.

    Miniconda3로 돌아가서 다음 명령을 복사하여 창에 붙여넣습니다.

    cd C:\stable-diffusion\stable-diffusion-main
    conda env create -f environment.yaml
    conda activate ldm
    mkdir models\ldm\stable-diffusion-v1

    이 프로세스를 중단하지 마십시오. 일부 파일은 기가바이트보다 크기 때문에 다운로드하는 데 약간의 시간이 걸릴 수 있습니다. 실수로 프로세스를 중단한 경우 환경 폴더를 삭제하고 conda env create -f environment.yaml을 다시 실행해야 합니다. 이 경우 C:\Users\(사용자 계정)\.conda\envs로 이동하여 ldm 폴더를 삭제한 다음 이전 명령을 실행합니다.

    우리가 실행한 줄은 ldm이라는 새 환경을 만들고 Stable Diffusion이 작동하는 데 필요한 모든 Python 라이브러리를 다운로드 및 설치하고 ldm 환경을 활성화한 다음 디렉터리를 새 폴더로 변경했습니다. 설치의 마지막 단계에 있습니다. 파일 탐색기에서 C:\stable-diffusion\stable-diffusion-main\models\ldm\stable-diffusion-v1로 이동한 다음 체크포인트 파일(sd-v1-4.ckpt)을 복사하여 폴더에 붙여넣습니다.

    파일 전송이 완료될 때까지 기다렸다가 sd-v1-4.ckpt를 마우스 오른쪽 버튼으로 클릭한 다음 이름 바꾸기를 클릭합니다. 강조 표시된 상자에 model.ckpt를 입력한 다음 Enter 키를 눌러 파일 이름을 변경합니다.

    그게 다입니다. 끝났습니다. 이제 Stable Diffusion을 실제로 사용할 준비가 되었습니다.

    안정적인 확산을 사용하는 방법

    우리가 만든 ldm 환경은 필수이며 Stable Diffusion을 사용하려면 언제든지 활성화해야 합니다. Miniconda3 창에 conda activate ldm을 입력하고 “Enter”를 누르십시오. 왼쪽의 (ldm)은 ldm 환경이 활성 상태임을 나타냅니다.

    그런 다음 이미지를 생성하기 전에 디렉터리(따라서 명령cd)를 C:\stable-diffusion\stable-diffusion-main으로 변경해야 합니다. cd C:\stable-diffusion\stable-diffusion-main을 명령줄에 붙여넣습니다.

    안정적인 확산으로 이미지를 만드는 방법

    텍스트 프롬프트를 512×512 이미지로 변환할 수 있는 스크립트 txt2img.py를 호출할 것입니다. 다음은 예입니다. 모든 것이 올바르게 작동하는지 확인하려면 다음을 시도하십시오.

    python scripts/txt2img.py --prompt "a close-up portrait of a cat by pablo picasso, vivid, abstract art, colorful, vibrant" --plms --n_iter 5 --n_samples 1

    콘솔에서 그림을 생성할 때 진행률 표시기가 나타납니다.

    이 명령은 모두 C:\stable-diffusion\stable-diffusion-main\outputs\txt2img-samples\samples에 있는 5개의 고양이 이미지를 생성합니다.

    완벽하지는 않지만 프롬프트에서 지정한 것처럼 확실히 파블로 피카소의 스타일과 비슷합니다. 이미지는 비슷해 보이지만 반드시 동일하지는 않습니다.

    생성되는 이미지를 변경하고 싶을 때마다 --prompt 다음에 오는 큰따옴표 안에 포함된 텍스트를 변경하기만 하면 됩니다.

    python scripts/txt2img.py --prompt "YOUR, DESCRIPTIONS, GO, HERE" --plms --n_iter 5 --n_samples 1

    마법의 숲에서 마법사 모자를 쓰고 사실적으로 보이는 고퍼를 생성하고 싶다고 가정해 보겠습니다. 다음 명령을 시도해 볼 수 있습니다.

    python scripts/txt2img.py --prompt "a photograph of a gopher wearing a wizard hat in a forest, vivid, photorealistic, magical, fantasy, 8K UHD, photography" --plms --n_iter 5 --n_samples 1

    정말 쉽습니다. 원하는 것을 최대한 구체적으로 설명하면 됩니다. 사실적인 것을 원한다면 사실적인 이미지와 관련된 용어를 포함해야 합니다. 특정 아티스트의 스타일에서 영감을 받은 무언가를 원한다면 아티스트를 지정하세요.

    Stable Diffusion은 인물 사진과 동물에만 국한되지 않고 놀라운 풍경을 연출할 수도 있습니다.

    명령의 인수는 무엇을 의미합니까?

    안정적인 확산에는 결과를 사용자 지정하기 위해 제공할 수 있는 수많은 설정과 인수가 있습니다. 여기에 포함된 몇 가지는 기본적으로 안정적인 확산이 일반 게임용 컴퓨터에서 실행되도록 하는 데 필요합니다.

    • –plms — 이미지를 샘플링하는 방법을 지정합니다. 수학을 확인하고 싶다면 그것에 관한 논문이 있습니다.
    • –n_iter — 각 프롬프트에 대해 생성할 반복 횟수를 지정합니다. 5는 어떤 종류의 결과를 얻고 있는지 확인할 수 있는 적절한 숫자입니다.
    • –n_samples — 생성될 샘플 수를 지정합니다. 기본값은 3이지만 대부분의 컴퓨터에는 이를 지원하기에 충분한 VRAM이 없습니다. 변경할 특별한 이유가 없는 한 1을 유지하십시오.

    물론 Stable Diffusion에는 결과를 조정하기 위해 구현할 수 있는 다양한 인수가 있습니다. 사용할 수 있는 전체 인수 목록을 보려면 python scripts/txt2img.py --help를 실행하세요.

    훌륭한 결과를 얻으려면 수많은 시행착오를 겪어야 하지만 재미의 절반은 그 정도입니다. 원하는 결과를 반환하는 인수와 설명을 적어 두거나 저장하십시오. 모든 실험을 스스로 하고 싶지 않다면 Reddit(및 다른 곳)에서 사진과 사진을 생성한 프롬프트를 교환하는 데 전념하는 커뮤니티가 성장하고 있습니다.