정보엔지니어 (맥스웰의 도깨비, 양자컴퓨터)

'2024/05'에 해당되는 글 2건

2024.05.15 집고양이 사진으로 학습시킨 Stable Diffusion Lora
2024.05.01 윈도우(windows)에서 실행하는 easy_diffusion & kohya_ss 2

집고양이 사진으로 학습시킨 Stable Diffusion Lora

이 학습 및 실험은 kohya_ss기반으로 https://infoengineer.tistory.com/134 의 설명을 그대로 따른다. 다만 아래와 같이 셋팅했다.

1. 집 고양이 사진을 100장 정도 준비했다. 600*400 정도로 리사이즈해둔다. 알씨같은 툴로 전체 선택후 일괄 조정이 가능하다.

2. kohya_ss를 시작한다. 설정은 기존 강좌와 동일하다. 물론 Utilities에서 BIP로 자막을 생성해둔다. 그리고 기존과 같은 방식으로 LORA로 학습하며 여기에서는 Civit의 Pet Photo(SD 1.5기반)를 base모델로 한다.

https://civitai.com/models/267871/pet-photography-album-of-animals-cats-and-dogs

아래는 셋팅의 내용들이다.

3. 학습을 시작한다. 10 epochs으로 설정해두었다. (사실 3회 정도만으로도 충분히 효과를 얻을 수 있었으나 어쩐지 많이 돌리면 더 비슷하게 나올것 같은 마음이 늘 든다)

4. Easy Diffusion을 통해 Lora를 구동한다. 단순한 합성과 다른 것은, 프롬프트를 통해 여러가지 효과를 줄 수 있다

fat cat, cat with clothes, white background 같은 옵션으로 여러가지 효과를 얻는다. 다만 발이 여러개인 점은 피할 수 없는 것인가 보다. 필자의 경우에는 냥이의 전체적인 모습은 얼른 봐서는 차이점이 없다고 느끼는 정도로 유사했다.

a cat on the table, 어릴적 사진이 같이 들어가서 그런지 다양한 나이대를 보여준다. 발이 어색하다.

5. 좀더 다양한 형태를 만들어보자.

LoRA는 재미있는 속성이 있어서 "a tiger looks like a cat" 같은 형태로 써먹을 수 있다. 토끼, 소녀, 소년, 개, 호랑이 등으로 요청해서 생성한 이미지를 추가로 공유한다. 특히나 원래 원천 모델이 아니라 SD 1.5같은 기본 모델이 같으면 어느정도의 효과를 거둘 수 있다.

a boy looks like a cat, white background (with magicmix/civit.ai)

a girl looks like a cat, white background (with magicmix/civit.ai)

a dog looks like a cat, white background

a rabbit looks like a cat, white background

a tiger looks like a cat, white background

Posted by 작동미학

윈도우(windows)에서 실행하는 easy_diffusion & kohya_ss

윈도우(windows)에서도 easy_diffusion과 kohya_ss를 어느 정도 실행해서 이미지 합성에 대한 작업을 진행할 수 있다.

Windows 10 pro + RTX 4080 (536.23 driver) 기준의 환경에서 실행해 보았다. 명령은 모두 command 상에서 실행한다

(윈도우키+R을 누른 후 cmd를 실행하면 명령 실행이 가능하다)

1. easy_diffusion

이 설치는 너무나 간단하다. 아래 링크에서 Windows용 Easy Diffusion 최신 버전을 받자

https://github.com/easydiffusion/easydiffusion/tree/main#installation

이 글을 쓰는 시점에서는 Easy Diffusion 3.0이 최신이다. 아래 Download for Windows 버튼을 누르고 실행해주면 된다. linux/mac/windows 동일한 방식으로 간단하게 실행해서 웹 인터페이스로 생성해볼 수 있다.

[easy_diffusion을 실행 설치하면 나오는 화면이다.내부에 conda와 git을 자체로 가지고 있다]

[설치가 끝나면 역시 자동으로 브라우저가 떠서 실행해볼 수 있게 된다.]

실제 사용 관련해서는 다른 글들을 참조하면 된다. models/stable-diffusion/ 에 사용하는 모델파일을 넣어 사용해보자(civit.ai에서 checkpoint 모델들을 크기가 크지만, 다양하게 다운로드 받을 수 있다. https://infoengineer.tistory.com/122 를 참조하자)

2. kohya_ss

모델을 학습하기 위한 kohya_ss에 대한 설치이다.

A. python 10와 git이 필요하다.

개인적으로는 Anaconda설치를 권한다. 따라서 Anaconda 사이트에서 윈도우용 Anaconda를 설치하고

아래와 같이 실행한다. git은 윈도우용 git을 다운로드받아( https://git-scm.com/download/win ) 기본옵션으로 설치하여 실행하면 된다. (만약에 python 3.10을 직접 설치해서 곧바로 진행한다고 하면 그렇게 해도 상관없다.)

D:\dev\conda> conda create -n kohya_ss python=3.10

D:\dev\conda> conda activate kohya_ss

B. git으로 kohya_ss를 checkout 하고 setup.bat를 실행한다.

D:\dev> git clone https://github.com/bmaltais/kohya_ss.git

D:\dev> cd kohya_ss

D:\dev\kohya_ss> setup.bat

이때 NVidia GPU 사용자는 2번을 눌러 cudnn을 최신으로 받아주자. 시간이 조금 걸린다(고속화에 도움이 된다고 한다)

그런 후 1번을 선택해 Kohya_ss를 GUI로 실행한다.

끝나면 7. Exit Setup을 선택해서 나오면 된다.

C. 아래와 같이 실행하면 내부에 웹서버가 뜨면서 우리가 활용할 수 있는 단계로 진입한다.

D:\dev\kohya_ss> gui.bat

위의 마지막 부분에 표시된 http://127.0.0.1:7860 주소를 브라우저로 열어보자. kohya_ss의 gui가 보인다. 해당 사용법 관련해서는 연관 글을 참조한다. ( https://infoengineer.tistory.com/134 )

'머신러닝AI' 카테고리의 다른 글

가장 쉬운 LLM 활용법. ollama와 langchain을 연결해서 사용해보자. (0)	2024.04.27
AI/LLM 등을 위한 linux 버전 이야기, GPU, NVidia driver, cuda, cudnn, ... 어떻게 맞출까? (0)	2024.04.27
ollama를 통해 linux ubuntu에서 간단히 llama3를 돌려보자. (1)	2024.04.20
Stable Diffusion - Kohya_ss를 통해 이미지로 학습(LoRA)을 시켜보자 (0)	2024.04.06
LLM이 바꿀 세상, 개인비서, API화될 웹사이트 (0)	2024.03.01

Posted by 작동미학

정보엔지니어 (맥스웰의 도깨비, 양자컴퓨터)

'2024/05'에 해당되는 글 2건

집고양이 사진으로 학습시킨 Stable Diffusion Lora

윈도우(windows)에서 실행하는 easy_diffusion & kohya_ss

1. easy_diffusion

2. kohya_ss

'머신러닝AI' 카테고리의 다른 글

카테고리

공지사항

태그목록

최근에 올라온 글

최근에 달린 댓글

글 보관함

달력

링크

티스토리툴바

« » 2024.5
일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31