Mantie commited on
Commit
fd27680
·
verified ·
1 Parent(s): d848b16

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +13 -13
README.md CHANGED
@@ -1,28 +1,28 @@
1
- # CEM6 – Fine-tuned Stable Diffusion 1.5 (Q1 2023)
2
 
3
- CEM6 to niestandardowy model tekst-do-obrazka (txt2img) oparty na **Stable Diffusion 1.5**, fine-tunowany lokalnie na karcie **RTX 3090** przy użyciu frameworka **EveryDream-Trainer**. Model został wytrenowany w **pierwszym kwartale 2023 roku**, co jest istotne, ponieważ dynamiczny rozwój txt2img sprawia, że jakość modeli należy oceniać przez pryzmat ówczesnych standardów.
4
 
5
  ## Dane treningowe
6
 
7
  - **Źródło:** ok. **70 000 zdjęć** przefiltrowanych ręcznie do **7 000** przykładów wysokiej jakości.
8
- - **Opis:** Obrazy zostały opisane automatycznie (captioning).
9
- - **Typ danych:** Głównie realistyczne fotografie modelek, o naturalnej kolorystyce skóry (brak pastelowości) i dużej spójności wizualnej.
10
 
11
  ## Fine-tuning
12
 
13
  - **Framework:** [EveryDream-Trainer](https://github.com/victorchall/EveryDream2trainer)
14
- - **Hardware:** NVIDIA RTX 3090
15
- - **Czas powstania:** Q1 2023
16
- - **Cel:** Poprawa jakości generowanych portretów kobiecych – realistyczna skóra, prawidłowe proporcje, fotorealistyczny wygląd.
17
  - **Rozdzielczości:** 768 oraz 1024 piksele szerokości
18
 
19
  ## Modele dostępne do pobrania
20
 
21
  | Nazwa modelu | Opis |
22
  |--------------|------|
23
- | `CEM_768_Cl2_55_45_merge.ckpt` | **Merge** modelu CEM (768px width) z innym wysokiej jakości modelem z początku 2023. Zapewnia bardziej miękki, estetyczny styl. |
24
- | `CEM_ED_768_100epoch.ckpt` | Model CEM w pełnej wersji 768px, trenowany przez 100 epok. Realistyczne wyjścia, wyraźne tekstury skóry, dobre kolory. |
25
- | `CEM6_ED_1024_100epoch.ckpt` | Wersja 1024px szerokości, trenowana przez 100 epok. Większa szczegółowość, lepsza ostrość, lepiej radzi sobie z detalami twarzy. |
26
 
27
  ## Przykłady – `CEM_768_Cl2_55_45_merge.ckpt`
28
 
@@ -31,16 +31,16 @@ CEM6 to niestandardowy model tekst-do-obrazka (txt2img) oparty na **Stable Diffu
31
 
32
  ## Jakość i zastosowania
33
 
34
- Na moment powstania (Q1 2023), CEM6 oferował jedne z bardziej realistycznych wyników w swojej klasie. Model najlepiej sprawdza się w:
35
 
36
  - generowaniu portretów modelek z realistyczną skórą,
37
  - uchwyceniu proporcji twarzy,
38
  - estetycznych ujęciach studyjnych.
39
 
40
- Nie był trenowany na NSFW, ale dobrze radzi sobie z anatomią i oświetleniem.
41
 
42
  ## Licencja
43
 
44
- Model udostępniany do użytku **niekomercyjnego**. Dalsza dystrybucja tylko z podaniem źródła i zachowaniem informacji o autorze.
45
 
46
  ---
 
1
+ # CEM6 – Fine-tuned Stable Diffusion 1.5 (Q4 2022/Q1 2023)
2
 
3
+ CEM6 to model txt2img oparty na **Stable Diffusion 1.5**, fine-tunowany lokalnie na karcie **RTX 3090** przy użyciu frameworka **EveryDream-Trainer**. Model został wytrenowany w **pierwszym kwartale 2023 roku**, co jest istotne, ponieważ jakość modeli należy oceniać przez pryzmat ówczesnych standardów.
4
 
5
  ## Dane treningowe
6
 
7
  - **Źródło:** ok. **70 000 zdjęć** przefiltrowanych ręcznie do **7 000** przykładów wysokiej jakości.
8
+ - **Opis:** Obrazy zostały opisane automatycznie przez BLIP2/CLIP.
9
+ - **Typ danych:** Głównie realistyczne fotografie modelek, różnego rodzaju. Z uwagi na brak praw autorskich do tych zdjęć, wolałbym nie udostępniać datasetu.
10
 
11
  ## Fine-tuning
12
 
13
  - **Framework:** [EveryDream-Trainer](https://github.com/victorchall/EveryDream2trainer)
14
+ - **Hardware:** NVIDIA RTX 3090, 32GB RAM
15
+ - **Czas powstania:** Q4 2022 / Q1 2023
16
+ - **Cel:** Poprawa jakości generowanych portretów kobiecych – głównie realistyczna skóra, mniej "pastelowy" wygląd i fotorealistyczny wygląd.
17
  - **Rozdzielczości:** 768 oraz 1024 piksele szerokości
18
 
19
  ## Modele dostępne do pobrania
20
 
21
  | Nazwa modelu | Opis |
22
  |--------------|------|
23
+ | `CEM_768_Cl2_55_45_merge.ckpt` | **Merge** modelu CEM (768px width) z innym wysokiej jakości modelem z początku 2023. Zapewnia bardziej miękki, elastyczny styl. |
24
+ | `CEM_ED_768_100epoch.ckpt` | Model CEM w pełnej wersji 768px, trenowany przez 100 epok. Realistyczne wyjścia, wyraźne tekstury skóry, dobre kolory, jednak mało elastyczny. |
25
+ | `CEM6_ED_1024_100epoch.ckpt` | Wersja 1024px szerokości, trenowana przez 100 epok. Większa szczegółowość, lepsza ostrość, jeszcze mniej elastyczny. |
26
 
27
  ## Przykłady – `CEM_768_Cl2_55_45_merge.ckpt`
28
 
 
31
 
32
  ## Jakość i zastosowania
33
 
34
+ Na moment powstania (Q1 2023), CEM6 oferował jedne z bardziej realistycznych wyników w swojej klasie, a samych fotorealistycznych modeli nie było tak dużo jak dzisiaj i bazowe modele kończyły się na opensource Stable Diffusion i closedsource Midjourney. Model najlepiej sprawdza się w:
35
 
36
  - generowaniu portretów modelek z realistyczną skórą,
37
  - uchwyceniu proporcji twarzy,
38
  - estetycznych ujęciach studyjnych.
39
 
40
+ Był on głównie trenowany na zdjęciach NSFW, ale dobrze sobie radzi także z ubraniami.
41
 
42
  ## Licencja
43
 
44
+ Licencja MIT
45
 
46
  ---