Update README.md
Browse files
README.md
CHANGED
|
@@ -1,28 +1,28 @@
|
|
| 1 |
-
# CEM6 – Fine-tuned Stable Diffusion 1.5 (Q1 2023)
|
| 2 |
|
| 3 |
-
CEM6 to
|
| 4 |
|
| 5 |
## Dane treningowe
|
| 6 |
|
| 7 |
- **Źródło:** ok. **70 000 zdjęć** przefiltrowanych ręcznie do **7 000** przykładów wysokiej jakości.
|
| 8 |
-
- **Opis:** Obrazy zostały opisane automatycznie
|
| 9 |
-
- **Typ danych:** Głównie realistyczne fotografie modelek,
|
| 10 |
|
| 11 |
## Fine-tuning
|
| 12 |
|
| 13 |
- **Framework:** [EveryDream-Trainer](https://github.com/victorchall/EveryDream2trainer)
|
| 14 |
-
- **Hardware:** NVIDIA RTX 3090
|
| 15 |
-
- **Czas powstania:** Q1 2023
|
| 16 |
-
- **Cel:** Poprawa jakości generowanych portretów kobiecych – realistyczna skóra,
|
| 17 |
- **Rozdzielczości:** 768 oraz 1024 piksele szerokości
|
| 18 |
|
| 19 |
## Modele dostępne do pobrania
|
| 20 |
|
| 21 |
| Nazwa modelu | Opis |
|
| 22 |
|--------------|------|
|
| 23 |
-
| `CEM_768_Cl2_55_45_merge.ckpt` | **Merge** modelu CEM (768px width) z innym wysokiej jakości modelem z początku 2023. Zapewnia bardziej miękki,
|
| 24 |
-
| `CEM_ED_768_100epoch.ckpt` | Model CEM w pełnej wersji 768px, trenowany przez 100 epok. Realistyczne wyjścia, wyraźne tekstury skóry, dobre kolory. |
|
| 25 |
-
| `CEM6_ED_1024_100epoch.ckpt` | Wersja 1024px szerokości, trenowana przez 100 epok. Większa szczegółowość, lepsza ostrość,
|
| 26 |
|
| 27 |
## Przykłady – `CEM_768_Cl2_55_45_merge.ckpt`
|
| 28 |
|
|
@@ -31,16 +31,16 @@ CEM6 to niestandardowy model tekst-do-obrazka (txt2img) oparty na **Stable Diffu
|
|
| 31 |
|
| 32 |
## Jakość i zastosowania
|
| 33 |
|
| 34 |
-
Na moment powstania (Q1 2023), CEM6 oferował jedne z bardziej realistycznych wyników w swojej klasie. Model najlepiej sprawdza się w:
|
| 35 |
|
| 36 |
- generowaniu portretów modelek z realistyczną skórą,
|
| 37 |
- uchwyceniu proporcji twarzy,
|
| 38 |
- estetycznych ujęciach studyjnych.
|
| 39 |
|
| 40 |
-
|
| 41 |
|
| 42 |
## Licencja
|
| 43 |
|
| 44 |
-
|
| 45 |
|
| 46 |
---
|
|
|
|
| 1 |
+
# CEM6 – Fine-tuned Stable Diffusion 1.5 (Q4 2022/Q1 2023)
|
| 2 |
|
| 3 |
+
CEM6 to model txt2img oparty na **Stable Diffusion 1.5**, fine-tunowany lokalnie na karcie **RTX 3090** przy użyciu frameworka **EveryDream-Trainer**. Model został wytrenowany w **pierwszym kwartale 2023 roku**, co jest istotne, ponieważ jakość modeli należy oceniać przez pryzmat ówczesnych standardów.
|
| 4 |
|
| 5 |
## Dane treningowe
|
| 6 |
|
| 7 |
- **Źródło:** ok. **70 000 zdjęć** przefiltrowanych ręcznie do **7 000** przykładów wysokiej jakości.
|
| 8 |
+
- **Opis:** Obrazy zostały opisane automatycznie przez BLIP2/CLIP.
|
| 9 |
+
- **Typ danych:** Głównie realistyczne fotografie modelek, różnego rodzaju. Z uwagi na brak praw autorskich do tych zdjęć, wolałbym nie udostępniać datasetu.
|
| 10 |
|
| 11 |
## Fine-tuning
|
| 12 |
|
| 13 |
- **Framework:** [EveryDream-Trainer](https://github.com/victorchall/EveryDream2trainer)
|
| 14 |
+
- **Hardware:** NVIDIA RTX 3090, 32GB RAM
|
| 15 |
+
- **Czas powstania:** Q4 2022 / Q1 2023
|
| 16 |
+
- **Cel:** Poprawa jakości generowanych portretów kobiecych – głównie realistyczna skóra, mniej "pastelowy" wygląd i fotorealistyczny wygląd.
|
| 17 |
- **Rozdzielczości:** 768 oraz 1024 piksele szerokości
|
| 18 |
|
| 19 |
## Modele dostępne do pobrania
|
| 20 |
|
| 21 |
| Nazwa modelu | Opis |
|
| 22 |
|--------------|------|
|
| 23 |
+
| `CEM_768_Cl2_55_45_merge.ckpt` | **Merge** modelu CEM (768px width) z innym wysokiej jakości modelem z początku 2023. Zapewnia bardziej miękki, elastyczny styl. |
|
| 24 |
+
| `CEM_ED_768_100epoch.ckpt` | Model CEM w pełnej wersji 768px, trenowany przez 100 epok. Realistyczne wyjścia, wyraźne tekstury skóry, dobre kolory, jednak mało elastyczny. |
|
| 25 |
+
| `CEM6_ED_1024_100epoch.ckpt` | Wersja 1024px szerokości, trenowana przez 100 epok. Większa szczegółowość, lepsza ostrość, jeszcze mniej elastyczny. |
|
| 26 |
|
| 27 |
## Przykłady – `CEM_768_Cl2_55_45_merge.ckpt`
|
| 28 |
|
|
|
|
| 31 |
|
| 32 |
## Jakość i zastosowania
|
| 33 |
|
| 34 |
+
Na moment powstania (Q1 2023), CEM6 oferował jedne z bardziej realistycznych wyników w swojej klasie, a samych fotorealistycznych modeli nie było tak dużo jak dzisiaj i bazowe modele kończyły się na opensource Stable Diffusion i closedsource Midjourney. Model najlepiej sprawdza się w:
|
| 35 |
|
| 36 |
- generowaniu portretów modelek z realistyczną skórą,
|
| 37 |
- uchwyceniu proporcji twarzy,
|
| 38 |
- estetycznych ujęciach studyjnych.
|
| 39 |
|
| 40 |
+
Był on głównie trenowany na zdjęciach NSFW, ale dobrze sobie radzi także z ubraniami.
|
| 41 |
|
| 42 |
## Licencja
|
| 43 |
|
| 44 |
+
Licencja MIT
|
| 45 |
|
| 46 |
---
|