Gerchegg commited on
Commit
b75ec81
·
verified ·
1 Parent(s): 0664f9d

Upload README.md with huggingface_hub

Browse files
Files changed (1) hide show
  1. README.md +224 -12
README.md CHANGED
@@ -1,12 +1,224 @@
1
- ---
2
- title: Qwen Image Sampler Advanced
3
- emoji: 📉
4
- colorFrom: yellow
5
- colorTo: gray
6
- sdk: gradio
7
- sdk_version: 5.49.1
8
- app_file: app.py
9
- pinned: false
10
- ---
11
-
12
- Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ title: Qwen Soloband Advanced - Image2Image + LoRA
3
+ emoji: 🎨
4
+ colorFrom: blue
5
+ colorTo: purple
6
+ sdk: gradio
7
+ sdk_version: "5.9.1"
8
+ app_file: app.py
9
+ pinned: true
10
+ license: apache-2.0
11
+ suggested_hardware: a10g-large
12
+ suggested_storage: medium
13
+ models:
14
+ - Gerchegg/Qwen-Soloband-Diffusers
15
+ tags:
16
+ - image-generation
17
+ - image-to-image
18
+ - lora
19
+ - qwen
20
+ - diffusers
21
+ short_description: Text2Image and Image2Image with LoRA support
22
+ preload_from_hub:
23
+ - Gerchegg/Qwen-Soloband-Diffusers
24
+ ---
25
+
26
+ # 🎨 Qwen Soloband Advanced
27
+
28
+ **Комплексная система генерации изображений** на базе Qwen-Image DiT с полным набором инструментов для профессиональной работы.
29
+
30
+ ## 🚀 Основные возможности
31
+
32
+ ### 📝 Text-to-Image
33
+ Генерация изображений из текстовых описаний:
34
+ - 🎨 Кастомная fine-tuned модель Qwen-Soloband
35
+ - 📐 Разрешения от 512×512 до 2048×2048
36
+ - ⚙️ Полный контроль параметров (steps, CFG, seed)
37
+ - 🎯 Оптимизированные настройки для лучшего качества
38
+
39
+ ### 🔄 Image-to-Image
40
+ Модификация и трансформация существующих изображений:
41
+ - 🖼️ Загрузка любых изображений (PNG, JPG, WebP)
42
+ - 🎚️ **Denoising Strength** (0.0-1.0) - точный контроль степени изменения
43
+ - 🎨 Сохранение структуры при изменении стиля
44
+ - ✨ Улучшение качества, стилизация, художественная трансформация
45
+
46
+ ### 🎭 LoRA Styles
47
+ Динамическая загрузка стилей для разнообразия:
48
+ - 📸 **Realism** - фотореалистичные изображения
49
+ - 🎌 **Anime** - современный японский стиль аниме
50
+ - 📽️ **Analog Film** - эффект винтажной пленочной фотографии
51
+ - 🎚️ **LoRA Scale** (0.0-2.0) - интенсивность стиля
52
+ - 🔗 Работает во всех режимах (Text2Img, Img2Img, ControlNet)
53
+
54
+ ## 🔌 API Usage
55
+
56
+ ### Text-to-Image API
57
+
58
+ ```python
59
+ from gradio_client import Client
60
+
61
+ client = Client("Gerchegg/Qwen-ImageForFlo-Advanced")
62
+
63
+ result = client.predict(
64
+ prompt="SB_AI, a beautiful landscape",
65
+ negative_prompt="blurry, low quality",
66
+ width=1664,
67
+ height=928,
68
+ seed=42,
69
+ randomize_seed=False,
70
+ guidance_scale=2.5,
71
+ num_inference_steps=40,
72
+ lora_name="None", # или "Realism", "Anime", "Analog Film"
73
+ lora_scale=1.0,
74
+ api_name="/text2img"
75
+ )
76
+
77
+ image, seed = result
78
+ ```
79
+
80
+ ### Image-to-Image API
81
+
82
+ ```python
83
+ result = client.predict(
84
+ input_image="path/to/image.png", # PIL Image или path
85
+ prompt="Transform this into a painting",
86
+ negative_prompt="blurry, low quality",
87
+ strength=0.75, # 0.0-1.0, больше = сильнее изменение
88
+ seed=42,
89
+ randomize_seed=False,
90
+ guidance_scale=2.5,
91
+ num_inference_steps=40,
92
+ lora_name="Analog Film",
93
+ lora_scale=1.0,
94
+ api_name="/img2img"
95
+ )
96
+
97
+ image, seed = result
98
+ ```
99
+
100
+
101
+ ## 💡 Примеры использования
102
+
103
+ ### Text-to-Image
104
+ ```
105
+ Prompt: "SB_AI, a beautiful mountain landscape at sunset, detailed"
106
+ Size: 1664×928
107
+ Steps: 40, CFG: 2.5
108
+ LoRA: None
109
+ ```
110
+
111
+ ### Image-to-Image
112
+ ```
113
+ Input: фото человека
114
+ Prompt: "Transform into oil painting style"
115
+ Strength: 0.75 (сохранить структуру, изменить стиль)
116
+ LoRA: Analog Film
117
+ ```
118
+
119
+
120
+ ## 🎭 Доступные LoRA
121
+
122
+ ### 🌐 HuggingFace Hub LoRA (2 предустановленных):
123
+
124
+ | Name | Trigger Word | Description |
125
+ |------|--------------|-------------|
126
+ | **Realism** | "Super Realism portrait of" | Фотореалистичные изображения |
127
+ | **Anime** | "Japanese modern anime style, " | Современное аниме |
128
+
129
+ 💡 **Ленивая загрузка**: Hub LoRA скачиваются только при использовании, затем кэшируются.
130
+
131
+ ### 📁 Локальные LoRA (рекомендуемый способ):
132
+
133
+ **Положите ваши .safetensors файлы в `/workspace/loras/`** - они автоматически появятся в списке!
134
+
135
+ **Преимущества локальных LoRA**:
136
+ - ✅ Не скачиваются с интернета (быстрее)
137
+ - ✅ Приватные (только у вас)
138
+ - ✅ Полный контроль версий
139
+ - ✅ Можно использовать любые кастомные LoRA
140
+
141
+ **Пример**:
142
+ ```bash
143
+ /workspace/loras/
144
+ ├── my_custom_style.safetensors → появится как "my_custom_style"
145
+ ├── portrait_lora.safetensors → появится как "portrait_lora"
146
+ └── anime_v2.safetensors → появится как "anime_v2"
147
+ ```
148
+
149
+ **API использование**:
150
+ ```python
151
+ # Используйте имя файла (без расширения)
152
+ result = client.predict(
153
+ prompt="SB_AI, a portrait",
154
+ lora_name="my_custom_style", # Имя вашего локального файла
155
+ lora_scale=1.0,
156
+ api_name="/text2img"
157
+ )
158
+ ```
159
+
160
+ 💡 **Hub LoRA** автоматически добавляют trigger words. **Локальные LoRA** - без trigger words.
161
+
162
+ ## 📊 Параметры
163
+
164
+ ### Denoising Strength (Image2Image)
165
+ - **0.0-0.3**: Минимальные изменения, сохранение деталей
166
+ - **0.4-0.6**: Умеренные изменения, баланс
167
+ - **0.7-0.9**: Сильные изменения, новое изображение
168
+ - **1.0**: Полная перерисовка
169
+
170
+ ### LoRA Scale
171
+ - **0.0**: Без эффекта
172
+ - **0.5**: Слабый эффект стиля
173
+ - **1.0**: Нормальный эффект (рекомендуется)
174
+ - **1.5-2.0**: Сильный эффект стиля
175
+
176
+ ## 🔧 Технические детали
177
+
178
+ ### Модели:
179
+ - **Base**: Gerchegg/Qwen-Soloband-Diffusers
180
+ - **LoRAs**: Различные (загружаются динамически)
181
+
182
+ ### Оптимизации:
183
+ - VAE tiling для больших изображений
184
+ - VAE slicing для batch
185
+ - Автоматическое управление LoRA
186
+
187
+ ## 💰 Требования
188
+
189
+ - **GPU**: A40 (48GB) или A100 (80GB)
190
+ - **VRAM**: ~40GB для базовой модели
191
+ - **Storage**: ~45GB (модель)
192
+
193
+ ## 📚 Дополнительная информация
194
+
195
+ - **Base Model**: [Qwen-Soloband-Diffusers](https://huggingface.co/Gerchegg/Qwen-Soloband-Diffusers)
196
+ - **Qwen-Image**: [Qwen/Qwen-Image](https://huggingface.co/Qwen/Qwen-Image)
197
+ - **Diffusers Docs**: [Image-to-Image Guide](https://huggingface.co/docs/diffusers/using-diffusers/img2img)
198
+ - **LoRA Explorer**: [Qwen-Image-LoRA-Explorer](https://huggingface.co/spaces/multimodalart/Qwen-Image-LoRA-Explorer)
199
+
200
+ ## ⚠️ Важные замечания
201
+
202
+ ### Image2Image для Qwen
203
+ Этот Space использует специализированный `QwenImageImg2ImgPipeline` для корректной работы с Qwen-Image архитектурой. В отличие от обычных Stable Diffusion моделей, Qwen-Image требует:
204
+ - Специальное кодирование изображений через `AutoencoderKLQwenImage`
205
+ - Параметр `true_cfg_scale` вместо `guidance_scale`
206
+ - Специальную упаковку латентов (packing 2x2)
207
+
208
+ ### LoRA (Hub + Local)
209
+
210
+ - **Hub LoRA (2)**: Realism, Anime - скачиваются ПРИ ИСПОЛЬЗОВАНИИ, затем кэшируются
211
+ - **Local LoRA**: Любые .safetensors в `/workspace/loras/` - автоматически обнаруживаются
212
+ - Ленивая загрузка - не скачиваются и не занимают VRAM до использования
213
+ - Полная поддержка в API по имени
214
+
215
+ ## 📝 License
216
+
217
+ Apache 2.0
218
+
219
+ ## 🔧 Technical Notes
220
+
221
+ ✅ **Image2Image**: Использует правильный `QwenImageImg2ImgPipeline` для Qwen-Image архитектуры
222
+ ✅ **Performance**: ~0.91s на шаг денойзинга на A100 GPU
223
+ ✅ **Optimization**: VAE tiling и slicing включены для экономии памяти
224
+