Upload 8 files

Browse files

Files changed (8) hide show

.gitattributes +2 -0
USAGE.md +144 -0
adapter_config.json +48 -0
adapter_model.safetensors +3 -0
image-test-1.jpg +3 -0
image-test-2.jpg +3 -0
logo.png +0 -0
model_info.json +53 -0

.gitattributes CHANGED Viewed

@@ -33,3 +33,5 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+image-test-1.jpg filter=lfs diff=lfs merge=lfs -text
+image-test-2.jpg filter=lfs diff=lfs merge=lfs -text

USAGE.md ADDED Viewed

	@@ -0,0 +1,144 @@

+# Helio-Ray-LoRA (v0.1 Experimental) — Руководство
+Этот документ описывает, как использовать экспериментальный LoRA-адаптер Helio-Ray поверх базовой модели Z-Image.
+## Установка зависимостей
+```bash
+pip install torch>=2.0.0
+pip install diffusers>=0.30.0
+pip install peft>=0.13.0
+pip install transformers>=4.45.0
+pip install accelerate safetensors
+```
+## Базовая генерация
+Скрипт автоматически скачает базовую модель (Z-Image-Turbo), если она не установлена, и применит к ней наш адаптер.
+```python
+import torch
+from diffusers import DiffusionPipeline
+from peft import PeftModel
+# 1. Загрузка базовой модели (Z-Image)
+# При первом запуске скачается ~10 ГБ
+pipe = DiffusionPipeline.from_pretrained(
+    "Tongyi-MAI/Z-Image-Turbo",
+    torch_dtype=torch.float16, # Используйте float16 для экономии памяти
+    trust_remote_code=True
+)
+pipe.to("cuda")
+# 2. Применение адаптера Helio-Ray
+# Загружается с Hugging Face (всего ~300 МБ)
+pipe.transformer = PeftModel.from_pretrained(
+    pipe.transformer,
+    "HelioAI/Helio-Ray-LoRA-v0.1", # Убедитесь, что имя репозитория совпадает
+    is_trainable=False
+)
+# 3. Функция установки силы влияния (Scale)
+def set_lora_scale(scale):
+    for module in pipe.transformer.modules():
+        if hasattr(module, "scaling"):
+            for key in module.scaling:
+                module.scaling[key] = scale
+# Рекомендуемое значение: 0.5 - 0.7
+set_lora_scale(0.5)
+# 4. Генерация (Строго 1024x1024)
+image = pipe(
+    prompt="Реалистичное фото, вывеска магазина с надписью 'ПРОДУКТЫ', вечер, 8k",
+    height=1024,
+    width=1024,
+    num_inference_steps=8, # Turbo-режим (быстро)
+    guidance_scale=0.0
+).images[0]
+image.save("output.png")
+```
+## Адаптивный scale (Умная настройка)
+Адаптер лучше всего работает с реализмом. Для пиксель-арта или стилизации рекомендуется снижать влияние адаптера.
+```python
+def get_optimal_scale(prompt):
+    """Автоматический выбор scale в зависимости от промпта"""
+    stylized_keywords = ['майнкрафт', 'пиксел', 'anime', 'мультфильм', '8-bit']
+    prompt_lower = prompt.lower()
+    for keyword in stylized_keywords:
+        if keyword in prompt_lower:
+            return 0.3 # Слабое влияние для стилизации
+    return 0.5 # Стандартное влияние для фотореализма и текста
+# Использование
+prompt = "Картинка в стиле майнкрафта"
+scale = get_optimal_scale(prompt)
+set_lora_scale(scale)
+```
+## Batch генерация (Пакетная)
+```python
+prompts = [
+    "Кружка с надписью 'КОФЕ' на столе",
+    "Вывеска 'АПТЕКА' на здании",
+    "Книга с заголовком 'ИСТОРИЯ' крупным планом"
+]
+for i, prompt in enumerate(prompts):
+    image = pipe(
+        prompt,
+        height=1024,
+        width=1024,
+        num_inference_steps=8,
+        guidance_scale=0.0
+    ).images[0]
+    image.save(f"output_{i}.png")
+```
+## Настройка качества
+Если результат кажется "мыльным", можно увеличить количество шагов, но это замедлит генерацию.
+```python
+# Больше шагов = выше детализация
+image = pipe(
+    prompt="...",
+    num_inference_steps=12,  # Стандарт: 8. Максимум: 15-20.
+    height=1024,
+    width=1024
+).images[0]
+```
+## Системные требования
+Хотя сам адаптер весит мало, для запуска всей цепочки (Base + Adapter) требуется GPU.
+- **VRAM:** Минимум 12-16 GB (для комфортной работы).
+- **RAM:** 16 GB+.
+- **Python:** 3.10+.
+## Troubleshooting (Решение проблем)
+### OOM (Ошибка нехватки памяти)
+Если видеокарта слабая (менее 12 ГБ VRAM), включите выгрузку слоев на процессор:
+```python
+pipe.enable_model_cpu_offload()
+```
+### Артефакты на изображении
+- Попробуйте уменьшить scale до **0.3-0.4**.
+- Увеличьте `num_inference_steps` до **10-12**.
+### Текст генерируется с ошибками
+- Убедитесь, что scale установлен на **0.5** или **0.6**.
+- Пишите желаемый текст в промпте **в одинарных кавычках** (например: `'МАГАЗИН'`).
+- Добавьте описание стиля текста (например: "крупный шрифт, четкие буквы").
+```

adapter_config.json ADDED Viewed

	@@ -0,0 +1,48 @@

+{
+  "alora_invocation_tokens": null,
+  "alpha_pattern": {},
+  "arrow_config": null,
+  "auto_mapping": {
+    "base_model_class": "ZImageTransformer2DModel",
+    "parent_library": "diffusers.models.transformers.transformer_z_image"
+  },
+  "base_model_name_or_path": null,
+  "bias": "none",
+  "corda_config": null,
+  "ensure_weight_tying": false,
+  "eva_config": null,
+  "exclude_modules": null,
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": "gaussian",
+  "layer_replication": null,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "loftq_config": {},
+  "lora_alpha": 128,
+  "lora_bias": false,
+  "lora_dropout": 0.05,
+  "megatron_config": null,
+  "megatron_core": "megatron.core",
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "peft_version": "0.18.1",
+  "qalora_group_size": 16,
+  "r": 64,
+  "rank_pattern": {},
+  "revision": null,
+  "target_modules": [
+    "to_k",
+    "w1",
+    "to_q",
+    "w2",
+    "to_v",
+    "w3"
+  ],
+  "target_parameters": null,
+  "task_type": null,
+  "trainable_token_indices": null,
+  "use_dora": false,
+  "use_qalora": false,
+  "use_rslora": false
+}

adapter_model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:34016d816fc16dff354fe8b6afd1d89c283db08f5f4c962cae19ea56a17a32e2
+size 284151840

image-test-1.jpg ADDED Viewed

Git LFS Details

SHA256: 1276d6d4e4688e31e3591aefbf4a3986276e26a440b842d5b5e4525aea3a0365
Pointer size: 131 Bytes
Size of remote file: 122 kB

image-test-2.jpg ADDED Viewed

Git LFS Details

SHA256: ca926080c4f6a285cf0f98bef6905de7db91acb08fc36cadaadf78ea59b45f5b
Pointer size: 131 Bytes
Size of remote file: 396 kB

logo.png ADDED Viewed

model_info.json ADDED Viewed

	@@ -0,0 +1,53 @@

+{
+  "name": "Helio1-Image-Ray-6B",
+  "version": "1.0",
+  "release_date": "2026-01-26",
+  "base_model": "Tongyi-MAI/Z-Image-Turbo",
+  "architecture": {
+    "method": "LoRA",
+    "rank": 64,
+    "alpha": 128,
+    "dropout": 0.05,
+    "target_modules": [
+      "to_q",
+      "to_k",
+      "to_v",
+      "w1",
+      "w2",
+      "w3"
+    ]
+  },
+  "training": {
+    "dataset_size": 2500,
+    "epochs": 1,
+    "steps": 164,
+    "batch_size": 1,
+    "gradient_accumulation": 16,
+    "learning_rate": 0.0001,
+    "resolution": 1024
+  },
+  "performance": {
+    "trainable_params": "142M",
+    "total_params": "6.3B",
+    "trainable_percentage": 2.26,
+    "file_size_mb": 284
+  },
+  "improvements": {
+    "detail": "+25%",
+    "realism": "+20%",
+    "textures": "+20%",
+    "russian_text": "+15%"
+  },
+  "recommended_settings": {
+    "realistic": {
+      "scale": 0.5,
+      "steps": 8
+    },
+    "stylized": {
+      "scale": 0.3,
+      "steps": 8
+    }
+  },
+  "organization": "Helio AI",
+  "license": "Apache-2.0"
+}