Update README.md
Browse files
README.md
CHANGED
|
@@ -1,3 +1,4 @@
|
|
|
|
|
| 1 |
---
|
| 2 |
license: apache-2.0
|
| 3 |
language:
|
|
@@ -11,25 +12,44 @@ tags:
|
|
| 11 |
- russian
|
| 12 |
- fine-tuned
|
| 13 |
- preview
|
|
|
|
| 14 |
base_model: Tongyi-MAI/Z-Image
|
|
|
|
|
|
|
|
|
|
| 15 |
---
|
| 16 |
|
| 17 |
-
<h1 align="center">🌞 Helio-Image-Preview<br><sub><sup>Русскоязычная модель генерации изображений — предварительная версия</sup></sub></h1>
|
| 18 |
|
| 19 |
<div align="center">
|
| 20 |
|
| 21 |
<img src="https://huggingface.co/HelioAI/Helio-Image-Preview/resolve/main/teaser.png" alt="Helio-Image-Preview Examples" width="800">
|
| 22 |
|
| 23 |
**Helio-Image-Preview** — первый публичный выпуск семейства Helio-Image.
|
| 24 |
-
|
|
|
|
| 25 |
|
| 26 |
</div>
|
| 27 |
|
| 28 |
---
|
| 29 |
|
| 30 |
-
##
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 31 |
|
| 32 |
-
**Helio-Image** — семейство моделей генерации изображений на базе архитектуры S3-DiT (
|
| 33 |
|
| 34 |
**Preview-версия** — это ранний доступ к модели, который показывает текущее направление разработки и уже сейчас демонстрирует впечатляющие результаты на широком спектре задач.
|
| 35 |
|
|
@@ -39,6 +59,7 @@ base_model: Tongyi-MAI/Z-Image
|
|
| 39 |
|
| 40 |
## ✨ Возможности Preview-версии
|
| 41 |
|
|
|
|
| 42 |
- **Русский текст в изображениях** — генерация надписей, вывесок, логотипов на кириллице
|
| 43 |
- **Широкий спектр стилей** — фотореализм, аниме, пиксельарт, киберпанк, фэнтези, Minecraft и многое другое
|
| 44 |
- **Эталонное разрешение** — 1024×1024 (1:1), оптимизировано под квадратный формат
|
|
@@ -47,8 +68,9 @@ base_model: Tongyi-MAI/Z-Image
|
|
| 47 |
|
| 48 |
### ⚡ Preview vs Полная версия
|
| 49 |
|
| 50 |
-
| | Helio-Image-Preview | Helio-Image (в разработке) |
|
| 51 |
|---|---|---|
|
|
|
|
| 52 |
| Датасет | ~110K изображений | 500–800K изображений |
|
| 53 |
| Эпохи обучения | 1 | Несколько |
|
| 54 |
| Покрытие стилей | Основные направления | Полное покрытие |
|
|
@@ -60,6 +82,10 @@ base_model: Tongyi-MAI/Z-Image
|
|
| 60 |
|
| 61 |
## 🚀 Быстрый старт
|
| 62 |
|
|
|
|
|
|
|
|
|
|
|
|
|
| 63 |
### Установка
|
| 64 |
|
| 65 |
```bash
|
|
@@ -73,9 +99,9 @@ pip install torch transformers accelerate safetensors
|
|
| 73 |
import torch
|
| 74 |
from diffusers import ZImagePipeline
|
| 75 |
|
| 76 |
-
# Загрузка модели
|
| 77 |
pipe = ZImagePipeline.from_pretrained(
|
| 78 |
-
"
|
| 79 |
torch_dtype=torch.bfloat16,
|
| 80 |
)
|
| 81 |
pipe.to("cuda")
|
|
@@ -122,7 +148,8 @@ Star Wars штурмовики маршируют с надписью ИМПЕР
|
|
| 122 |
|
| 123 |
| Параметр | Значение |
|
| 124 |
|---|---|
|
| 125 |
-
|
|
|
|
|
| 126 |
| Датасет | ~110K изображений 1024×1024 |
|
| 127 |
| GPU | 4× RTX PRO 6000 96GB |
|
| 128 |
| DeepSpeed | ZeRO-2 |
|
|
@@ -136,7 +163,7 @@ Star Wars штурмовики маршируют с надписью ИМПЕР
|
|
| 136 |
|
| 137 |
```
|
| 138 |
Helio-Image-Preview/
|
| 139 |
-
├── transformer/ # Файнтюнутый S3-DiT трансформер (~6B)
|
| 140 |
│ ├── config.json
|
| 141 |
│ └── diffusion_pytorch_model.safetensors
|
| 142 |
├── vae/ # VAE декодер
|
|
@@ -160,6 +187,6 @@ Apache 2.0. Базовая архитектура: [Z-Image](https://huggingface
|
|
| 160 |
|
| 161 |
<div align="center">
|
| 162 |
|
| 163 |
-
*Helio-Image-Preview — это только начало. Следите за обновлениями!* ☀️
|
| 164 |
|
| 165 |
</div>
|
|
|
|
| 1 |
+
|
| 2 |
---
|
| 3 |
license: apache-2.0
|
| 4 |
language:
|
|
|
|
| 12 |
- russian
|
| 13 |
- fine-tuned
|
| 14 |
- preview
|
| 15 |
+
- 6b
|
| 16 |
base_model: Tongyi-MAI/Z-Image
|
| 17 |
+
model-index:
|
| 18 |
+
- name: Helio-Image-Preview
|
| 19 |
+
results: []
|
| 20 |
---
|
| 21 |
|
| 22 |
+
<h1 align="center">🌞 Helio-Image-Preview — 6B<br><sub><sup>Русскоязычная модель генерации изображений на ~6 млрд параметров — предварительная версия</sup></sub></h1>
|
| 23 |
|
| 24 |
<div align="center">
|
| 25 |
|
| 26 |
<img src="https://huggingface.co/HelioAI/Helio-Image-Preview/resolve/main/teaser.png" alt="Helio-Image-Preview Examples" width="800">
|
| 27 |
|
| 28 |
**Helio-Image-Preview** — первый публичный выпуск семейства Helio-Image.
|
| 29 |
+
Модель содержит **~6 млрд (6B) параметров** и построена на архитектуре S3-DiT.
|
| 30 |
+
Это предварительная версия, демонстрирующая возможности архитектуры перед полноценным релизом.
|
| 31 |
|
| 32 |
</div>
|
| 33 |
|
| 34 |
---
|
| 35 |
|
| 36 |
+
## 📋 Краткие характеристики
|
| 37 |
+
|
| 38 |
+
| | |
|
| 39 |
+
|---|---|
|
| 40 |
+
| **Параметры** | **~6B (6 млрд)** |
|
| 41 |
+
| **Архитектура** | S3-DiT |
|
| 42 |
+
| **Базовая модель** | [Z-Image](https://huggingface.co/Tongyi-MAI/Z-Image) |
|
| 43 |
+
| **Языки** | 🇷🇺 Русский, 🇬🇧 Английский |
|
| 44 |
+
| **Эталонное разрешение** | 1024 × 1024 |
|
| 45 |
+
| **Точность** | bf16 |
|
| 46 |
+
| **Лицензия** | Apache 2.0 |
|
| 47 |
+
|
| 48 |
+
---
|
| 49 |
+
|
| 50 |
+
## 🔎 О проекте
|
| 51 |
|
| 52 |
+
**Helio-Image** — семейство моделей генерации изображений на базе архитектуры S3-DiT (**~6B параметров**), ориентированное на качественную работу с русским языком: генерация надписей на кириллице, понимание русскоязычных описаний сцен и стилей.
|
| 53 |
|
| 54 |
**Preview-версия** — это ранний доступ к модели, который показывает текущее направление разработки и уже сейчас демонстрирует впечатляющие результаты на широком спектре задач.
|
| 55 |
|
|
|
|
| 59 |
|
| 60 |
## ✨ Возможности Preview-версии
|
| 61 |
|
| 62 |
+
- **~6B параметров** — масштабная архитектура S3-DiT для высококачественной генерации
|
| 63 |
- **Русский текст в изображениях** — генерация надписей, вывесок, логотипов на кириллице
|
| 64 |
- **Широкий спектр стилей** — фотореализм, аниме, пиксельарт, киберпанк, фэнтези, Minecraft и многое другое
|
| 65 |
- **Эталонное разрешение** — 1024×1024 (1:1), оптимизировано под квадратный формат
|
|
|
|
| 68 |
|
| 69 |
### ⚡ Preview vs Полная версия
|
| 70 |
|
| 71 |
+
| | Helio-Image-Preview (6B) | Helio-Image (в разработке) |
|
| 72 |
|---|---|---|
|
| 73 |
+
| Параметры | **~6B** | **~6B** |
|
| 74 |
| Датасет | ~110K изображений | 500–800K изображений |
|
| 75 |
| Эпохи обучения | 1 | Несколько |
|
| 76 |
| Покрытие стилей | Основные направления | Полное покрытие |
|
|
|
|
| 82 |
|
| 83 |
## 🚀 Быстрый старт
|
| 84 |
|
| 85 |
+
### Требования к оборудованию
|
| 86 |
+
|
| 87 |
+
> Модель содержит **~6 млрд параметров**. В формате `bf16` она занимает около **~12 ГБ VRAM** только для весов трансформера (плюс VAE, текстовый энкодер и рабочая память). Рекомендуется GPU с ≥ 24 ГБ VRAM (RTX 3090 / 4090 / A5000 и выше).
|
| 88 |
+
|
| 89 |
### Установка
|
| 90 |
|
| 91 |
```bash
|
|
|
|
| 99 |
import torch
|
| 100 |
from diffusers import ZImagePipeline
|
| 101 |
|
| 102 |
+
# Загрузка модели (~6B параметров)
|
| 103 |
pipe = ZImagePipeline.from_pretrained(
|
| 104 |
+
"HelioAI/Helio-Image-Preview", # или локальный путь
|
| 105 |
torch_dtype=torch.bfloat16,
|
| 106 |
)
|
| 107 |
pipe.to("cuda")
|
|
|
|
| 148 |
|
| 149 |
| Параметр | Значение |
|
| 150 |
|---|---|
|
| 151 |
+
| **Архитектура** | **S3-DiT (~6B параметров)** |
|
| 152 |
+
| Базовая модель | [Z-Image](https://huggingface.co/Tongyi-MAI/Z-Image) |
|
| 153 |
| Датасет | ~110K изображений 1024×1024 |
|
| 154 |
| GPU | 4× RTX PRO 6000 96GB |
|
| 155 |
| DeepSpeed | ZeRO-2 |
|
|
|
|
| 163 |
|
| 164 |
```
|
| 165 |
Helio-Image-Preview/
|
| 166 |
+
├── transformer/ # Файнтюнутый S3-DiT трансформер (~6B параметров)
|
| 167 |
│ ├── config.json
|
| 168 |
│ └── diffusion_pytorch_model.safetensors
|
| 169 |
├── vae/ # VAE декодер
|
|
|
|
| 187 |
|
| 188 |
<div align="center">
|
| 189 |
|
| 190 |
+
*Helio-Image-Preview (6B) — это только начало. Следите за обновлениями!* ☀️
|
| 191 |
|
| 192 |
</div>
|