File size: 1,680 Bytes
520b2d3
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
# manga_bubbles_detect

> [English version](README.md)

Модель YOLOv8 для детекции текстовых пузырей на страницах манги. Обнаруживает ограничивающие рамки пузырей (один класс `location-of-bubbles`).

**mAP50 на валидации ≈ 0.977**

Часть проекта [Manga Translate](https://github.com/PSImera/manga_translate) — полный пайплайн перевода манги (детекция пузырей → OCR → inpaint → LLM → отрисовка).

![preview](preview.png)

## Использование

```python
from ultralytics import YOLO

model = YOLO("bubbles_detect.pt")
results = model.predict("page.jpg", conf=0.25, iou=0.5, imgsz=1024)
```

Или автоматически через приложение [Manga Translate](https://github.com/PSImera/manga_translate) — модель скачивается отсюда при первом запуске.

## Данные для обучения

Обучена на комбинированном датасете, опубликованном в [PSImera/manga_bubbles_detect](https://huggingface.co/datasets/PSImera/manga_bubbles_detect):

- [manga.v4i (Roboflow)](https://universe.roboflow.com/manga-wtdm0/manga-mvbxx) — 1304/189/103 страниц train/valid/test
- 1079 дополнительных страниц из [DLS Manga Translator](https://github.com/ikefir34/DLS_Manga_Translator), откорректированных вручную в CVAT

Скрипты и отчёты обучения: [training/](https://github.com/PSImera/manga_translate/tree/main/training)