File size: 13,772 Bytes

e275025

# Medical Transcriber GUI - Руководство пользователя

## 🎯 Обзор

Medical Transcriber - это полнофункциональное Windows приложение для быстрого транскрибирования медицинских аудиодиктовок с автоматической коррекцией и созданием отчётов в формате DOCX.

### Основные возможности:

✅ **Транскрибирование аудио** - использует модель Whisper
✅ **Автоматическая коррекция** - улучшение текста через LLM (GPT-4, Claude, Gemini)
✅ **База медицинских терминов** - специальная обработка медицинской лексики
✅ **Автогенерация отчётов** - создание красивых DOCX документов
✅ **Сохранение истории** - все результаты сохраняются с временными метками
✅ **Удобный интерфейс** - простой и понятный GUI

## 🚀 Быстрый старт

### Вариант 1: Запуск готового .exe (Рекомендуется)

1. Скачайте `MedicalTranscriber.exe` из папки `dist/`
2. Двойной клик для запуска
3. Приложение готово к использованию!

**Требования:**
- Windows 10/11
- 4+ ГБ оперативной памяти
- 2+ ГБ свободного места на диске

### Вариант 2: Запуск из Python

```bash
# Перейти в папку проекта
cd Trans_for_doctors

# Установить зависимости
pip install -r requirements.txt

# Запустить GUI
python run_gui.py
```

## 📖 Использование приложения

### Шаг 1: Выбор аудиофайла

1. Откройте вкладку **"Транскрибирование"**
2. Нажмите кнопку **"Обзор..."** в секции "1. Выбор аудиофайла"
3. Выберите аудиофайл (поддерживаются: WAV, MP3, M4A)
4. Путь к файлу отобразится в поле ввода

**Поддерживаемые форматы:**
- `.wav` - рекомендуется (лучшее качество)
- `.mp3` - обычно качество достаточно
- `.m4a` - работает, но медленнее

**Подсказка:** Чем выше качество аудио, тем лучше результат!

### Шаг 2: Заполнение данных пациента

1. В секции **"2. Данные пациента"** нажмите **"Заполнить данные пациента..."**
2. В открывшемся диалоге заполните:
   - **ФИО пациента** - обязательно (для отчёта)
   - **Дата рождения** - в формате ДД.MM.YYYY
   - **Область исследования** - например "МРТ головы"
   - **Номер исследования** - идентификатор
   - **Дата исследования** - автоматически установлена на сегодня
   - **ФИО врача** - подпись в отчёте

3. Нажмите **"OK"** - данные сохранены

**Если включена опция "Автоматически создать отчёт":**
- Все поля ФИО пациента и врача будут автоматически добавлены в DOCX отчёт
- Дата исследования используется для датирования отчёта

### Шаг 3: Выбор опций обработки

В секции **"3. Опции обработки"** доступны:

- ✅ **Использовать LLM-коррекцию** - включить улучшение текста через AI (рекомендуется)
- ✅ **Автоматически создать отчёт** - генерировать DOCX файл (рекомендуется)
- ✅ **Сохранить оригинальную транскрипцию** - сохранять необработанный текст

### Шаг 4: Запуск обработки

1. Убедитесь, что выбран аудиофайл
2. Если нужен отчёт - заполните данные пациента
3. Нажмите большую зелёную кнопку **"▶ Начать транскрибирование"**
4. Дождитесь завершения (может занять несколько минут)
5. Результаты будут выведены в окне "5. Результаты"

**Примерное время обработки:**
- 30 сек аудио → 2-5 минут (зависит от мощности ПК и размера модели)
- С LLM коррекцией → +1-3 минуты

### Шаг 5: Сохранённые результаты

После успешной обработки результаты автоматически сохраняются в папках:

```
Trans_for_doctors/
├── results/
│   ├── result_20260116_120530.json          # Оригинальная транскрипция
│   ├── result_20260116_120530_corrected.json # Скорректированная версия
│   └── reports/
│       └── report_20260116_120530.docx      # Финальный отчёт
└── logs/
    └── transcription_20260116_120530.log    # Логи обработки
```

## ⚙️ Вкладка "Настройки"

### Модель Whisper

- **Путь к модели** - папка с загруженной моделью Whisper
  - По умолчанию: папка проекта
  - Скачайте модель если её нет (см. ниже)

- **Устройство** - выбор железа для вычислений
  - `auto` - автоматически выбирает GPU если доступен, иначе CPU
  - `cuda` - использовать NVIDIA GPU (требуется CUDA Toolkit)
  - `cpu` - процессор (медленнее, но всегда работает)

- **Тип данных** - точность вычислений
  - `float32` - стандарт (медленнее, точнее)
  - `float16` - половинная точность (быстрее, меньше памяти)
  - `bfloat16` - BF16 (рекомендуется для новых GPU)

### OpenRouter API (для LLM коррекции)

- **API Ключ** - требуется для включения умной коррекции
  - Получите на https://openrouter.ai
  - Зарегистрируйтесь и создайте ключ
  - Вставьте в поле "API Ключ"

- **Модель LLM** - выбор модели для коррекции
  - `gpt-4o` - лучшее качество коррекции, дороже
  - `claude-3-opus` - отличное качество, более дешево
  - `gemini-pro` - хорошее качество, быстро
  - `gpt-4-turbo` - баланс качества и скорости

### База медицинских терминов

- **Путь к файлу терминов** - файл со специальной медицинской лексикой
  - По умолчанию: `medical_terms.txt` в папке проекта
  - Может быть отредактирован для добавления новых терминов

## 🔑 Получение API ключа для OpenRouter

1. Перейдите на https://openrouter.ai
2. Нажмите **"Sign Up"** (или **"Log In"** если уже есть аккаунт)
3. Заполните форму регистрации
4. Перейдите в **Settings → Keys**
5. Нажмите **"Create Key"**
6. Скопируйте ключ
7. Вставьте в GUI приложение → вкладка "Настройки"

**Стоимость:**
- За запросы платите по использованию (около 5-10 рублей за 1000 слов)
- Первый месяц обычно есть бесплатный кредит ($5-10)

## 🐛 Решение проблем

### Проблема: "Модель не найдена"

**Решение:**
1. Скачайте модель Whisper:
   ```bash
   huggingface-cli download openai/whisper-base-ru --local-dir ./whisper_model
   ```
2. В вкладке "Настройки" укажите путь к папке `whisper_model`

### Проблема: "Чёрный экран при запуске"

**Решение:**
- Приложение может загружаться медленно (особенно при первом запуске)
- Подождите 30-60 секунд
- Проверьте наличие модели Whisper

### Проблема: "API Ключ неверный"

**Решение:**
1. Проверьте ключ на https://openrouter.ai/settings/keys
2. Убедитесь, что скопировали полный ключ
3. Наличие кредитов на аккаунте (добавьте платёж если нужно)

### Проблема: "Недостаточно памяти"

**Решение:**
- Используйте `float16` вместо `float32` в настройках
- Закройте другие приложения
- Используйте GPU если есть (установите CUDA)

### Проблема: Приложение зависает

**Решение:**
- Обычно это означает, что Whisper загружает модель (может занять несколько минут)
- Если зависание длится более 5 минут, перезагрузитесь
- Проверьте логи в папке `logs/`

## 📄 Формат сохраняемых отчётов

### DOCX отчёт

Отчёт содержит следующие секции:

```
╔════════════════════════════════════════╗
║ Магнитно-резонансная томография       ║
╚════════════════════════════════════════╝

Ф.И.О: Иванов Иван Иванович
Дата рождения: 15.03.1985
Область исследования: МРТ головы
№ исследования: 12345
Дата исследования: 16.01.2026

Протокол обследования:
────────────────────
[Полная скорректированная транскрипция]

Заключение:
──────────
[Итоговое заключение]

Рекомендовано:
──────────────
[Рекомендации врача]

────────────────────────────────────────
Врач - рентгенолог                    Петров П.П.

16.01.2026

Внимание! Данное заключение не является диагнозом...
```

### JSON результаты

Сохраняются оригинальные и скорректированные версии в JSON:

```json
{
  "timestamp": "2026-01-16T12:05:30",
  "audio_file": "path/to/audio.wav",
  "transcription": "оригинальный текст...",
  "corrections": [
    {
      "type": "correction",
      "original": "неверное слово",
      "corrected": "верное слово"
    }
  ]
}
```

## 💡 Советы по использованию

1. **Чистое аудио** - лучше результат
   - Избегайте фонового шума
   - Говорите чётко и не слишком быстро
   - Используйте хороший микрофон

2. **Правильная область исследования** - более точные отчёты
   - Укажите конкретное исследование (МРТ, КТ, УЗ и т.д.)
   - Указание области помогает коррекции

3. **Используйте LLM коррекцию** - качество на 30-50% выше
   - Немного дороже, но результат лучше
   - Используйте более мощные модели для сложных текстов

4. **Сохраняйте историю** - легче найти предыдущие отчёты
   - Все результаты автоматически сохраняются
   - Используйте номера исследований для организации

## 📞 Техподдержка

Если возникла проблема, проверьте:

1. **Папка логов** (`logs/`)
   - Откройте последний лог-файл
   - Ищите сообщения об ошибках

2. **Консоль Python** (если запускаете через `python run_gui.py`)
   - Там видны детальные ошибки

3. **Попытайтесь воспроизвести**
   - Попробуйте с другим аудиофайлом
   - Проверьте сетевое подключение (для API)

---

**Версия:** 1.0
**Дата:** Январь 2026
**Язык:** Русский