| # Medical Transcriber GUI - Руководство пользователя | |
| ## 🎯 Обзор | |
| Medical Transcriber - это полнофункциональное Windows приложение для быстрого транскрибирования медицинских аудиодиктовок с автоматической коррекцией и созданием отчётов в формате DOCX. | |
| ### Основные возможности: | |
| ✅ **Транскрибирование аудио** - использует модель Whisper | |
| ✅ **Автоматическая коррекция** - улучшение текста через LLM (GPT-4, Claude, Gemini) | |
| ✅ **База медицинских терминов** - специальная обработка медицинской лексики | |
| ✅ **Автогенерация отчётов** - создание красивых DOCX документов | |
| ✅ **Сохранение истории** - все результаты сохраняются с временными метками | |
| ✅ **Удобный интерфейс** - простой и понятный GUI | |
| ## 🚀 Быстрый старт | |
| ### Вариант 1: Запуск готового .exe (Рекомендуется) | |
| 1. Скачайте `MedicalTranscriber.exe` из папки `dist/` | |
| 2. Двойной клик для запуска | |
| 3. Приложение готово к использованию! | |
| **Требования:** | |
| - Windows 10/11 | |
| - 4+ ГБ оперативной памяти | |
| - 2+ ГБ свободного места на диске | |
| ### Вариант 2: Запуск из Python | |
| ```bash | |
| # Перейти в папку проекта | |
| cd Trans_for_doctors | |
| # Установить зависимости | |
| pip install -r requirements.txt | |
| # Запустить GUI | |
| python run_gui.py | |
| ``` | |
| ## 📖 Использование приложения | |
| ### Шаг 1: Выбор аудиофайла | |
| 1. Откройте вкладку **"Транскрибирование"** | |
| 2. Нажмите кнопку **"Обзор..."** в секции "1. Выбор аудиофайла" | |
| 3. Выберите аудиофайл (поддерживаются: WAV, MP3, M4A) | |
| 4. Путь к файлу отобразится в поле ввода | |
| **Поддерживаемые форматы:** | |
| - `.wav` - рекомендуется (лучшее качество) | |
| - `.mp3` - обычно качество достаточно | |
| - `.m4a` - работает, но медленнее | |
| **Подсказка:** Чем выше качество аудио, тем лучше результат! | |
| ### Шаг 2: Заполнение данных пациента | |
| 1. В секции **"2. Данные пациента"** нажмите **"Заполнить данные пациента..."** | |
| 2. В открывшемся диалоге заполните: | |
| - **ФИО пациента** - обязательно (для отчёта) | |
| - **Дата рождения** - в формате ДД.MM.YYYY | |
| - **Область исследования** - например "МРТ головы" | |
| - **Номер исследования** - идентификатор | |
| - **Дата исследования** - автоматически установлена на сегодня | |
| - **ФИО врача** - подпись в отчёте | |
| 3. Нажмите **"OK"** - данные сохранены | |
| **Если включена опция "Автоматически создать отчёт":** | |
| - Все поля ФИО пациента и врача будут автоматически добавлены в DOCX отчёт | |
| - Дата исследования используется для датирования отчёта | |
| ### Шаг 3: Выбор опций обработки | |
| В секции **"3. Опции обработки"** доступны: | |
| - ✅ **Использовать LLM-коррекцию** - включить улучшение текста через AI (рекомендуется) | |
| - ✅ **Автоматически создать отчёт** - генерировать DOCX файл (рекомендуется) | |
| - ✅ **Сохранить оригинальную транскрипцию** - сохранять необработанный текст | |
| ### Шаг 4: Запуск обработки | |
| 1. Убедитесь, что выбран аудиофайл | |
| 2. Если нужен отчёт - заполните данные пациента | |
| 3. Нажмите большую зелёную кнопку **"▶ Начать транскрибирование"** | |
| 4. Дождитесь завершения (может занять несколько минут) | |
| 5. Результаты будут выведены в окне "5. Результаты" | |
| **Примерное время обработки:** | |
| - 30 сек аудио → 2-5 минут (зависит от мощности ПК и размера модели) | |
| - С LLM коррекцией → +1-3 минуты | |
| ### Шаг 5: Сохранённые результаты | |
| После успешной обработки результаты автоматически сохраняются в папках: | |
| ``` | |
| Trans_for_doctors/ | |
| ├── results/ | |
| │ ├── result_20260116_120530.json # Оригинальная транскрипция | |
| │ ├── result_20260116_120530_corrected.json # Скорректированная версия | |
| │ └── reports/ | |
| │ └── report_20260116_120530.docx # Финальный отчёт | |
| └── logs/ | |
| └── transcription_20260116_120530.log # Логи обработки | |
| ``` | |
| ## ⚙️ Вкладка "Настройки" | |
| ### Модель Whisper | |
| - **Путь к модели** - папка с загруженной моделью Whisper | |
| - По умолчанию: папка проекта | |
| - Скачайте модель если её нет (см. ниже) | |
| - **Устройство** - выбор железа для вычислений | |
| - `auto` - автоматически выбирает GPU если доступен, иначе CPU | |
| - `cuda` - использовать NVIDIA GPU (требуется CUDA Toolkit) | |
| - `cpu` - процессор (медленнее, но всегда работает) | |
| - **Тип данных** - точность вычислений | |
| - `float32` - стандарт (медленнее, точнее) | |
| - `float16` - половинная точность (быстрее, меньше памяти) | |
| - `bfloat16` - BF16 (рекомендуется для новых GPU) | |
| ### OpenRouter API (для LLM коррекции) | |
| - **API Ключ** - требуется для включения умной коррекции | |
| - Получите на https://openrouter.ai | |
| - Зарегистрируйтесь и создайте ключ | |
| - Вставьте в поле "API Ключ" | |
| - **Модель LLM** - выбор модели для коррекции | |
| - `gpt-4o` - лучшее качество коррекции, дороже | |
| - `claude-3-opus` - отличное качество, более дешево | |
| - `gemini-pro` - хорошее качество, быстро | |
| - `gpt-4-turbo` - баланс качества и скорости | |
| ### База медицинских терминов | |
| - **Путь к файлу терминов** - файл со специальной медицинской лексикой | |
| - По умолчанию: `medical_terms.txt` в папке проекта | |
| - Может быть отредактирован для добавления новых терминов | |
| ## 🔑 Получение API ключа для OpenRouter | |
| 1. Перейдите на https://openrouter.ai | |
| 2. Нажмите **"Sign Up"** (или **"Log In"** если уже есть аккаунт) | |
| 3. Заполните форму регистрации | |
| 4. Перейдите в **Settings → Keys** | |
| 5. Нажмите **"Create Key"** | |
| 6. Скопируйте ключ | |
| 7. Вставьте в GUI приложение → вкладка "Настройки" | |
| **Стоимость:** | |
| - За запросы платите по использованию (около 5-10 рублей за 1000 слов) | |
| - Первый месяц обычно есть бесплатный кредит ($5-10) | |
| ## 🐛 Решение проблем | |
| ### Проблема: "Модель не найдена" | |
| **Решение:** | |
| 1. Скачайте модель Whisper: | |
| ```bash | |
| huggingface-cli download openai/whisper-base-ru --local-dir ./whisper_model | |
| ``` | |
| 2. В вкладке "Настройки" укажите путь к папке `whisper_model` | |
| ### Проблема: "Чёрный экран при запуске" | |
| **Решение:** | |
| - Приложение может загружаться медленно (особенно при первом запуске) | |
| - Подождите 30-60 секунд | |
| - Проверьте наличие модели Whisper | |
| ### Проблема: "API Ключ неверный" | |
| **Решение:** | |
| 1. Проверьте ключ на https://openrouter.ai/settings/keys | |
| 2. Убедитесь, что скопировали полный ключ | |
| 3. Наличие кредитов на аккаунте (добавьте платёж если нужно) | |
| ### Проблема: "Недостаточно памяти" | |
| **Решение:** | |
| - Используйте `float16` вместо `float32` в настройках | |
| - Закройте другие приложения | |
| - Используйте GPU если есть (установите CUDA) | |
| ### Проблема: Приложение зависает | |
| **Решение:** | |
| - Обычно это означает, что Whisper загружает модель (может занять несколько минут) | |
| - Если зависание длится более 5 минут, перезагрузитесь | |
| - Проверьте логи в папке `logs/` | |
| ## 📄 Формат сохраняемых отчётов | |
| ### DOCX отчёт | |
| Отчёт содержит следующие секции: | |
| ``` | |
| ╔════════════════════════════════════════╗ | |
| ║ Магнитно-резонансная томография ║ | |
| ╚════════════════════════════════════════╝ | |
| Ф.И.О: Иванов Иван Иванович | |
| Дата рождения: 15.03.1985 | |
| Область исследования: МРТ головы | |
| № исследования: 12345 | |
| Дата исследования: 16.01.2026 | |
| Протокол обследования: | |
| ──────────────────── | |
| [Полная скорректированная транскрипция] | |
| Заключение: | |
| ────────── | |
| [Итоговое заключение] | |
| Рекомендовано: | |
| ────────────── | |
| [Рекомендации врача] | |
| ──────────────────────────────────────── | |
| Врач - рентгенолог Петров П.П. | |
| 16.01.2026 | |
| Внимание! Данное заключение не является диагнозом... | |
| ``` | |
| ### JSON результаты | |
| Сохраняются оригинальные и скорректированные версии в JSON: | |
| ```json | |
| { | |
| "timestamp": "2026-01-16T12:05:30", | |
| "audio_file": "path/to/audio.wav", | |
| "transcription": "оригинальный текст...", | |
| "corrections": [ | |
| { | |
| "type": "correction", | |
| "original": "неверное слово", | |
| "corrected": "верное слово" | |
| } | |
| ] | |
| } | |
| ``` | |
| ## 💡 Советы по использованию | |
| 1. **Чистое аудио** - лучше результат | |
| - Избегайте фонового шума | |
| - Говорите чётко и не слишком быстро | |
| - Используйте хороший микрофон | |
| 2. **Правильная область исследования** - более точные отчёты | |
| - Укажите конкретное исследование (МРТ, КТ, УЗ и т.д.) | |
| - Указание области помогает коррекции | |
| 3. **Используйте LLM коррекцию** - качество на 30-50% выше | |
| - Немного дороже, но результат лучше | |
| - Используйте более мощные модели для сложных текстов | |
| 4. **Сохраняйте историю** - легче найти предыдущие отчёты | |
| - Все результаты автоматически сохраняются | |
| - Используйте номера исследований для организации | |
| ## 📞 Техподдержка | |
| Если возникла проблема, проверьте: | |
| 1. **Папка логов** (`logs/`) | |
| - Откройте последний лог-файл | |
| - Ищите сообщения об ошибках | |
| 2. **Консоль Python** (если запускаете через `python run_gui.py`) | |
| - Там видны детальные ошибки | |
| 3. **Попытайтесь воспроизвести** | |
| - Попробуйте с другим аудиофайлом | |
| - Проверьте сетевое подключение (для API) | |
| --- | |
| **Версия:** 1.0 | |
| **Дата:** Январь 2026 | |
| **Язык:** Русский | |