Medical Transcriber GUI - Руководство пользователя
🎯 Обзор
Medical Transcriber - это полнофункциональное Windows приложение для быстрого транскрибирования медицинских аудиодиктовок с автоматической коррекцией и созданием отчётов в формате DOCX.
Основные возможности:
✅ Транскрибирование аудио - использует модель Whisper ✅ Автоматическая коррекция - улучшение текста через LLM (GPT-4, Claude, Gemini) ✅ База медицинских терминов - специальная обработка медицинской лексики ✅ Автогенерация отчётов - создание красивых DOCX документов ✅ Сохранение истории - все результаты сохраняются с временными метками ✅ Удобный интерфейс - простой и понятный GUI
🚀 Быстрый старт
Вариант 1: Запуск готового .exe (Рекомендуется)
- Скачайте
MedicalTranscriber.exeиз папкиdist/ - Двойной клик для запуска
- Приложение готово к использованию!
Требования:
- Windows 10/11
- 4+ ГБ оперативной памяти
- 2+ ГБ свободного места на диске
Вариант 2: Запуск из Python
# Перейти в папку проекта
cd Trans_for_doctors
# Установить зависимости
pip install -r requirements.txt
# Запустить GUI
python run_gui.py
📖 Использование приложения
Шаг 1: Выбор аудиофайла
- Откройте вкладку "Транскрибирование"
- Нажмите кнопку "Обзор..." в секции "1. Выбор аудиофайла"
- Выберите аудиофайл (поддерживаются: WAV, MP3, M4A)
- Путь к файлу отобразится в поле ввода
Поддерживаемые форматы:
.wav- рекомендуется (лучшее качество).mp3- обычно качество достаточно.m4a- работает, но медленнее
Подсказка: Чем выше качество аудио, тем лучше результат!
Шаг 2: Заполнение данных пациента
В секции "2. Данные пациента" нажмите "Заполнить данные пациента..."
В открывшемся диалоге заполните:
- ФИО пациента - обязательно (для отчёта)
- Дата рождения - в формате ДД.MM.YYYY
- Область исследования - например "МРТ головы"
- Номер исследования - идентификатор
- Дата исследования - автоматически установлена на сегодня
- ФИО врача - подпись в отчёте
Нажмите "OK" - данные сохранены
Если включена опция "Автоматически создать отчёт":
- Все поля ФИО пациента и врача будут автоматически добавлены в DOCX отчёт
- Дата исследования используется для датирования отчёта
Шаг 3: Выбор опций обработки
В секции "3. Опции обработки" доступны:
- ✅ Использовать LLM-коррекцию - включить улучшение текста через AI (рекомендуется)
- ✅ Автоматически создать отчёт - генерировать DOCX файл (рекомендуется)
- ✅ Сохранить оригинальную транскрипцию - сохранять необработанный текст
Шаг 4: Запуск обработки
- Убедитесь, что выбран аудиофайл
- Если нужен отчёт - заполните данные пациента
- Нажмите большую зелёную кнопку "▶ Начать транскрибирование"
- Дождитесь завершения (может занять несколько минут)
- Результаты будут выведены в окне "5. Результаты"
Примерное время обработки:
- 30 сек аудио → 2-5 минут (зависит от мощности ПК и размера модели)
- С LLM коррекцией → +1-3 минуты
Шаг 5: Сохранённые результаты
После успешной обработки результаты автоматически сохраняются в папках:
Trans_for_doctors/
├── results/
│ ├── result_20260116_120530.json # Оригинальная транскрипция
│ ├── result_20260116_120530_corrected.json # Скорректированная версия
│ └── reports/
│ └── report_20260116_120530.docx # Финальный отчёт
└── logs/
└── transcription_20260116_120530.log # Логи обработки
⚙️ Вкладка "Настройки"
Модель Whisper
Путь к модели - папка с загруженной моделью Whisper
- По умолчанию: папка проекта
- Скачайте модель если её нет (см. ниже)
Устройство - выбор железа для вычислений
auto- автоматически выбирает GPU если доступен, иначе CPUcuda- использовать NVIDIA GPU (требуется CUDA Toolkit)cpu- процессор (медленнее, но всегда работает)
Тип данных - точность вычислений
float32- стандарт (медленнее, точнее)float16- половинная точность (быстрее, меньше памяти)bfloat16- BF16 (рекомендуется для новых GPU)
OpenRouter API (для LLM коррекции)
API Ключ - требуется для включения умной коррекции
- Получите на https://openrouter.ai
- Зарегистрируйтесь и создайте ключ
- Вставьте в поле "API Ключ"
Модель LLM - выбор модели для коррекции
gpt-4o- лучшее качество коррекции, дорожеclaude-3-opus- отличное качество, более дешевоgemini-pro- хорошее качество, быстроgpt-4-turbo- баланс качества и скорости
База медицинских терминов
- Путь к файлу терминов - файл со специальной медицинской лексикой
- По умолчанию:
medical_terms.txtв папке проекта - Может быть отредактирован для добавления новых терминов
- По умолчанию:
🔑 Получение API ключа для OpenRouter
- Перейдите на https://openrouter.ai
- Нажмите "Sign Up" (или "Log In" если уже есть аккаунт)
- Заполните форму регистрации
- Перейдите в Settings → Keys
- Нажмите "Create Key"
- Скопируйте ключ
- Вставьте в GUI приложение → вкладка "Настройки"
Стоимость:
- За запросы платите по использованию (около 5-10 рублей за 1000 слов)
- Первый месяц обычно есть бесплатный кредит ($5-10)
🐛 Решение проблем
Проблема: "Модель не найдена"
Решение:
- Скачайте модель Whisper:
huggingface-cli download openai/whisper-base-ru --local-dir ./whisper_model - В вкладке "Настройки" укажите путь к папке
whisper_model
Проблема: "Чёрный экран при запуске"
Решение:
- Приложение может загружаться медленно (особенно при первом запуске)
- Подождите 30-60 секунд
- Проверьте наличие модели Whisper
Проблема: "API Ключ неверный"
Решение:
- Проверьте ключ на https://openrouter.ai/settings/keys
- Убедитесь, что скопировали полный ключ
- Наличие кредитов на аккаунте (добавьте платёж если нужно)
Проблема: "Недостаточно памяти"
Решение:
- Используйте
float16вместоfloat32в настройках - Закройте другие приложения
- Используйте GPU если есть (установите CUDA)
Проблема: Приложение зависает
Решение:
- Обычно это означает, что Whisper загружает модель (может занять несколько минут)
- Если зависание длится более 5 минут, перезагрузитесь
- Проверьте логи в папке
logs/
📄 Формат сохраняемых отчётов
DOCX отчёт
Отчёт содержит следующие секции:
╔════════════════════════════════════════╗
║ Магнитно-резонансная томография ║
╚════════════════════════════════════════╝
Ф.И.О: Иванов Иван Иванович
Дата рождения: 15.03.1985
Область исследования: МРТ головы
№ исследования: 12345
Дата исследования: 16.01.2026
Протокол обследования:
────────────────────
[Полная скорректированная транскрипция]
Заключение:
──────────
[Итоговое заключение]
Рекомендовано:
──────────────
[Рекомендации врача]
────────────────────────────────────────
Врач - рентгенолог Петров П.П.
16.01.2026
Внимание! Данное заключение не является диагнозом...
JSON результаты
Сохраняются оригинальные и скорректированные версии в JSON:
{
"timestamp": "2026-01-16T12:05:30",
"audio_file": "path/to/audio.wav",
"transcription": "оригинальный текст...",
"corrections": [
{
"type": "correction",
"original": "неверное слово",
"corrected": "верное слово"
}
]
}
💡 Советы по использованию
Чистое аудио - лучше результат
- Избегайте фонового шума
- Говорите чётко и не слишком быстро
- Используйте хороший микрофон
Правильная область исследования - более точные отчёты
- Укажите конкретное исследование (МРТ, КТ, УЗ и т.д.)
- Указание области помогает коррекции
Используйте LLM коррекцию - качество на 30-50% выше
- Немного дороже, но результат лучше
- Используйте более мощные модели для сложных текстов
Сохраняйте историю - легче найти предыдущие отчёты
- Все результаты автоматически сохраняются
- Используйте номера исследований для организации
📞 Техподдержка
Если возникла проблема, проверьте:
Папка логов (
logs/)- Откройте последний лог-файл
- Ищите сообщения об ошибках
Консоль Python (если запускаете через
python run_gui.py)- Там видны детальные ошибки
Попытайтесь воспроизвести
- Попробуйте с другим аудиофайлом
- Проверьте сетевое подключение (для API)
Версия: 1.0 Дата: Январь 2026 Язык: Русский