Trans_for_doctors / USER_GUIDE.md

🎉 Полный рефакторинг проекта Medical Transcriber

e275025 27 days ago

13.8 kB

	# Medical Transcriber GUI - Руководство пользователя

	## 🎯 Обзор

	Medical Transcriber - это полнофункциональное Windows приложение для быстрого транскрибирования медицинских аудиодиктовок с автоматической коррекцией и созданием отчётов в формате DOCX.

	### Основные возможности:

	✅ Транскрибирование аудио - использует модель Whisper
	✅ Автоматическая коррекция - улучшение текста через LLM (GPT-4, Claude, Gemini)
	✅ База медицинских терминов - специальная обработка медицинской лексики
	✅ Автогенерация отчётов - создание красивых DOCX документов
	✅ Сохранение истории - все результаты сохраняются с временными метками
	✅ Удобный интерфейс - простой и понятный GUI

	## 🚀 Быстрый старт

	### Вариант 1: Запуск готового .exe (Рекомендуется)

	1. Скачайте `MedicalTranscriber.exe` из папки `dist/`
	2. Двойной клик для запуска
	3. Приложение готово к использованию!

	Требования:
	- Windows 10/11
	- 4+ ГБ оперативной памяти
	- 2+ ГБ свободного места на диске

	### Вариант 2: Запуск из Python

	```bash
	# Перейти в папку проекта
	cd Trans_for_doctors

	# Установить зависимости
	pip install -r requirements.txt

	# Запустить GUI
	python run_gui.py
	```

	## 📖 Использование приложения

	### Шаг 1: Выбор аудиофайла

	1. Откройте вкладку "Транскрибирование"
	2. Нажмите кнопку "Обзор..." в секции "1. Выбор аудиофайла"
	3. Выберите аудиофайл (поддерживаются: WAV, MP3, M4A)
	4. Путь к файлу отобразится в поле ввода

	Поддерживаемые форматы:
	- `.wav` - рекомендуется (лучшее качество)
	- `.mp3` - обычно качество достаточно
	- `.m4a` - работает, но медленнее

	Подсказка: Чем выше качество аудио, тем лучше результат!

	### Шаг 2: Заполнение данных пациента

	1. В секции "2. Данные пациента" нажмите "Заполнить данные пациента..."
	2. В открывшемся диалоге заполните:
	- ФИО пациента - обязательно (для отчёта)
	- Дата рождения - в формате ДД.MM.YYYY
	- Область исследования - например "МРТ головы"
	- Номер исследования - идентификатор
	- Дата исследования - автоматически установлена на сегодня
	- ФИО врача - подпись в отчёте

	3. Нажмите "OK" - данные сохранены

	Если включена опция "Автоматически создать отчёт":
	- Все поля ФИО пациента и врача будут автоматически добавлены в DOCX отчёт
	- Дата исследования используется для датирования отчёта

	### Шаг 3: Выбор опций обработки

	В секции "3. Опции обработки" доступны:

	- ✅ Использовать LLM-коррекцию - включить улучшение текста через AI (рекомендуется)
	- ✅ Автоматически создать отчёт - генерировать DOCX файл (рекомендуется)
	- ✅ Сохранить оригинальную транскрипцию - сохранять необработанный текст

	### Шаг 4: Запуск обработки

	1. Убедитесь, что выбран аудиофайл
	2. Если нужен отчёт - заполните данные пациента
	3. Нажмите большую зелёную кнопку "▶ Начать транскрибирование"
	4. Дождитесь завершения (может занять несколько минут)
	5. Результаты будут выведены в окне "5. Результаты"

	Примерное время обработки:
	- 30 сек аудио → 2-5 минут (зависит от мощности ПК и размера модели)
	- С LLM коррекцией → +1-3 минуты

	### Шаг 5: Сохранённые результаты

	После успешной обработки результаты автоматически сохраняются в папках:

	```
	Trans_for_doctors/
	├── results/
	│ ├── result_20260116_120530.json # Оригинальная транскрипция
	│ ├── result_20260116_120530_corrected.json # Скорректированная версия
	│ └── reports/
	│ └── report_20260116_120530.docx # Финальный отчёт
	└── logs/
	└── transcription_20260116_120530.log # Логи обработки
	```

	## ⚙️ Вкладка "Настройки"

	### Модель Whisper

	- Путь к модели - папка с загруженной моделью Whisper
	- По умолчанию: папка проекта
	- Скачайте модель если её нет (см. ниже)

	- Устройство - выбор железа для вычислений
	- `auto` - автоматически выбирает GPU если доступен, иначе CPU
	- `cuda` - использовать NVIDIA GPU (требуется CUDA Toolkit)
	- `cpu` - процессор (медленнее, но всегда работает)

	- Тип данных - точность вычислений
	- `float32` - стандарт (медленнее, точнее)
	- `float16` - половинная точность (быстрее, меньше памяти)
	- `bfloat16` - BF16 (рекомендуется для новых GPU)

	### OpenRouter API (для LLM коррекции)

	- API Ключ - требуется для включения умной коррекции
	- Получите на https://openrouter.ai
	- Зарегистрируйтесь и создайте ключ
	- Вставьте в поле "API Ключ"

	- Модель LLM - выбор модели для коррекции
	- `gpt-4o` - лучшее качество коррекции, дороже
	- `claude-3-opus` - отличное качество, более дешево
	- `gemini-pro` - хорошее качество, быстро
	- `gpt-4-turbo` - баланс качества и скорости

	### База медицинских терминов

	- Путь к файлу терминов - файл со специальной медицинской лексикой
	- По умолчанию: `medical_terms.txt` в папке проекта
	- Может быть отредактирован для добавления новых терминов

	## 🔑 Получение API ключа для OpenRouter

	1. Перейдите на https://openrouter.ai
	2. Нажмите "Sign Up" (или "Log In" если уже есть аккаунт)
	3. Заполните форму регистрации
	4. Перейдите в Settings → Keys
	5. Нажмите "Create Key"
	6. Скопируйте ключ
	7. Вставьте в GUI приложение → вкладка "Настройки"

	Стоимость:
	- За запросы платите по использованию (около 5-10 рублей за 1000 слов)
	- Первый месяц обычно есть бесплатный кредит ($5-10)

	## 🐛 Решение проблем

	### Проблема: "Модель не найдена"

	Решение:
	1. Скачайте модель Whisper:
	```bash
	huggingface-cli download openai/whisper-base-ru --local-dir ./whisper_model
	```
	2. В вкладке "Настройки" укажите путь к папке `whisper_model`

	### Проблема: "Чёрный экран при запуске"

	Решение:
	- Приложение может загружаться медленно (особенно при первом запуске)
	- Подождите 30-60 секунд
	- Проверьте наличие модели Whisper

	### Проблема: "API Ключ неверный"

	Решение:
	1. Проверьте ключ на https://openrouter.ai/settings/keys
	2. Убедитесь, что скопировали полный ключ
	3. Наличие кредитов на аккаунте (добавьте платёж если нужно)

	### Проблема: "Недостаточно памяти"

	Решение:
	- Используйте `float16` вместо `float32` в настройках
	- Закройте другие приложения
	- Используйте GPU если есть (установите CUDA)

	### Проблема: Приложение зависает

	Решение:
	- Обычно это означает, что Whisper загружает модель (может занять несколько минут)
	- Если зависание длится более 5 минут, перезагрузитесь
	- Проверьте логи в папке `logs/`

	## 📄 Формат сохраняемых отчётов

	### DOCX отчёт

	Отчёт содержит следующие секции:

	```
	╔════════════════════════════════════════╗
	║ Магнитно-резонансная томография ║
	╚════════════════════════════════════════╝

	Ф.И.О: Иванов Иван Иванович
	Дата рождения: 15.03.1985
	Область исследования: МРТ головы
	№ исследования: 12345
	Дата исследования: 16.01.2026

	Протокол обследования:
	────────────────────
	[Полная скорректированная транскрипция]

	Заключение:
	──────────
	[Итоговое заключение]

	Рекомендовано:
	──────────────
	[Рекомендации врача]

	────────────────────────────────────────
	Врач - рентгенолог Петров П.П.

	16.01.2026

	Внимание! Данное заключение не является диагнозом...
	```

	### JSON результаты

	Сохраняются оригинальные и скорректированные версии в JSON:

	```json
	{
	"timestamp": "2026-01-16T12:05:30",
	"audio_file": "path/to/audio.wav",
	"transcription": "оригинальный текст...",
	"corrections": [
	{
	"type": "correction",
	"original": "неверное слово",
	"corrected": "верное слово"
	}
	]
	}
	```

	## 💡 Советы по использованию

	1. Чистое аудио - лучше результат
	- Избегайте фонового шума
	- Говорите чётко и не слишком быстро
	- Используйте хороший микрофон

	2. Правильная область исследования - более точные отчёты
	- Укажите конкретное исследование (МРТ, КТ, УЗ и т.д.)
	- Указание области помогает коррекции

	3. Используйте LLM коррекцию - качество на 30-50% выше
	- Немного дороже, но результат лучше
	- Используйте более мощные модели для сложных текстов

	4. Сохраняйте историю - легче найти предыдущие отчёты
	- Все результаты автоматически сохраняются
	- Используйте номера исследований для организации

	## 📞 Техподдержка

	Если возникла проблема, проверьте:

	1. Папка логов (`logs/`)
	- Откройте последний лог-файл
	- Ищите сообщения об ошибках

	2. Консоль Python (если запускаете через `python run_gui.py`)
	- Там видны детальные ошибки

	3. Попытайтесь воспроизвести
	- Попробуйте с другим аудиофайлом
	- Проверьте сетевое подключение (для API)

	---

	Версия: 1.0
	Дата: Январь 2026
	Язык: Русский