| # Быстрый старт: STT + LLM-корректор с генерацией DOCX отчетов | |
| ## 🚀 Установка (2 минуты) | |
| ### 1. Установить UV (рекомендуется) | |
| ```bash | |
| # macOS / Linux | |
| curl -LsSf https://astral.sh/uv/install.sh | sh | |
| # Windows (PowerShell) | |
| powershell -ExecutionPolicy BypassUser -c "irm https://astral.sh/uv/install.ps1 | iex" | |
| # Или через pip | |
| pip install uv | |
| ``` | |
| ### 2. Установить зависимости проекта | |
| ```bash | |
| cd /home/robot/Documents/novaya_vetka/Trans_for_doctors | |
| # Установить основные зависимости (STT + Knowledge Base) | |
| uv sync | |
| # ИЛИ установить с LLM коррекцией (OpenAI) | |
| uv sync --extra llm | |
| ``` | |
| ### 3. Настроить API ключ OpenAI (если нужна LLM коррекция) | |
| ```bash | |
| cd corrector | |
| cp .env.example .env | |
| nano .env # или любой редактор | |
| ``` | |
| Добавьте ваш OpenAI API ключ: | |
| ``` | |
| OPENAI_API_KEY=sk-ваш-настоящий-ключ-здесь | |
| ``` | |
| ## 📝 Использование | |
| ### Быстрый тест (проверка что всё работает) | |
| ```bash | |
| # Проверить установку пакетов | |
| python -m quick_test | |
| ### Запуск полного пайплайна | |
| ```bash | |
| # Все в одном: STT → Knowledge Base → LLM Correction → Reports | |
| python -m run_pipeline_demo | |
| ``` | |
| ### Обработать один аудио файл | |
| ```python | |
| from pipeline import MedicalTranscriptionPipeline, PipelineConfig | |
| from pathlib import Path | |
| # Конфигурация | |
| config = PipelineConfig( | |
| model_path=Path("./"), | |
| device="auto", # или 'cuda', 'cpu' | |
| language="russian", | |
| correction_enabled=True, # LLM коррекция | |
| generate_report=True # Генерировать DOCX | |
| ) | |
| # Запуск пайплайна | |
| pipeline = MedicalTranscriptionPipeline(config) | |
| result = pipeline.process_audio_file(Path("audio.wav")) | |
| print(result) | |
| ``` | |
| ### Legacy: Автоматическая обработка результатов | |
| ```bash | |
| # Если уже есть результаты транскрибации (result_*.json) | |
| python -m corrector.auto_process | |
| # С параметрами пациента | |
| python -m corrector.auto_process \ | |
| --patient-name "Иванов Иван Иванович" \ | |
| --patient-dob "01.01.1980" \ | |
| --study-area "Поясничный отдел позвоночника" | |
| ``` | |
| ## 📂 Структура выходных файлов | |
| ``` | |
| results/ | |
| ├── result_20260115_120000.json # Оригинальная транскрипция | |
| ├── result_20260115_120000_corrected.json # Исправленная версия | |
| └── reports/ | |
| └── report_20260115_120000.docx # DOCX отчет | |
| ``` | |
| ## 🧪 Тестирование | |
| ```bash | |
| # Быстрая проверка проекта | |
| python -m quick_test | |
| # Запуск единичных тестов | |
| uv run pytest tests/test_knowledge_base.py -v | |
| uv run pytest tests/test_stt.py -v | |
| # Все тесты с покрытием | |
| uv run pytest tests/ --cov=. | |
| ``` | |
| ## 📚 Документация | |
| - **[ARCHITECTURE.md](ARCHITECTURE.md)** — архитектура системы | |
| - **[INSTALLATION_UV.md](INSTALLATION_UV.md)** — подробная инструкция по UV | |
| - **[SUMMARY.md](SUMMARY.md)** — полный обзор проекта | |
| - **[pipeline/README.md](pipeline/README.md)** — документация пайплайна | |
| - **[stt/README.md](stt/README.md)** — документация STT модуля | |
| - **[knowledge_base/README.md](knowledge_base/README.md)** — база знаний | |
| - **[corrector/README.md](corrector/README.md)** — LLM коррекция | |
| ## ⚙️ Конфигурация | |
| Все настройки управляются через: | |
| 1. **pyproject.toml** — основные зависимости | |
| 2. **corrector/.env** — API ключи и параметры LLM | |
| 3. **medical_terms.txt** — медицинские термины | |
| ## 💡 Рекомендации | |
| - Используйте `uv sync` для управления зависимостями | |
| - Добавьте новые медицинские термины в `medical_terms.txt` | |
| - Используйте `gpt-4o-mini` для экономии средств при большом объеме | |
| - Логируйте ошибки для отладки | |
| ## 🔗 Быстрые ссылки | |
| | Команда | Что делает | | |
| |---------|-----------| | |
| | `uv sync` | Установить зависимости | | |
| | `python -m quick_test` | Проверить установку | | |
| | `python -m run_pipeline_demo` | Запустить пайплайн | | |
| | `python -m corrector.auto_process` | Обработать результаты | | |
| | `uv run pytest tests/ -v` | Запустить тесты | | |
| --- | |
| **Проект готов к использованию! Начните с `python -m quick_test`** | |