andrew-speech-agent / README.md
andrewchernish1-ui
fix: use faster-whisper model and add accelerate
70c01d1
metadata
title: Andrew Speech Agent
emoji: 🏋️
colorFrom: red
colorTo: gray
sdk: docker
pinned: false

Backend (FastAPI)

Setup

cd backend
python -m venv .venv
. .venv/Scripts/activate  # PowerShell
pip install -r requirements.txt
cp .env.example .env
uvicorn app.main:app --reload --port 8000

API

Endpoints:

  • POST /session - создаёт новую сессию и возвращает первый вопрос.
  • POST /answer - принимает base64 аудио, расшифровывает Whisper Small и продвигает граф.
  • GET /report/{sessionId} - отдаёт итоговый Markdown.

Docker/Spaces деплой: код работает как Docker Space (см. Dockerfile и space.yml). Docker-образ при билде скачивает модели и запускает uvicorn app.main:app --host 0.0.0.0 --port 7860.

Расшифровка и логика вопросов

  • STT: faster-whisper с моделью Systran/faster-whisper-small (CPU, int8). На Hugging Face Space модель скачивается в /models/whisper.
  • Генерация вопросов/отчёта: локальная модель Qwen/Qwen2.5-0.5B-Instruct через transformers. Если модель не загружена, агент использует заготовленные вопросы/отчёт из report.py.

Отправка email

Укажи SMTP параметры (SMTP_HOST, SMTP_USERNAME, SMTP_PASSWORD, DEFAULT_FROM_EMAIL, TRAINER_EMAIL). Если SMTP не задан, отчёт формируется, но письма не отправляются.