Spaces:

AndrewChe123
/

andrew-speech-agent

Sleeping

App Files Files Community

andrew-speech-agent / README.md

andrewchernish1-ui

fix: use faster-whisper model and add accelerate

70c01d1 16 days ago

preview code

raw

history blame contribute delete

1.69 kB

metadata

title: Andrew Speech Agent
emoji: 🏋️
colorFrom: red
colorTo: gray
sdk: docker
pinned: false

Backend (FastAPI)

Setup

cd backend
python -m venv .venv
. .venv/Scripts/activate  # PowerShell
pip install -r requirements.txt
cp .env.example .env
uvicorn app.main:app --reload --port 8000

API

Endpoints:

POST /session - создаёт новую сессию и возвращает первый вопрос.
POST /answer - принимает base64 аудио, расшифровывает Whisper Small и продвигает граф.
GET /report/{sessionId} - отдаёт итоговый Markdown.

Docker/Spaces деплой: код работает как Docker Space (см. Dockerfile и space.yml). Docker-образ при билде скачивает модели и запускает uvicorn app.main:app --host 0.0.0.0 --port 7860.

Расшифровка и логика вопросов

STT: faster-whisper с моделью Systran/faster-whisper-small (CPU, int8). На Hugging Face Space модель скачивается в /models/whisper.
Генерация вопросов/отчёта: локальная модель Qwen/Qwen2.5-0.5B-Instruct через transformers. Если модель не загружена, агент использует заготовленные вопросы/отчёт из report.py.

Отправка email

Укажи SMTP параметры (SMTP_HOST, SMTP_USERNAME, SMTP_PASSWORD, DEFAULT_FROM_EMAIL, TRAINER_EMAIL). Если SMTP не задан, отчёт формируется, но письма не отправляются.