Spaces:

devrup404
/

SignalMod

Running

App Files Files Community

Ruperth commited on 3 days ago

Commit

ea0e222

1 Parent(s): 5465983

docs: rewrite readmes with logo description architecture and language toggle

Browse files

Files changed (2) hide show

README.es.md +237 -222
README.md +238 -205

README.es.md CHANGED Viewed

@@ -1,297 +1,312 @@
-# Detector de comentarios tóxicos en YouTube (youtube_hate_detector)
-[Python](https://www.python.org/downloads/)
-[FastAPI](https://fastapi.tiangolo.com/)
-[React](https://react.dev/)
-[Docker](https://docs.docker.com/compose/)
-**English:** [README.md](README.md)
-Soporte de moderación **Seguro vs Tóxico** para comentarios estilo YouTube. La pila es **FastAPI** (inferencia REST) más una SPA **React** que imita una página de reproducción: escribe o carga comentarios, consulta puntuaciones de toxicidad y cambia de modelo en Ajustes.
-**Producción por defecto:** **Hybrid Meta-Feature Stacking** — `models/production_final/meta_stack_final.joblib` (F1 en test **0,805**, brecha train–test **2,54 %**, por debajo de la regla del equipo **< 5 %** de sobreajuste).
----
-## Qué hace este proyecto
-| Aspecto                    | Detalle                                                                                           |
-| -------------------------- | ------------------------------------------------------------------------------------------------- |
-| **Tarea**                  | Clasificación binaria sobre `IsToxic` → **Seguro (0)** / **Tóxico (1)**                           |
-| **Datos**                  | `data/raw/youtoxic_english_1000.csv` (~1k comentarios en inglés; columnas multietiqueta para EDA) |
-| **Métrica principal**      | F1 ponderado (clase tóxica desbalanceada)                                                         |
-| **Control de sobreajuste** | |F1 train − F1 test| < 5 puntos porcentuales                                                      |
-| **Texto en la UI**         | **tóxico**                                                                                        |
-Los moderadores reciben una puntuación y etiqueta prácticas por comentario. La demo no sustituye la revisión humana; prioriza un rendimiento **útil** en un corpus pequeño y de dominio concreto.
 ---
-## Modelos: baseline → producción
-Tres opciones de inferencia están en `[configs/model_catalog.yaml](configs/model_catalog.yaml)` y en la UI. Las métricas siguientes corresponden al split de test estratificado del proyecto, salvo que se indique lo contrario.
-| Modelo                                 | Tipo                    | F1 test (ponderado) | Brecha train–test | Artefacto / pesos                                                              | Umbral en UI |
-| -------------------------------------- | ----------------------- | ------------------- | ----------------- | ------------------------------------------------------------------------------ | ------------ |
-| **LR + TF-IDF (Baseline)**             | sklearn + TF-IDF        | 0,758               | 4,76 pp           | `models/baseline/lr_tfidf.joblib`                                              | 0,50         |
-| **Frozen Toxic-BERT (Baseline)**       | Transformer (congelado) | 0,790               | 0,16 pp           | Hugging Face `[unitary/toxic-bert](https://huggingface.co/unitary/toxic-bert)` | 0,12         |
-| **Meta-Feature Stacking (Production)** | Stack híbrido           | **0,805**           | **2,54 pp**       | `models/production_final/meta_stack_final.joblib`                              | **0,381**    |
-Números canónicos de baselines: `[models/baseline/manifest.json](models/baseline/manifest.json)`. Ejecución de producción: `[reports/notebook_14/final_result.json](reports/notebook_14/final_result.json)`. Guion de presentación: `[reports/HANDOVER_REPORT.md](reports/HANDOVER_REPORT.md)`.
-### Aportación del equipo — Hybrid Meta-Feature Stacking
-Producción combina señales que sklearn no captura solo, sin afinar un transformer grande sobre ~1k filas:
-```text
-Texto del comentario
-    ├─► Frozen Toxic-BERT → embedding [CLS] (768-d)
-    └─► Metadatos (longitud, ratio mayúsculas, densidad de emojis, …)
-              └─► concat → StandardScaler → LogisticRegression (C=0,001)
-                        └─► P(tóxico) → umbral 0,381
 ```
-- **BERT congelado** aporta señal semántica; los pesos no se entrenan (mismo checkpoint Hub que el baseline congelado).
-- **Metadatos** conservan estructura interpretable (puntuación, longitud, etc.).
-- **Regularización fuerte** y búsqueda de umbral en test mantienen la brecha por debajo del 5 % y cumplen el objetivo **F1 ≥ 0,80**.
-Implementación: [Notebook 14](notebooks/14_final_meta_stacking.ipynb) · `uv run python -m src.experiments.notebook_14_final_stack`
-### Hilo de notebooks
-| Notebooks           | Rol                                                                    |
-| ------------------- | ---------------------------------------------------------------------- |
-| `01`–`04`           | EDA, preprocesado, TF-IDF → baseline LR                                |
-| `12`                | Estrategia golden baseline (métricas Toxic-BERT congelado)             |
-| `14`                | Meta-stacking final → artefacto de producción                          |
-| `archive_attempts/` | Experimentos anteriores (05–11, 13); conservados para reproducibilidad |
 ---
-## Requisitos previos
-- **Python 3.12** (ver `.python-version`)
-- **[uv](https://docs.astral.sh/uv/)** para instalación y comandos
-- **Node.js 18+** para desarrollo local del frontend
-- **Opcional:** `YOUTUBE_API_KEY` para comentarios en vivo y miniaturas de vídeos sugeridos ([Google Cloud Console](https://console.cloud.google.com/apis/credentials))
-Los baselines con transformer y producción necesitan dependencias de Hugging Face:
-```bash
-uv sync --extra hf
-uv run python -c "import transformers; print('ok')"
-```
----
-## Instalación
 ```bash
-git clone <url-de-tu-repo>
-cd youtube_hate_detector
 cp .env.example .env
-# Edita .env: YOUTUBE_API_KEY, MODEL_NAME (opcional)
-uv sync --extra hf
 ```
-Coloca `youtoxic_english_1000.csv` en `data/raw/` si vas a reentrenar (el archivo está en `.gitignore`).
----
-## Ejecución local (desarrollo)
-### 1. API
 ```bash
-uv run uvicorn src.api.main:app --reload --port 8000
 ```
-| Recurso | URL                                                          |
-| ------- | ------------------------------------------------------------ |
-| Swagger | [http://localhost:8000/docs](http://localhost:8000/docs)     |
-| Health  | [http://localhost:8000/health](http://localhost:8000/health) |
-| OpenAPI | [http://localhost:8000/redoc](http://localhost:8000/redoc)   |
-Al arrancar, `ModelService` carga el modelo de `MODEL_NAME` (por defecto: **Meta-Feature Stacking (Production)**). La primera carga de un transformer puede descargar pesos de Hugging Face (~1 minuto sin caché).
-### 2. UI React
 ```bash
-cd frontend
-npm install
-npm run dev
 ```
-Abre [http://localhost:5173](http://localhost:5173) — Vite hace proxy de las rutas API (`/predict`, `/models/status`, etc.) al puerto 8000.
-**Página Watch:** vídeos sugeridos, puntuación de comentarios, análisis en vivo del borrador.
-**Ajustes:** cambio entre los tres modelos del catálogo; slider de umbral (se actualiza al cambiar de modelo).
-**Moderator Hub:** historial de comentarios puntuados en la sesión.
-Banner de producción (desde `/model-info`): p. ej. *Meta-Feature Stacking Model (F1: 0.805, Gap: 2.54%)*.
----
-## Docker (API + UI compilada)
 ```bash
-export YOUTUBE_API_KEY=tu_clave   # opcional pero recomendado para comentarios reales
-docker compose up --build
 ```
-| URL                                                      | Servicio                                       |
-| -------------------------------------------------------- | ---------------------------------------------- |
-| [http://localhost:8000](http://localhost:8000)           | FastAPI + `frontend/dist` (un solo contenedor) |
-| [http://localhost:8000/docs](http://localhost:8000/docs) | Swagger                                        |
-La imagen copia `models/baseline/` y `models/production_final/`. `INSTALL_HF=1` es el valor por defecto en `docker-compose.yml` para producción y el baseline BERT congelado. Para una imagen solo sklearn (baseline LR):
-```bash
-INSTALL_HF=0 docker compose build --build-arg INSTALL_HF=0
 ```
----
-## Resumen de la API
-Referencia completa: [docs/API.es.md](docs/API.es.md) · [docs/API.md](docs/API.md)
-| Método | Ruta                | Descripción                                                           |
-| ------ | ------------------- | --------------------------------------------------------------------- |
-| `POST` | `/predict`          | Puntúa un comentario `{ "text", "threshold" }`                        |
-| `POST` | `/predict-batch`    | Hasta 100 textos                                                      |
-| `POST` | `/predict-video`    | Obtiene comentarios de YouTube y los puntúa (API key o fallback demo) |
-| `GET`  | `/videos/suggested` | Metadatos del carril derecho (`configs/suggested_videos.yaml`)        |
-| `GET`  | `/models/status`    | Catálogo + disponibilidad (joblib / deps HF)                          |
-| `POST` | `/models/select`    | Cambia de modelo `{ "model_name": "..." }`                            |
-| `GET`  | `/model-info`       | Metadatos del modelo activo (banner, umbral recomendado)              |
-**Ejemplo**
 ```bash
-curl -s -X POST http://localhost:8000/predict \
-  -H "Content-Type: application/json" \
-  -d '{"text": "Thanks for the great tutorial!", "threshold": 0.381}'
-```
-Cambiar al baseline LR:
-```bash
-curl -s -X POST http://localhost:8000/models/select \
-  -H "Content-Type: application/json" \
-  -d '{"model_name": "LR + TF-IDF (Baseline)"}'
 ```
 ---
-## Estructura del proyecto
-```
-youtube_hate_detector/
-├── configs/
-│   ├── model_catalog.yaml      # Modelos de demo (baselines + producción)
-│   ├── pipeline.yaml           # Rutas de entrenamiento
-│   ├── features.yaml
-│   └── suggested_videos.yaml
-├── data/
-│   ├── raw/                    # CSV fuente (git-ignored)
-│   └── processed/              # Exportaciones preprocesadas
-├── frontend/                   # React + Vite
-├── models/
-│   ├── baseline/               # lr_tfidf.joblib, manifest.json
-│   ├── production_final/       # meta_stack_final.joblib
-│   └── README.md
-├── notebooks/
-│   ├── 01–03, 12, 14           # Hilo principal
-│   └── archive_attempts/       # 04–11, 13
-├── reports/
-│   ├── HANDOVER_REPORT.md
-│   ├── notebook_14/
-│   ├── golden_baseline/
-│   └── v2/                     # Figuras EDA del equipo
-├── src/
-│   ├── api/                    # Rutas FastAPI
-│   ├── service/                # ModelService, predictor meta-stack
-│   ├── pipeline/               # Pipelines de entrenamiento
-│   ├── features/
-│   └── evaluation/
-├── tests/
-├── Dockerfile
-├── docker-compose.yml
-├── pyproject.toml
-└── uv.lock
-```
 ---
-## Entrenamiento y reproducción de métricas
-| Objetivo                         | Comando                                                      |
-| -------------------------------- | ------------------------------------------------------------ |
-| Baseline LR + TF-IDF             | `uv run python -m src.pipeline.run_pipeline --model lr`      |
-| Informes baseline BERT congelado | `uv run python -m src.pipeline.run_golden_baseline_pipeline` |
-| Meta-stack de producción         | `uv run python -m src.experiments.notebook_14_final_stack`   |
-Detalle del pipeline: [docs/PIPELINE.es.md](docs/PIPELINE.es.md) · Resultados agregados: [docs/RESULTS.es.md](docs/RESULTS.es.md) · Ejecuciones históricas: `[reports/summary.csv](reports/summary.csv)`
 ---
-## Configuración
-| Archivo                         | Uso                                                                     |
-| ------------------------------- | ----------------------------------------------------------------------- |
-| `.env`                          | `YOUTUBE_API_KEY`, `MODEL_NAME`, `ENV`                                  |
-| `configs/model_catalog.yaml`    | Catálogo de inferencia (editar y reiniciar la API para añadir entradas) |
-| `configs/suggested_videos.yaml` | IDs de vídeo del carril sugerido                                        |
-| `configs/best_params.yaml`      | Referencia Optuna LR para el baseline                                   |
-No hagas commit de `.env`. Haz commit de `uv.lock` cuando cambien las dependencias.
----
-## Tests
-```bash
-uv sync --extra dev --extra hf
-uv run pytest
-```
-Cubre contratos de la API, preprocesado y cableado del catálogo para los tres modelos de demo.
----
-## Índice de documentación
-| English                                                  | Español                                            |
-| -------------------------------------------------------- | -------------------------------------------------- |
-| [docs/API.md](docs/API.md)                               | [docs/API.es.md](docs/API.es.md)                   |
-| [docs/PIPELINE.md](docs/PIPELINE.md)                     | [docs/PIPELINE.es.md](docs/PIPELINE.es.md)         |
-| [docs/ARCHITECTURE.md](docs/ARCHITECTURE.md)             | [docs/ARCHITECTURE.es.md](docs/ARCHITECTURE.es.md) |
-| [docs/RESULTS.md](docs/RESULTS.md)                       | [docs/RESULTS.es.md](docs/RESULTS.es.md)           |
-| [reports/HANDOVER_REPORT.md](reports/HANDOVER_REPORT.md) |                                                    |
----
-## Licencia y datos
-Usa el dataset del proyecto y las claves de API según las normas de tu curso u organización. El uso de YouTube Data API debe cumplir las [condiciones de Google](https://developers.google.com/youtube/terms/api-services-terms-of-service).

+<div align="center">
+<img src="docs/assets/signalmod_logo.png" alt="SignalMod" width="520" />
+### Moderación inteligente para comentarios de YouTube
+🌐 [English](README.md) · **Español**
+![Python](https://img.shields.io/badge/Python-3.12-3776AB?logo=python&logoColor=white)
+![FastAPI](https://img.shields.io/badge/FastAPI-0.136-009688?logo=fastapi&logoColor=white)
+![React](https://img.shields.io/badge/React-18-61DAFB?logo=react&logoColor=black)
+![Vite](https://img.shields.io/badge/Vite-5-646CFF?logo=vite&logoColor=white)
+![PyTorch](https://img.shields.io/badge/PyTorch-2.x-EE4C2C?logo=pytorch&logoColor=white)
+![Transformers](https://img.shields.io/badge/Transformers-5.9-FFD21E?logo=huggingface&logoColor=black)
+![scikit-learn](https://img.shields.io/badge/scikit--learn-1.8-F7931E?logo=scikitlearn&logoColor=white)
+![Supabase](https://img.shields.io/badge/Supabase-DB-3ECF8E?logo=supabase&logoColor=white)
+![Docker](https://img.shields.io/badge/Docker-compose-2496ED?logo=docker&logoColor=white)
+![Render](https://img.shields.io/badge/Deploy-Render-46E3B7?logo=render&logoColor=white)
+</div>
 ---
+## Descripción del proyecto
+**SignalMod** es un asistente de moderación inteligente para comentarios de YouTube. Clasifica automáticamente cada comentario como **Seguro** o **Tóxico**, devuelve una probabilidad entre 0 y 1 y etiqueta categorías de toxicidad (insulto, amenaza, odio identitario, contenido obsceno).
+Está construido alrededor del modelo **hybrid meta-feature stacking** del equipo — embeddings de Toxic-BERT congelado combinados con metadatos y una regresión logística regularizada — que alcanza **F1 = 0,805** con una brecha train–test de **2,54 pp** sobre el split de 200 muestras del proyecto.
+El producto se entrega como una API REST con FastAPI y una SPA React que imita la experiencia de YouTube Watch: eliges un vídeo, la API descarga los 50 comentarios más recientes vía la YouTube Data API, los puntúa y persiste cada predicción en Supabase para que cualquier visitante pueda ver el histórico completo.
+---
+## Herramientas y lenguajes
+### Lenguajes
+- **Python 3.12** — backend, pipelines de ML, evaluación.
+- **TypeScript + React 18** — SPA del frontend.
+- **SQL (PostgreSQL vía Supabase)** — persistencia de predicciones.
+### Backend
+- **FastAPI 0.136** — API REST, esquemas Pydantic, carga del modelo en lifespan.
+- **Uvicorn** — servidor ASGI con hot reload.
+- **scikit-learn 1.8** — baseline TF-IDF + meta-learner LogisticRegression.
+- **Optuna** — búsqueda de hiperparámetros del baseline TF-IDF.
+- **PyTorch 2.x + Transformers 5.9** — `unitary/toxic-bert` congelado para embeddings CLS.
+- **spaCy + NLTK** — lematización, stopwords, limpieza basada en regex.
+- **MLflow** — tracking de experimentos.
+- **Supabase Python SDK** — persistencia de predicciones con políticas RLS anónimas.
+- **google-api-python-client** — integración con YouTube Data API v3.
+### Frontend
+- **React 18 + Vite 5 + TypeScript** — SPA con hot module reload.
+- **CSS modules** — tema oscuro estilo YouTube.
+### Tooling y operaciones
+- **uv** — gestor de paquetes y entorno virtual de Python (`pyproject.toml` + `uv.lock`).
+- **pnpm** — gestor de paquetes del frontend.
+- **Docker + Docker Compose** — despliegue en un único contenedor sirviendo API + SPA construida.
+- **GNU Make** — `make dev`, `make install`, `make build`, `make docker`.
+- **Render** — despliegue gratuito vía blueprint `render.yaml`.
+- **Pytest** — tests unitarios de contratos de API y preprocesado.
+---
+## Arquitectura del proyecto
+```
+Project_9_Equipo3/
+├── configs/                       # Configs YAML para pipelines y catálogo de inferencia
+│   ├── pipeline.yaml              # Rutas de datos, target, folds de CV
+│   ├── features.yaml              # Preprocesado y ajustes de TF-IDF
+│   ├── model_catalog.yaml         # Catálogo de inferencia (3 modelos intercambiables)
+│   ├── best_params.yaml           # Ganador de Optuna para el baseline LR
+│   ├── suggested_videos.yaml      # IDs de YouTube del rail "Up next"
+│   └── *_training.yaml            # Perfiles de entrenamiento (golden, expert, hybrid, …)
+├── data/                          # Datasets crudos y procesados (git-ignored)
+├── docs/                          # API.md, PIPELINE.md, ARCHITECTURE.md, DEPLOY.md
+│   └── assets/signalmod_logo.png  # Activos de marca
+├── frontend/                      # SPA React + Vite
+│   ├── public/signalmod_logo.png  # Logo servido como activo estático
+│   └── src/
+│       ├── api/                   # Cliente HTTP tipado
+│       ├── components/            # Layout, CommentRow, SuggestedRail, ModelBanner
+│       ├── context/               # Estado global (modelo activo, umbral)
+│       ├── hooks/                 # useDebouncedPredict
+│       ├── pages/                 # WatchPage, HubPage, SettingsPage
+│       └── utils/                 # toxicityColor, randomUsername, relativeTime
+├── models/
+│   ├── baseline/lr_tfidf.joblib   # Baseline LR ajustado con Optuna
+│   └── production_final/          # meta_stack_final.joblib — artefacto de producción
+├── notebooks/
+│   ├── 01–04                      # EDA, preprocesado, TF-IDF, baseline LR
+│   ├── 12                         # Golden baseline (Toxic-BERT congelado)
+│   ├── 14                         # Meta-stacking final — artefacto de producción
+│   └── archive_attempts/          # Experimentos anteriores conservados para reproducibilidad
+├── reports/                       # Métricas, gráficos, figuras EDA, summary.csv
+├── src/
+│   ├── api/                       # App FastAPI
+│   │   ├── main.py                # Lifespan, CORS, montaje del SPA estático
+│   │   ├── routes/                # health, models, predict (+ /predictions), videos
+│   │   ├── schemas.py             # Modelos Pydantic request/response
+│   │   ├── services.py            # predict_single, to_predict_response
+│   │   ├── state.py               # Estado compartido de la app
+│   │   └── youtube.py             # Fetch a YouTube Data API + metadatos sugeridos
+│   ├── data/                      # Loader, dual loader para pipelines híbridos
+│   ├── db/                        # Cliente Supabase + helpers save_prediction
+│   ├── evaluation/                # Evaluator, threshold tuning, CV estable
+│   ├── experiments/               # Versiones script de los notebooks 13 / 14
+│   ├── features/                  # text_preprocessor, vectorizer, metadata, augmentation
+│   ├── models/                    # baseline (LR/RF/XGBoost), hybrid_ensemble, metadata_lr
+│   ├── pipeline/                  # run_pipeline + variantes por estrategia
+│   ├── service/                   # ModelService, meta_stack_predictor, model_catalog
+│   └── utils/                     # Logger
+├── supabase/predictions_setup.sql # SQL para crear la tabla predictions + políticas RLS
+├── tests/                         # Suite Pytest
+├── Dockerfile                     # Build multi-stage (frontend + backend con uv)
+├── docker-compose.yml             # Despliegue de un contenedor (API + SPA)
+├── render.yaml                    # Blueprint de Render (web service + static site)
+├── Procfile                       # Declaración de proceso para Render
+├── Makefile                       # make dev / install / build / docker / test
+├── pyproject.toml + uv.lock       # Dependencias Python fijadas con uv
+└── README.md  /  README.es.md     # Documentación en inglés / español
 ```
+### Flujo de datos
+```
+                ┌────────────────────────────────────────────────┐
+                │  SPA React (Vite)         http://localhost:5173│
+                │  Layout · Watch · Hub · Settings               │
+                └──────────────────┬─────────────────────────────┘
+                                   │ HTTP JSON  (proxy Vite → :8000)
+                ┌──────────────────▼─────────────────────────────┐
+                │  FastAPI                  http://localhost:8000│
+                │  /predict  /predict-batch  /predict-video      │
+                │  /predictions (GET — histórico de Supabase)    │
+                │  /models  /models/select  /model-info          │
+                │  /videos/suggested  /health                    │
+                └──────┬─────────────────────────────┬───────────┘
+                       │                             │
+        ┌──────────────▼─────────────┐ ┌─────────────▼──────────────┐
+        │  ModelService              │ │  YouTube Data API v3       │
+        │  · local joblib            │ │  · metadatos de vídeo      │
+        │  · hf_remote               │ │  · 50 comentarios + nuevos │
+        │  · meta_stack (producción) │ │                            │
+        └──────┬─────────────────────┘ └────────────────────────────┘
+               │
+        ┌──────▼──────────────────────────────────────────────────┐
+        │  Supabase (PostgreSQL)                                  │
+        │  tabla: predictions(id, created_at, text, video_id,     │
+        │                     probability, is_toxic, labels, …)   │
+        │  RLS: insert anónimo + select anónimo                   │
+        └─────────────────────────────────────────────────────────┘
+```
+### Catálogo de modelos (intercambiable desde la UI)
+| Modelo                           | Tipo        | F1 (test) | Brecha train–test | Umbral    | Latencia | Default |
+| -------------------------------- | ----------- | --------- | ----------------- | --------- | -------- | ------- |
+| **Meta-Feature Stacking**        | Híbrido     | **0,805** | **2,54 pp**       | **0,381** | ~400 ms  | **Sí**  |
+| Frozen Toxic-BERT                | Transformer | 0,790     | 0,16 pp           | 0,120     | ~400 ms  | No      |
+| LR + TF-IDF (Optuna)             | sklearn     | 0,758     | 4,76 pp           | 0,500     | < 50 ms  | No      |
+El modelo de producción concatena el embedding `[CLS]` congelado de `unitary/toxic-bert` (768-d) con metadatos hechos a mano (longitud, ratio de mayúsculas, densidad de emojis…), los escala con `StandardScaler` y los pasa por un meta-learner `LogisticRegression(C=0,001)`.
 ---
+## Instalación y ejecución
+### 1. Requisitos previos
+| Herramienta  | macOS / Linux                       | Windows                                                  |
+| ------------ | ----------------------------------- | -------------------------------------------------------- |
+| **Python 3.12** | `brew install python@3.12`      | [python.org/downloads](https://www.python.org/downloads/) (marca *Add Python to PATH*) |
+| **uv**       | `curl -LsSf https://astral.sh/uv/install.sh \| sh` | `powershell -c "irm https://astral.sh/uv/install.ps1 \| iex"` |
+| **Node.js 18+** | `brew install node`             | [nodejs.org](https://nodejs.org/) (LTS)                 |
+| **pnpm**     | `npm i -g pnpm`                     | `npm i -g pnpm`                                          |
+| **Make** *(opcional)* | ya instalado               | `winget install GnuWin32.Make`  (o usa WSL)              |
+### 2. Clonar y configurar
 ```bash
+git clone https://github.com/Bootcamp-IA-P6/Project_9_Equipo3.git
+cd Project_9_Equipo3
 cp .env.example .env
+# Rellena: YOUTUBE_API_KEY, SUPABASE_URL, SUPABASE_KEY
 ```
+> **PowerShell de Windows**: sustituye `cp` por `Copy-Item .env.example .env`.
+Pega `supabase/predictions_setup.sql` en el editor SQL de Supabase antes del primer arranque (crea la tabla `predictions` + políticas RLS).
+### 3. Arranque — tres opciones
+#### Opción A — Con Makefile (recomendada en macOS / Linux / WSL)
 ```bash
+make install     # uv sync  +  pnpm install
+make dev         # FastAPI :8000  +  Vite :5173
 ```
+| Comando       | Qué hace                                       |
+| ------------- | ---------------------------------------------- |
+| `make install`| Instala deps de Python + frontend              |
+| `make dev`    | Arranca API y UI en paralelo (Ctrl+C los para) |
+| `make api`    | Solo la API                                    |
+| `make ui`     | Solo la UI                                     |
+| `make build`  | Compila el SPA a `frontend/dist`               |
+| `make test`   | Ejecuta Pytest                                 |
+| `make docker` | `docker compose up --build`                    |
+| `make stop`   | Mata procesos en los puertos 8000 / 5173       |
+| `make clean`  | Borra `.venv`, `node_modules`, `dist`          |
+#### Opción B — Manual (macOS / Linux)
+Dos terminales.
+**Terminal 1 — API**
 ```bash
+uv sync
+uv run uvicorn src.api.main:app --reload --port 8000
 ```
+**Terminal 2 — Frontend**
 ```bash
+cd frontend
+pnpm install
+pnpm dev
 ```
+#### Opción C — Manual (PowerShell de Windows)
+Dos terminales.
+**Terminal 1 — API**
+```powershell
+uv sync
+uv run uvicorn src.api.main:app --reload --port 8000
 ```
+**Terminal 2 — Frontend**
+```powershell
+cd frontend
+pnpm install
+pnpm dev
+```
+> Si `uv` no se reconoce tras instalarlo, cierra y vuelve a abrir PowerShell para que se recargue el `PATH`.
+### 4. Abrir la aplicación
+| URL                            | Qué verás                                |
+| ------------------------------ | ---------------------------------------- |
+| http://localhost:5173          | SPA React — Watch / Hub / Settings       |
+| http://localhost:8000/docs     | Swagger de FastAPI                       |
+| http://localhost:8000/health   | Health check                             |
+### 5. Docker (un solo contenedor — API + SPA compilada)
+Mismos comandos en **macOS / Linux / Windows**:
 ```bash
+# Normal — deja imágenes y volúmenes para builds rápidos
+docker compose up --build
+# → http://localhost:8000  ·  Ctrl+C para parar  ·  docker compose down
+# Demo efímera — Ctrl+C borra contenedor + imagen + volúmenes
+make docker-demo
+# Limpieza manual completa
+make docker-clean
+# (equivale a: docker compose down --rmi local --volumes --remove-orphans)
 ```
 ---
+Más detalle: [docs/PIPELINE.es.md](docs/PIPELINE.es.md) para entrenamiento, [docs/API.es.md](docs/API.es.md) para endpoints, [docs/DEPLOY.md](docs/DEPLOY.md) para despliegue en Render.
 ---
+## Colaboradores
+<table>
+  <tr>
+    <td align="center" width="25%">
+      <b>Andrés Torrez</b><br/>
+      <sub>Backend Developer</sub>
+    </td>
+    <td align="center" width="25%">
+      <b>Mirae Kang</b><br/>
+      <sub>Scrum Master</sub>
+    </td>
+    <td align="center" width="25%">
+      <b>Jonathan Brasales</b><br/>
+      <sub>AI Developer</sub>
+    </td>
+    <td align="center" width="25%">
+      <b>Roberto Molero</b><br/>
+      <sub>Product Owner</sub>
+    </td>
+  </tr>
+</table>
 ---
+<div align="center">
+**SignalMod** — Bootcamp IA P6 · Equipo 3 · 2026
+</div>

README.md CHANGED Viewed

@@ -1,279 +1,312 @@
-# YouTube Toxic Comment Detector (youtube_hate_detector)
-[![Python](https://img.shields.io/badge/python-3.12-blue.svg)](https://www.python.org/downloads/)
-[![FastAPI](https://img.shields.io/badge/FastAPI-0.136-009688.svg)](https://fastapi.tiangolo.com/)
-[![React](https://img.shields.io/badge/React-UI-61DAFB.svg)](https://react.dev/)
-[![Docker](https://img.shields.io/badge/docker-compose-2496ED.svg)](https://docs.docker.com/compose/)
-**Español:** [README.es.md](README.es.md)
-Automated **Safe vs Toxic** moderation support for YouTube-style comments. The stack is **FastAPI** (REST inference) plus a **React** SPA that mimics a Watch page: type or load comments, see toxicity scores, and switch models in Settings.
-**Production default:** **Hybrid Meta-Feature Stacking** — `models/production_final/meta_stack_final.joblib` (held-out test F1 **0.805**, train–test gap **2.54%**, under the team’s **&lt; 5%** overfitting rule).
 ---
-## What this project does
-| Aspect | Detail |
-|--------|--------|
-| **Task** | Binary classification on `IsToxic` → **Safe (0)** / **Toxic (1)** |
-| **Data** | `data/raw/youtoxic_english_1000.csv` (~1k English comments; multilabel columns available for EDA) |
-| **Primary metric** | F1 weighted (imbalanced toxic class) |
-| **Overfitting guardrail** | \|F1 train − F1 test\| &lt; 5 percentage points |
-| **User-facing wording** | **toxic** |
-Moderators get a practical score and label per comment. The demo does not replace human review; it prioritizes **usable** performance on a small domain-specific corpus.
----
-## Models: baseline → production
-Three inference options are registered in [`configs/model_catalog.yaml`](configs/model_catalog.yaml) and exposed in the UI. Metrics below are on the project’s stratified hold-out test split unless noted.
-| Model | Type | Test F1 (weighted) | Train–test gap | Artifact / weights | UI threshold |
-|-------|------|-------------------|----------------|---------------------|--------------|
-| **LR + TF-IDF (Baseline)** | sklearn + TF-IDF | 0.758 | 4.76 pp | `models/baseline/lr_tfidf.joblib` | 0.50 |
-| **Frozen Toxic-BERT (Baseline)** | Transformer (frozen) | 0.790 | 0.16 pp | Hugging Face [`unitary/toxic-bert`](https://huggingface.co/unitary/toxic-bert) | 0.12 |
-| **Meta-Feature Stacking (Production)** | Hybrid stack | **0.805** | **2.54 pp** | `models/production_final/meta_stack_final.joblib` | **0.381** |
-Canonical baseline numbers: [`models/baseline/manifest.json`](models/baseline/manifest.json). Production run: [`reports/notebook_14/final_result.json`](reports/notebook_14/final_result.json). Presentation script: [`reports/HANDOVER_REPORT.md`](reports/HANDOVER_REPORT.md).
-### Team contribution — Hybrid Meta-Feature Stacking
-Production combines signals that sklearn alone misses, without fine-tuning a large transformer on ~1k rows:
-```text
-Comment text
-    ├─► Frozen Toxic-BERT → [CLS] embedding (768-d)
-    └─► Metadata features (length, caps ratio, emoji density, …)
-              └─► concat → StandardScaler → LogisticRegression (C=0.001)
-                        └─► P(toxic) → threshold 0.381
 ```
-- **Frozen BERT** supplies semantic signal; weights stay fixed (same Hub checkpoint as the frozen baseline path).
-- **Metadata** keeps interpretable structure (punctuation, length, etc.).
-- **Strong regularization** and test-set threshold search keep the train–test gap under 5% while passing the **F1 ≥ 0.80** target.
-Implementation: [Notebook 14](notebooks/14_final_meta_stacking.ipynb) · `uv run python -m src.experiments.notebook_14_final_stack`
-### Notebook narrative
-| Notebooks | Role |
-|-----------|------|
-| `01`–`03` | EDA, preprocessing, TF-IDF → LR baseline |
-| `12` | Golden baseline strategy (frozen Toxic-BERT metrics) |
-| `14` | Final meta-stacking → production artifact |
-| `archive_attempts/` | Earlier experiments (04–11, 13); kept for reproducibility |
 ---
-## Prerequisites
-- **Python 3.12** (see `.python-version`)
-- **[uv](https://docs.astral.sh/uv/)** for installs and commands
-- **Node.js 18+** for local frontend dev
-- **Optional:** `YOUTUBE_API_KEY` for live comments and suggested-video thumbnails ([Google Cloud Console](https://console.cloud.google.com/apis/credentials))
-Transformer baselines and production need Hugging Face dependencies:
-```bash
-uv sync --extra hf
-uv run python -c "import transformers; print('ok')"
-```
----
-## Installation
 ```bash
-git clone <your-repo-url>
-cd youtube_hate_detector
 cp .env.example .env
-# Edit .env: YOUTUBE_API_KEY, MODEL_NAME (optional)
-uv sync --extra hf
 ```
-Place `youtoxic_english_1000.csv` in `data/raw/` if you plan to retrain (file is git-ignored).
----
-## Run locally (development)
-### 1. API
 ```bash
-uv run uvicorn src.api.main:app --reload --port 8000
 ```
-| Resource | URL |
-|----------|-----|
-| Swagger | http://localhost:8000/docs |
-| Health | http://localhost:8000/health |
-| OpenAPI | http://localhost:8000/redoc |
-On startup, `ModelService` loads the model from `MODEL_NAME` (default: **Meta-Feature Stacking (Production)**). First load of a transformer model may download weights from Hugging Face (~1 minute on a cold cache).
-### 2. React UI
 ```bash
-cd frontend
-npm install
-npm run dev
 ```
-Open http://localhost:5173 — Vite proxies API routes (`/predict`, `/models/status`, etc.) to port 8000.
-**Watch page:** suggested videos, comment list scoring, live draft analysis.
-**Settings:** switch among the three catalog models; threshold slider (defaults update when you change model).
-**Moderator Hub:** session history of scored comments.
-Production banner (from `/model-info`): e.g. *Meta-Feature Stacking Model (F1: 0.805, Gap: 2.54%)*.
----
-## Docker (API + built UI)
 ```bash
-export YOUTUBE_API_KEY=your_key   # optional but recommended for real comments
-docker compose up --build
 ```
-| URL | Service |
-|-----|---------|
-| http://localhost:8000 | FastAPI + `frontend/dist` (single container) |
-| http://localhost:8000/docs | Swagger |
-The image copies `models/baseline/` and `models/production_final/`. `INSTALL_HF=1` is the default in `docker-compose.yml` so production and frozen BERT baselines work. For a sklearn-only image (LR baseline only):
-```bash
-INSTALL_HF=0 docker compose build --build-arg INSTALL_HF=0
 ```
----
-## API overview
-Full reference: [docs/API.md](docs/API.md)
-| Method | Path | Description |
-|--------|------|-------------|
-| `POST` | `/predict` | Score one comment `{ "text", "threshold" }` |
-| `POST` | `/predict-batch` | Up to 100 texts |
-| `POST` | `/predict-video` | Fetch YouTube comments and score (API key or demo fallback) |
-| `GET` | `/videos/suggested` | Right-rail video metadata (`configs/suggested_videos.yaml`) |
-| `GET` | `/models/status` | Catalog + availability (joblib / HF deps) |
-| `POST` | `/models/select` | Switch model `{ "model_name": "..." }` |
-| `GET` | `/model-info` | Active model metadata (banner text, recommended threshold) |
-**Example**
-```bash
-curl -s -X POST http://localhost:8000/predict \
-  -H "Content-Type: application/json" \
-  -d '{"text": "Thanks for the great tutorial!", "threshold": 0.381}'
-```
-Switch to the LR baseline:
 ```bash
-curl -s -X POST http://localhost:8000/models/select \
-  -H "Content-Type: application/json" \
-  -d '{"model_name": "LR + TF-IDF (Baseline)"}'
-```
----
-## Project structure
-```
-youtube_hate_detector/
-├── configs/
-│   ├── model_catalog.yaml      # Demo models (baselines + production)
-│   ├── pipeline.yaml           # Training paths
-│   ├── features.yaml
-│   └── suggested_videos.yaml
-├── data/
-│   ├── raw/                    # Source CSV (git-ignored)
-│   └── processed/              # Preprocessed exports
-├── frontend/                   # React + Vite
-├── models/
-│   ├── baseline/               # lr_tfidf.joblib, manifest.json
-│   ├── production_final/       # meta_stack_final.joblib
-│   └── README.md
-├── notebooks/
-│   ├── 01–03, 12, 14           # Main story
-│   └── archive_attempts/       # 04–11, 13
-├── reports/
-│   ├── HANDOVER_REPORT.md
-│   ├── notebook_14/
-│   ├── golden_baseline/
-│   └── v2/                     # Teammate EDA figures
-├── src/
-│   ├── api/                    # FastAPI routes
-│   ├── service/                # ModelService, meta-stack predictor
-│   ├── pipeline/               # Training pipelines
-│   ├── features/
-│   └── evaluation/
-├── tests/
-├── Dockerfile
-├── docker-compose.yml
-├── pyproject.toml
-└── uv.lock
 ```
 ---
-## Training and reproducing metrics
-| Goal | Command |
-|------|---------|
-| LR + TF-IDF baseline | `uv run python -m src.pipeline.run_pipeline --model lr` |
-| Frozen BERT baseline reports | `uv run python -m src.pipeline.run_golden_baseline_pipeline` |
-| Production meta-stack | `uv run python -m src.experiments.notebook_14_final_stack` |
-Pipeline details: [docs/PIPELINE.md](docs/PIPELINE.md) · Aggregated results: [docs/RESULTS.md](docs/RESULTS.md) · Historical runs: [`reports/summary.csv`](reports/summary.csv)
----
-## Configuration
-| File | Purpose |
-|------|---------|
-| `.env` | `YOUTUBE_API_KEY`, `MODEL_NAME`, `ENV` |
-| `configs/model_catalog.yaml` | Inference catalog (edit + restart API to add entries) |
-| `configs/suggested_videos.yaml` | Video IDs for the suggested rail |
-| `configs/best_params.yaml` | Optuna LR reference for baseline |
-Never commit `.env`. Commit `uv.lock` when dependencies change.
 ---
-## Tests
-```bash
-uv sync --extra dev --extra hf
-uv run pytest
-```
-Covers API contracts, preprocessing, and catalog wiring for the three demo models.
 ---
-## Documentation index
-| English | Español |
-|---------|---------|
-| [docs/API.md](docs/API.md) | [docs/API.es.md](docs/API.es.md) |
-| [docs/PIPELINE.md](docs/PIPELINE.md) | [docs/PIPELINE.es.md](docs/PIPELINE.es.md) |
-| [docs/ARCHITECTURE.md](docs/ARCHITECTURE.md) | [docs/ARCHITECTURE.es.md](docs/ARCHITECTURE.es.md) |
-| [docs/RESULTS.md](docs/RESULTS.md) | [docs/RESULTS.es.md](docs/RESULTS.es.md) |
-| [reports/HANDOVER_REPORT.md](reports/HANDOVER_REPORT.md) |   |
----
-## License and data
-Use the project dataset and API keys according to your course or organization rules. YouTube Data API usage must comply with [Google’s terms](https://developers.google.com/youtube/terms/api-services-terms-of-service).

+<div align="center">
+<img src="docs/assets/signalmod_logo.png" alt="SignalMod" width="520" />
+### Intelligent moderation for YouTube comments
+🌐 **English** · [Español](README.es.md)
+![Python](https://img.shields.io/badge/Python-3.12-3776AB?logo=python&logoColor=white)
+![FastAPI](https://img.shields.io/badge/FastAPI-0.136-009688?logo=fastapi&logoColor=white)
+![React](https://img.shields.io/badge/React-18-61DAFB?logo=react&logoColor=black)
+![Vite](https://img.shields.io/badge/Vite-5-646CFF?logo=vite&logoColor=white)
+![PyTorch](https://img.shields.io/badge/PyTorch-2.x-EE4C2C?logo=pytorch&logoColor=white)
+![Transformers](https://img.shields.io/badge/Transformers-5.9-FFD21E?logo=huggingface&logoColor=black)
+![scikit-learn](https://img.shields.io/badge/scikit--learn-1.8-F7931E?logo=scikitlearn&logoColor=white)
+![Supabase](https://img.shields.io/badge/Supabase-DB-3ECF8E?logo=supabase&logoColor=white)
+![Docker](https://img.shields.io/badge/Docker-compose-2496ED?logo=docker&logoColor=white)
+![Render](https://img.shields.io/badge/Deploy-Render-46E3B7?logo=render&logoColor=white)
+</div>
 ---
+## Project description
+**SignalMod** is an intelligent moderation assistant for YouTube comments. It automatically classifies each comment as **Safe** or **Toxic**, returns a probability between 0 and 1, and tags toxicity categories (insult, threat, identity hate, obscene content).
+It is built around the team's **hybrid meta-feature stacking** model — frozen Toxic-BERT embeddings combined with metadata features and a regularised logistic regression — reaching **F1 = 0.805** with a train–test gap of **2.54 pp** on the project's 200-sample test split.
+The product ships as a FastAPI REST service plus a React SPA that mimics the YouTube Watch experience: pick a video, the API fetches the latest 50 comments via the YouTube Data API, scores them, and persists every prediction in Supabase so any visitor can see the full history.
+---
+## Tools and languages
+### Languages
+- **Python 3.12** — backend, ML pipelines, evaluation.
+- **TypeScript + React 18** — frontend SPA.
+- **SQL (PostgreSQL via Supabase)** — predictions persistence.
+### Backend
+- **FastAPI 0.136** — REST API, Pydantic schemas, lifespan model loading.
+- **Uvicorn** — ASGI server with hot reload.
+- **scikit-learn 1.8** — TF-IDF baseline + meta-learner Logistic Regression.
+- **Optuna** — hyperparameter search for the TF-IDF baseline.
+- **PyTorch 2.x + Transformers 5.9** — frozen `unitary/toxic-bert` for CLS embeddings.
+- **spaCy + NLTK** — lemmatisation, stopwords, regex-based cleanup.
+- **MLflow** — experiment tracking.
+- **Supabase Python SDK** — predictions persistence with anonymous RLS policies.
+- **google-api-python-client** — YouTube Data API v3 integration.
+### Frontend
+- **React 18 + Vite 5 + TypeScript** — SPA with hot module reload.
+- **CSS modules** — YouTube-like dark theme.
+### Tooling and ops
+- **uv** — Python package and venv manager (`pyproject.toml` + `uv.lock`).
+- **pnpm** — frontend package manager.
+- **Docker + Docker Compose** — single-container deploy serving API + built SPA.
+- **GNU Make** — `make dev`, `make install`, `make build`, `make docker`.
+- **Render** — free-tier deploy via `render.yaml` blueprint.
+- **Pytest** — unit tests for API contracts and preprocessing.
+---
+## Project architecture
+```
+Project_9_Equipo3/
+├── configs/                       # YAML configs for pipelines and inference catalog
+│   ├── pipeline.yaml              # Training data paths, target columns, CV folds
+│   ├── features.yaml              # Preprocessing and TF-IDF settings
+│   ├── model_catalog.yaml         # Inference catalog (3 swappable models)
+│   ├── best_params.yaml           # Optuna winner for the LR baseline
+│   ├── suggested_videos.yaml      # YouTube IDs shown in the Up-next rail
+│   └── *_training.yaml            # Training profiles (golden baseline, expert, hybrid, …)
+├── data/                          # Raw and processed datasets (git-ignored)
+├── docs/                          # API.md, PIPELINE.md, ARCHITECTURE.md, DEPLOY.md
+│   └── assets/signalmod_logo.png  # Brand assets
+├── frontend/                      # React + Vite SPA
+│   ├── public/signalmod_logo.png  # Logo served as static asset
+│   └── src/
+│       ├── api/                   # Typed HTTP client
+│       ├── components/            # Layout, CommentRow, SuggestedRail, ModelBanner
+│       ├── context/               # Global app state (active model, threshold)
+│       ├── hooks/                 # useDebouncedPredict
+│       ├── pages/                 # WatchPage, HubPage, SettingsPage
+│       └── utils/                 # toxicityColor, randomUsername, relativeTime
+├── models/
+│   ├── baseline/lr_tfidf.joblib   # Optuna-tuned LR baseline
+│   └── production_final/          # meta_stack_final.joblib — production artifact
+├── notebooks/
+│   ├── 01–04                      # EDA, preprocessing, TF-IDF, baseline LR
+│   ├── 12                         # Golden baseline (frozen Toxic-BERT)
+│   ├── 14                         # Final meta-stacking — production artifact
+│   └── archive_attempts/          # Earlier experiments preserved for reproducibility
+├── reports/                       # Metrics, plots, EDA figures, summary.csv
+├── src/
+│   ├── api/                       # FastAPI app
+│   │   ├── main.py                # Lifespan, CORS, static SPA mount
+│   │   ├── routes/                # health, models, predict (+ /predictions), videos
+│   │   ├── schemas.py             # Pydantic request/response models
+│   │   ├── services.py            # predict_single, to_predict_response
+│   │   ├── state.py               # Shared app state
+│   │   └── youtube.py             # YouTube Data API fetch + suggested metadata
+│   ├── data/                      # Loader, dual loader for hybrid pipelines
+│   ├── db/                        # Supabase client + save_prediction helpers
+│   ├── evaluation/                # Evaluator, threshold tuning, stable CV
+│   ├── experiments/               # Notebook 13 / 14 script versions
+│   ├── features/                  # text_preprocessor, vectorizer, metadata, augmentation
+│   ├── models/                    # baseline (LR/RF/XGBoost), hybrid_ensemble, metadata_lr
+│   ├── pipeline/                  # run_pipeline + per-strategy variants
+│   ├── service/                   # ModelService, meta_stack_predictor, model_catalog
+│   └── utils/                     # Logger
+├── supabase/predictions_setup.sql # SQL to create the predictions table + RLS policies
+├── tests/                         # Pytest suite
+├── Dockerfile                     # Multi-stage build (frontend + uv backend)
+├── docker-compose.yml             # One-container deploy serving API + SPA
+├── render.yaml                    # Render blueprint (web service + static site)
+├── Procfile                       # Render process declaration
+├── Makefile                       # make dev / install / build / docker / test
+├── pyproject.toml + uv.lock       # Python dependencies pinned with uv
+└── README.md  /  README.es.md     # English / Spanish documentation
+```
+### Data flow
+```
+                ┌────────────────────────────────────────────────┐
+                │  React SPA (Vite)         http://localhost:5173│
+                │  Layout · Watch · Hub · Settings               │
+                └──────────────────┬─────────────────────────────┘
+                                   │ HTTP JSON  (Vite proxy → :8000)
+                ┌──────────────────▼─────────────────────────────┐
+                │  FastAPI                  http://localhost:8000│
+                │  /predict  /predict-batch  /predict-video      │
+                │  /predictions (GET — Supabase history)         │
+                │  /models  /models/select  /model-info          │
+                │  /videos/suggested  /health                    │
+                └──────┬─────────────────────────────┬───────────┘
+                       │                             │
+        ┌──────────────▼─────────────┐ ┌─────────────▼──────────────┐
+        │  ModelService              │ │  YouTube Data API v3       │
+        │  · local joblib            │ │  · video metadata          │
+        │  · hf_remote               │ │  · 50 newest comments      │
+        │  · meta_stack (production) │ │                            │
+        └──────┬─────────────────────┘ └────────────────────────────┘
+               │
+        ┌──────▼──────────────────────────────────────────────────┐
+        │  Supabase (PostgreSQL)                                  │
+        │  table: predictions(id, created_at, text, video_id,     │
+        │                     probability, is_toxic, labels, …)   │
+        │  RLS: anon insert + anon select                         │
+        └─────────────────────────────────────────────────────────┘
 ```
+### Model catalog (swappable from the UI)
+| Model                            | Type        | F1 (test) | Train–test gap | Threshold | Latency | Default |
+| -------------------------------- | ----------- | --------- | -------------- | --------- | ------- | ------- |
+| **Meta-Feature Stacking**        | Hybrid      | **0.805** | **2.54 pp**    | **0.381** | ~400 ms | **Yes** |
+| Frozen Toxic-BERT                | Transformer | 0.790     | 0.16 pp        | 0.120     | ~400 ms | No      |
+| LR + TF-IDF (Optuna)             | sklearn     | 0.758     | 4.76 pp        | 0.500     | < 50 ms | No      |
+The production model concatenates the frozen `[CLS]` embedding from `unitary/toxic-bert` (768-d) with hand-crafted metadata features (length, uppercase ratio, emoji density…), scales them with `StandardScaler`, and feeds them into a `LogisticRegression(C=0.001)` meta-learner.
 ---
+## Setup & run
+### 1. Prerequisites
+| Tool        | macOS / Linux                       | Windows                                                   |
+| ----------- | ----------------------------------- | --------------------------------------------------------- |
+| **Python 3.12** | `brew install python@3.12`      | [python.org/downloads](https://www.python.org/downloads/) (check *Add Python to PATH*) |
+| **uv**      | `curl -LsSf https://astral.sh/uv/install.sh \| sh` | `powershell -c "irm https://astral.sh/uv/install.ps1 \| iex"` |
+| **Node.js 18+** | `brew install node`             | [nodejs.org](https://nodejs.org/) (LTS)                  |
+| **pnpm**    | `npm i -g pnpm`                     | `npm i -g pnpm`                                           |
+| **Make** *(optional)* | already installed         | `winget install GnuWin32.Make`  (or use WSL)              |
+### 2. Clone & configure
 ```bash
+git clone https://github.com/Bootcamp-IA-P6/Project_9_Equipo3.git
+cd Project_9_Equipo3
 cp .env.example .env
+# Fill: YOUTUBE_API_KEY, SUPABASE_URL, SUPABASE_KEY
 ```
+> **Windows PowerShell**: replace `cp` with `Copy-Item .env.example .env`.
+Paste `supabase/predictions_setup.sql` into the Supabase SQL editor before the first run (creates the `predictions` table + RLS policies).
+### 3. Run — three ways
+#### Option A — With Makefile (recommended on macOS / Linux / WSL)
 ```bash
+make install     # uv sync  +  pnpm install
+make dev         # FastAPI :8000  +  Vite :5173
 ```
+| Command       | What it does                                  |
+| ------------- | --------------------------------------------- |
+| `make install`| Install Python + frontend deps                |
+| `make dev`    | Start API and UI in parallel (Ctrl+C stops both) |
+| `make api`    | API only                                      |
+| `make ui`     | UI only                                       |
+| `make build`  | Build the SPA into `frontend/dist`            |
+| `make test`   | Run Pytest                                    |
+| `make docker` | `docker compose up --build`                   |
+| `make stop`   | Kill anything on ports 8000 / 5173            |
+| `make clean`  | Remove `.venv`, `node_modules`, `dist`        |
+#### Option B — Manual (macOS / Linux)
+Two terminals.
+**Terminal 1 — API**
 ```bash
+uv sync
+uv run uvicorn src.api.main:app --reload --port 8000
 ```
+**Terminal 2 — Frontend**
 ```bash
+cd frontend
+pnpm install
+pnpm dev
 ```
+#### Option C — Manual (Windows PowerShell)
+Two terminals.
+**Terminal 1 — API**
+```powershell
+uv sync
+uv run uvicorn src.api.main:app --reload --port 8000
 ```
+**Terminal 2 — Frontend**
+```powershell
+cd frontend
+pnpm install
+pnpm dev
+```
+> If `uv` is not recognised after install, close and reopen PowerShell so the new `PATH` is picked up.
+### 4. Open the app
+| URL                            | What you'll see                          |
+| ------------------------------ | ---------------------------------------- |
+| http://localhost:5173          | React SPA — Watch / Hub / Settings       |
+| http://localhost:8000/docs     | FastAPI Swagger UI                       |
+| http://localhost:8000/health   | Health check                             |
+### 5. Docker (one container — API + SPA built)
+Same commands on **macOS / Linux / Windows**:
 ```bash
+# Normal — keeps images and volumes for fast rebuilds
+docker compose up --build
+# → http://localhost:8000  ·  Ctrl+C to stop  ·  docker compose down
+# Ephemeral demo — Ctrl+C tears down container + image + volumes
+make docker-demo
+# Manual full cleanup
+make docker-clean
+# (equivalent to: docker compose down --rmi local --volumes --remove-orphans)
 ```
 ---
+More: see [docs/PIPELINE.md](docs/PIPELINE.md) for training, [docs/API.md](docs/API.md) for endpoints, [docs/DEPLOY.md](docs/DEPLOY.md) for Render deployment.
 ---
+## Contributors
+<table>
+  <tr>
+    <td align="center" width="25%">
+      <b>Andrés Torrez</b><br/>
+      <sub>Backend Developer</sub>
+    </td>
+    <td align="center" width="25%">
+      <b>Mirae Kang</b><br/>
+      <sub>Scrum Master</sub>
+    </td>
+    <td align="center" width="25%">
+      <b>Jonathan Brasales</b><br/>
+      <sub>AI Developer</sub>
+    </td>
+    <td align="center" width="25%">
+      <b>Roberto Molero</b><br/>
+      <sub>Product Owner</sub>
+    </td>
+  </tr>
+</table>
 ---
+<div align="center">
+**SignalMod** — Bootcamp IA P6 · Team 3 · 2026
+</div>