Spaces:

FocusGuard
/

final_test

Sleeping

File size: 17,177 Bytes

22a6915

import csv
import json
import os
import random
import sys

import numpy as np
import joblib
import torch
import torch.nn as nn
import torch.optim as optim
from sklearn.metrics import (
    classification_report,
    confusion_matrix,
    f1_score,
    precision_recall_fscore_support,
    roc_auc_score,
    roc_curve,
)

from data_preparation.prepare_dataset import get_dataloaders, SELECTED_FEATURES

_PROJECT_ROOT = os.path.abspath(os.path.join(os.path.dirname(__file__), "..", ".."))

USE_CLEARML = os.environ.get("USE_CLEARML", "0") == "1" or bool(os.environ.get("CLEARML_TASK_ID"))
CLEARML_QUEUE = os.environ.get("CLEARML_QUEUE", "")


def _load_cfg():
    """Build training config from config/default.yaml with fallbacks."""
    try:
        from config import get
        mlp = get("mlp") or {}
        data = get("data") or {}
        ratios = data.get("split_ratios", [0.7, 0.15, 0.15])
        return {
            "model_name": mlp.get("model_name", "face_orientation"),
            "epochs": mlp.get("epochs", 30),
            "batch_size": mlp.get("batch_size", 32),
            "lr": mlp.get("lr", 1e-3),
            "seed": mlp.get("seed", 42),
            "split_ratios": tuple(ratios),
            "hidden_sizes": mlp.get("hidden_sizes", [64, 32]),
            "checkpoints_dir": os.path.join(_PROJECT_ROOT, "checkpoints"),
            "logs_dir": os.path.join(_PROJECT_ROOT, "evaluation", "logs"),
        }
    except Exception:
        return {
            "model_name": "face_orientation",
            "epochs": 30,
            "batch_size": 32,
            "lr": 1e-3,
            "seed": 42,
            "split_ratios": (0.7, 0.15, 0.15),
            "hidden_sizes": [64, 32],
            "checkpoints_dir": os.path.join(_PROJECT_ROOT, "checkpoints"),
            "logs_dir": os.path.join(_PROJECT_ROOT, "evaluation", "logs"),
        }


CFG = _load_cfg()

# ==== ClearML: expose all config as task params, support remote execution ====
task = None
if USE_CLEARML:
    try:
        from clearml import Task
        from config import CLEARML_PROJECT_NAME, flatten_for_clearml
        task = Task.init(
            project_name=CLEARML_PROJECT_NAME,
            task_name="MLP Model Training",
            tags=["training", "mlp_model"],
        )
        from config.clearml_enrich import enrich_task, upload_repro_artifacts

        enrich_task(task, role="train_mlp")
        flat = flatten_for_clearml()
        flat["mlp/model_name"] = CFG.get("model_name", "face_orientation")
        flat["mlp/epochs"] = CFG.get("epochs", 30)
        flat["mlp/batch_size"] = CFG.get("batch_size", 32)
        flat["mlp/lr"] = CFG.get("lr", 1e-3)
        flat["mlp/seed"] = CFG.get("seed", 42)
        flat["mlp/hidden_sizes"] = str(CFG.get("hidden_sizes", [64, 32]))
        flat["mlp/split_ratios"] = str(CFG.get("split_ratios", (0.7, 0.15, 0.15)))
        task.connect(flat)
        upload_repro_artifacts(task)
        if CLEARML_QUEUE:
            print(f"[ClearML] Enqueuing to queue '{CLEARML_QUEUE}'. Agent will run training.")
            task.execute_remotely(queue_name=CLEARML_QUEUE)
            sys.exit(0)
    except ImportError:
        task = None
        USE_CLEARML = False



# ==== Model =============================================
def set_seed(seed: int) -> None:
    """Set random seed for numpy, torch, and Python RNG for reproducibility."""
    random.seed(seed)
    np.random.seed(seed)
    torch.manual_seed(seed)
    if torch.cuda.is_available():
        torch.cuda.manual_seed_all(seed)


class BaseModel(nn.Module):
    """MLP classifier: num_features -> hidden_sizes -> num_classes. Used for face_orientation focus."""

    def __init__(self, num_features: int, num_classes: int, hidden_sizes: list[int] | None = None):
        super().__init__()
        sizes = hidden_sizes or CFG.get("hidden_sizes", [64, 32])
        layers = []
        prev = num_features
        for h in sizes:
            layers.extend([nn.Linear(prev, h), nn.ReLU()])
            prev = h
        layers.append(nn.Linear(prev, num_classes))
        self.network = nn.Sequential(*layers)

    def forward(self, x):
        return self.network(x)

    def training_step(self, loader, optimizer, criterion, device):
        self.train()
        total_loss = 0.0
        correct = 0
        total = 0

        for features, labels in loader:
            features, labels = features.to(device), labels.to(device)

            optimizer.zero_grad()
            outputs = self(features)
            loss = criterion(outputs, labels)
            loss.backward()
            optimizer.step()

            total_loss += loss.item() * features.size(0)
            correct += (outputs.argmax(dim=1) == labels).sum().item()
            total += features.size(0)

        return total_loss / total, correct / total

    @torch.no_grad()
    def validation_step(self, loader, criterion, device):
        self.eval()
        total_loss = 0.0
        correct = 0
        total = 0
        all_preds = []
        all_labels = []

        for features, labels in loader:
            features, labels = features.to(device), labels.to(device)
            outputs = self(features)
            loss = criterion(outputs, labels)

            total_loss += loss.item() * features.size(0)
            preds = outputs.argmax(dim=1)
            correct += (preds == labels).sum().item()
            total += features.size(0)
            all_preds.extend(preds.cpu().numpy())
            all_labels.extend(labels.cpu().numpy())

        val_f1 = f1_score(np.array(all_labels), np.array(all_preds), average="weighted")
        return total_loss / total, correct / total, val_f1

    @torch.no_grad()
    def test_step(self, loader, criterion, device):
        self.eval()
        total_loss = 0.0
        correct = 0
        total = 0
        
        all_preds = []
        all_labels = []
        all_probs = []

        for features, labels in loader:
            features, labels = features.to(device), labels.to(device)
            outputs = self(features)
            loss = criterion(outputs, labels)

            total_loss += loss.item() * features.size(0)
            preds = outputs.argmax(dim=1)
            correct += (preds == labels).sum().item()
            total += features.size(0)
            
            probs = torch.softmax(outputs, dim=1)
            all_preds.extend(preds.cpu().numpy())
            all_labels.extend(labels.cpu().numpy())
            all_probs.extend(probs.cpu().numpy())

        return total_loss / total, correct / total, np.array(all_probs), np.array(all_preds), np.array(all_labels)


def main() -> None:
    """Train MLP on face_orientation features, save best checkpoint and scaler to checkpoints/."""
    set_seed(CFG["seed"])

    device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
    print(f"[TRAIN] Device: {device}")
    print(f"[TRAIN] Model: {CFG['model_name']}")

    train_loader, val_loader, test_loader, num_features, num_classes, scaler = get_dataloaders(
        model_name=CFG["model_name"],
        batch_size=CFG["batch_size"],
        split_ratios=CFG["split_ratios"],
        seed=CFG["seed"],
    )

    model = BaseModel(num_features, num_classes, hidden_sizes=CFG.get("hidden_sizes")).to(device)
    criterion = nn.CrossEntropyLoss()
    optimizer = optim.Adam(model.parameters(), lr=CFG["lr"])

    param_count = sum(p.numel() for p in model.parameters())
    print(f"[TRAIN] Parameters: {param_count:,}")

    ckpt_dir = CFG["checkpoints_dir"]
    os.makedirs(ckpt_dir, exist_ok=True)
    best_ckpt_path = os.path.join(ckpt_dir, "mlp_best.pt")

    history = {
        "model_name": CFG["model_name"],
        "param_count": param_count,
        "epochs": [],
        "train_loss": [],
        "train_acc": [],
        "val_loss": [],
        "val_acc": [],
        "val_f1": [],
    }

    best_val_f1 = 0.0
    best_val_acc = 0.0

    print(f"\n{'Epoch':>6} | {'Train Loss':>10} | {'Train Acc':>9} | {'Val Loss':>10} | {'Val Acc':>9} | {'Val F1':>8}")
    print("-" * 72)

    for epoch in range(1, CFG["epochs"] + 1):
        train_loss, train_acc = model.training_step(train_loader, optimizer, criterion, device)
        val_loss, val_acc, val_f1 = model.validation_step(val_loader, criterion, device)

        history["epochs"].append(epoch)
        history["train_loss"].append(round(train_loss, 4))
        history["train_acc"].append(round(train_acc, 4))
        history["val_loss"].append(round(val_loss, 4))
        history["val_acc"].append(round(val_acc, 4))
        history["val_f1"].append(round(val_f1, 4))


        current_lr = optimizer.param_groups[0]['lr']
        if task is not None:
            task.logger.report_scalar("Loss",          "Train", float(train_loss), iteration=epoch)
            task.logger.report_scalar("Accuracy",      "Train", float(train_acc),  iteration=epoch)
            task.logger.report_scalar("Loss",          "Val",   float(val_loss),   iteration=epoch)
            task.logger.report_scalar("Accuracy",      "Val",   float(val_acc),    iteration=epoch)
            task.logger.report_scalar("F1",            "Val",   float(val_f1),     iteration=epoch)
            task.logger.report_scalar("Learning Rate", "LR",    float(current_lr), iteration=epoch)
            task.logger.flush()

        marker = ""
        if val_f1 > best_val_f1:
            best_val_f1 = val_f1
            best_val_acc = val_acc
            torch.save(model.state_dict(), best_ckpt_path)
            marker = " *"

        print(
            f"{epoch:>6} | {train_loss:>10.4f} | {train_acc:>8.2%} | {val_loss:>10.4f} | "
            f"{val_acc:>8.2%} | {val_f1:>8.4f}{marker}"
        )

    print(f"\nBest validation F1: {best_val_f1:.4f} (accuracy at best F1: {best_val_acc:.2%})")
    print(f"Checkpoint saved to: {best_ckpt_path}")

    model.load_state_dict(torch.load(best_ckpt_path, weights_only=True))
    test_loss, test_acc, test_probs, test_preds, test_labels = model.test_step(test_loader, criterion, device)
    test_labels_np = np.asarray(test_labels)
    test_preds_np = np.asarray(test_preds)

    test_f1 = f1_score(test_labels_np, test_preds_np, average="weighted")
    if num_classes > 2:
        test_auc = roc_auc_score(test_labels_np, test_probs, multi_class="ovr", average="weighted")
    else:
        test_auc = roc_auc_score(test_labels_np, test_probs[:, 1])

    print(f"\n[TEST] Loss: {test_loss:.4f} | Accuracy: {test_acc:.2%}")
    print(f"[TEST] F1: {test_f1:.4f} | ROC-AUC: {test_auc:.4f}")

    history["test_loss"] = round(test_loss, 4)
    history["test_acc"] = round(test_acc, 4)
    history["test_f1"] = round(test_f1, 4)
    history["test_auc"] = round(test_auc, 4)

    # Dataset stats for ClearML
    train_labels = train_loader.dataset.labels.numpy()
    val_labels = val_loader.dataset.labels.numpy()
    dataset_stats = {
        "train_size": len(train_loader.dataset),
        "val_size": len(val_loader.dataset),
        "test_size": len(test_loader.dataset),
        "train_class_counts": np.bincount(train_labels, minlength=num_classes).tolist(),
        "val_class_counts": np.bincount(val_labels, minlength=num_classes).tolist(),
        "test_class_counts": np.bincount(test_labels_np, minlength=num_classes).tolist(),
    }
    history["dataset_stats"] = dataset_stats

    logs_dir = CFG["logs_dir"]
    os.makedirs(logs_dir, exist_ok=True)
    log_path = os.path.join(logs_dir, f"{CFG['model_name']}_training_log.json")
    with open(log_path, "w") as f:
        json.dump(history, f, indent=2)
    print(f"[LOG] Training history saved to: {log_path}")

    scaler_path = os.path.join(ckpt_dir, "scaler_mlp.joblib")
    joblib.dump(scaler, scaler_path)
    meta_path = os.path.join(ckpt_dir, "meta_mlp.npz")
    np.savez(meta_path, feature_names=np.array(SELECTED_FEATURES["face_orientation"]))
    print(f"[LOG] Scaler and meta saved to {ckpt_dir}")

    cm = confusion_matrix(test_labels_np, test_preds_np)
    pred_csv = os.path.join(logs_dir, f"{CFG['model_name']}_test_predictions.csv")
    with open(pred_csv, "w", newline="") as f:
        w = csv.writer(f)
        w.writerow(["y_true", "y_pred"] + [f"prob_{j}" for j in range(num_classes)])
        for i in range(len(test_labels_np)):
            w.writerow(
                [int(test_labels_np[i]), int(test_preds_np[i])]
                + [float(x) for x in test_probs[i]]
            )
    summary_path = os.path.join(logs_dir, f"{CFG['model_name']}_test_metrics_summary.json")
    with open(summary_path, "w", encoding="utf-8") as f:
        json.dump(
            {
                "model": "mlp",
                "model_name": CFG["model_name"],
                "checkpoint": os.path.basename(best_ckpt_path),
                "test_loss": history["test_loss"],
                "test_accuracy": history["test_acc"],
                "test_f1_weighted": history["test_f1"],
                "test_roc_auc": history["test_auc"],
                "confusion_matrix": cm.tolist(),
                "classification_report": classification_report(
                    test_labels_np, test_preds_np, digits=4
                ),
            },
            f,
            indent=2,
        )
    print(f"[LOG] Test predictions → {pred_csv}")

    # ClearML: artifacts, confusion matrix, per-class metrics, registered model
    if task is not None:
        from clearml import OutputModel
        from config.clearml_enrich import attach_output_metrics, task_done_summary

        task.upload_artifact(name="mlp_checkpoint", artifact_object=best_ckpt_path)
        task.upload_artifact(name="training_log", artifact_object=log_path)
        task.upload_artifact(name="test_predictions", artifact_object=pred_csv)
        task.upload_artifact(name="test_metrics_summary", artifact_object=summary_path)
        task.upload_artifact(name="scaler_mlp", artifact_object=scaler_path)
        task.upload_artifact(name="meta_mlp", artifact_object=meta_path)
        out_model = OutputModel(
            task=task, name=f"MLP_{CFG['model_name']}", framework="PyTorch"
        )
        out_model.update_weights(
            weights_filename=best_ckpt_path, auto_delete_file=False
        )
        attach_output_metrics(
            out_model,
            {
                "test_accuracy": round(float(test_acc), 6),
                "test_f1_weighted": round(float(test_f1), 6),
                "test_roc_auc": round(float(test_auc), 6),
            },
        )
        task_done_summary(
            task,
            f"MLP {CFG['model_name']}: test acc={test_acc:.4f}, F1={test_f1:.4f}, ROC-AUC={test_auc:.4f}",
        )
        task.logger.report_single_value("test/accuracy", test_acc)
        task.logger.report_single_value("test/f1_weighted", test_f1)
        task.logger.report_single_value("test/roc_auc", test_auc)
        for key, val in dataset_stats.items():
            if isinstance(val, list):
                for i, v in enumerate(val):
                    task.logger.report_single_value(f"dataset/{key}/{i}", float(v))
            else:
                task.logger.report_single_value(f"dataset/{key}", float(val))
        prec, rec, f1_per_class, _ = precision_recall_fscore_support(
            test_labels_np, test_preds_np, average=None, zero_division=0
        )
        for c in range(num_classes):
            task.logger.report_single_value(f"test/class_{c}_precision", float(prec[c]))
            task.logger.report_single_value(f"test/class_{c}_recall", float(rec[c]))
            task.logger.report_single_value(f"test/class_{c}_f1", float(f1_per_class[c]))
        import matplotlib
        matplotlib.use("Agg")
        import matplotlib.pyplot as plt
        fig, ax = plt.subplots(figsize=(6, 5))
        ax.imshow(cm, cmap="Blues")
        ax.set_xticks(range(num_classes))
        ax.set_yticks(range(num_classes))
        ax.set_xticklabels([f"Class {i}" for i in range(num_classes)])
        ax.set_yticklabels([f"Class {i}" for i in range(num_classes)])
        for i in range(num_classes):
            for j in range(num_classes):
                ax.text(j, i, str(cm[i, j]), ha="center", va="center", color="black")
        ax.set_xlabel("Predicted")
        ax.set_ylabel("True")
        ax.set_title("Test set confusion matrix")
        fig.tight_layout()
        task.logger.report_matplotlib_figure(title="Confusion Matrix", series="test", figure=fig, iteration=0)
        plt.close(fig)
        if num_classes == 2:
            fpr, tpr, _ = roc_curve(test_labels_np, test_probs[:, 1])
            fig_r, ax_r = plt.subplots(figsize=(6, 5))
            ax_r.plot(fpr, tpr, label=f"ROC-AUC = {test_auc:.4f}")
            ax_r.plot([0, 1], [0, 1], "k--", lw=1)
            ax_r.set_xlabel("False positive rate")
            ax_r.set_ylabel("True positive rate")
            ax_r.set_title("Test ROC (MLP)")
            ax_r.legend(loc="lower right")
            fig_r.tight_layout()
            task.logger.report_matplotlib_figure(
                title="ROC", series="test", figure=fig_r, iteration=0
            )
            plt.close(fig_r)
        task.logger.flush()


if __name__ == "__main__":
    main()