Spaces:

openenv-community
/

test-local-nested-envs

Running on T4

KarlLearnsAI Claude Sonnet 4.6 commited on Mar 8

Commit

434c6b1

1 Parent(s): faad7f2

Add train.sh startup script and assets folder

- train.sh: startup script for HF Spaces/Colab/Northflank that checks HF_TOKEN, installs train deps, and runs GRPO training
- assets/: placeholder folder for architecture diagram (architecture.jpg/png)

Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>

Files changed (2) hide show

assets/README.md +1 -0
train.sh +33 -0

assets/README.md ADDED Viewed

	@@ -0,0 +1 @@


1	+ # Drop architecture.jpg or architecture.png here

train.sh ADDED Viewed

	@@ -0,0 +1,33 @@

+#!/bin/bash
+# ============================================================
+# Training startup script for HF Spaces / Colab / Northflank
+#
+# Usage:
+#   ./train.sh                          # full run from config.yaml
+#   ./train.sh --steps 5 --episodes 3  # quick smoke test
+#   HF_TOKEN=hf_xxx ./train.sh         # with inline token
+# ============================================================
+set -e
+echo "============================================================"
+echo "  Nested RL Envs — GRPO Training"
+echo "  Team: Ludes Magnus"
+echo "============================================================"
+# Check HF_TOKEN
+if [ -z "$HF_TOKEN" ]; then
+    echo "ERROR: HF_TOKEN environment variable is not set."
+    echo "Set it via: export HF_TOKEN=hf_xxx"
+    exit 1
+fi
+# Install training dependencies if not already installed
+if ! python -c "import unsloth" 2>/dev/null; then
+    echo "Installing training dependencies..."
+    pip install -q -e ".[train]"
+fi
+# Run training
+echo "Starting GRPO training..."
+python -m layer1.train "$@"