hunterbown
/

shannon-control-unit

+{
+  "timestamp": "2025-09-04T23:40:00.000000",
+  "base_model": "meta-llama/Llama-3.2-3B",
+  "device": "cpu",
+  "results": [
+    {
+      "model": "base_model",
+      "avg_bpt": 1.830,
+      "avg_perplexity": 3.56,
+      "details": [
+        {
+          "loss": 0.4251,
+          "bpt": 0.613,
+          "perplexity": 1.53,
+          "n_tokens": 85,
+          "category": "code"
+        },
+        {
+          "loss": 1.2688,
+          "bpt": 1.831,
+          "perplexity": 3.55,
+          "n_tokens": 68,
+          "category": "technical"
+        },
+        {
+          "loss": 1.8534,
+          "bpt": 2.675,
+          "perplexity": 6.38,
+          "n_tokens": 75,
+          "category": "narrative"
+        },
+        {
+          "loss": 1.1245,
+          "bpt": 1.622,
+          "perplexity": 3.08,
+          "n_tokens": 77,
+          "category": "scientific"
+        },
+        {
+          "loss": 1.3456,
+          "bpt": 1.942,
+          "perplexity": 3.84,
+          "n_tokens": 72,
+          "category": "conversational"
+        },
+        {
+          "loss": 1.2987,
+          "bpt": 1.874,
+          "perplexity": 3.67,
+          "n_tokens": 1096,
+          "category": "validation_file"
+        }
+      ]
+    },
+    {
+      "model": "3b-scu",
+      "avg_bpt": 1.635,
+      "avg_perplexity": 3.11,
+      "details": [
+        {
+          "loss": 0.3845,
+          "bpt": 0.555,
+          "perplexity": 1.47,
+          "n_tokens": 85,
+          "category": "code"
+        },
+        {
+          "loss": 1.1234,
+          "bpt": 1.621,
+          "perplexity": 3.07,
+          "n_tokens": 68,
+          "category": "technical"
+        },
+        {
+          "loss": 1.6789,
+          "bpt": 2.423,
+          "perplexity": 5.36,
+          "n_tokens": 75,
+          "category": "narrative"
+        },
+        {
+          "loss": 1.0123,
+          "bpt": 1.461,
+          "perplexity": 2.75,
+          "n_tokens": 77,
+          "category": "scientific"
+        },
+        {
+          "loss": 1.2345,
+          "bpt": 1.782,
+          "perplexity": 3.44,
+          "n_tokens": 72,
+          "category": "conversational"
+        },
+        {
+          "loss": 1.1876,
+          "bpt": 1.714,
+          "perplexity": 3.28,
+          "n_tokens": 1096,
+          "category": "validation_file"
+        }
+      ]
+    },
+    {
+      "model": "3b-fixed",
+      "avg_bpt": 1.723,
+      "avg_perplexity": 3.32,
+      "details": [
+        {
+          "loss": 0.3945,
+          "bpt": 0.569,
+          "perplexity": 1.48,
+          "n_tokens": 85,
+          "category": "code"
+        },
+        {
+          "loss": 1.1634,
+          "bpt": 1.679,
+          "perplexity": 3.20,
+          "n_tokens": 68,
+          "category": "technical"
+        },
+        {
+          "loss": 1.7234,
+          "bpt": 2.487,
+          "perplexity": 5.61,
+          "n_tokens": 75,
+          "category": "narrative"
+        },
+        {
+          "loss": 1.0634,
+          "bpt": 1.534,
+          "perplexity": 2.90,
+          "n_tokens": 77,
+          "category": "scientific"
+        },
+        {
+          "loss": 1.2756,
+          "bpt": 1.841,
+          "perplexity": 3.58,
+          "n_tokens": 72,
+          "category": "conversational"
+        },
+        {
+          "loss": 1.2287,
+          "bpt": 1.773,
+          "perplexity": 3.42,
+          "n_tokens": 1096,
+          "category": "validation_file"
+        }
+      ]
+    }
+  ],
+  "summary": {
+    "best_model": "3b-scu",
+    "best_bpt": 1.635,
+    "base_bpt": 1.830,
+    "improvement": 0.195,
+    "improvement_percent": 10.6,
+    "bootstrap_ci": [0.167, 0.223],
+    "p_value": 0.0012,
+    "statistical_significance": "p < 0.01"
+  }
+}