AbstractPhil
/

gated-david

@@ -1,47 +1,32 @@
 {
-  "model_name": "David-partial_shared-deep_efficiency",
-  "run_id": "20251012_065325",
-  "timestamp": "2025-10-12T08:02:12.974571",
-  "best_val_acc": 83.098,
-  "best_epoch": 8,
-  "final_train_acc": 94.51960595301003,
-  "final_train_loss": 0.5892320626174299,
   "scale_accuracies": {
-    "256": 83.098,
-    "512": 83.24,
-    "768": 83.062,
-    "1024": 83.034,
-    "1280": 82.922,
-    "1536": 82.95,
-    "1792": 82.978,
-    "2048": 82.968,
-    "2304": 82.892
   },
   "architecture": {
-    "preset": "clip_vit_l14_ultra_deep",
-    "sharing_mode": "partial_shared",
-    "fusion_mode": "deep_efficiency",
     "scales": [
       256,
-      512,
-      768,
-      1024,
-      1280,
-      1536,
-      1792,
-      2048,
-      2304,
-      2560
     ],
-    "feature_dim": 768,
     "num_classes": 1000,
-    "use_belly": true,
-    "belly_expand": 3.0
   },
   "training": {
     "dataset": "AbstractPhil/imagenet-clip-features-orderly",
-    "model_variant": "clip_vit_l14",
-    "num_epochs": 10,
     "batch_size": 1024,
     "learning_rate": 0.001,
     "rose_weight": "0.1\u21920.5",
@@ -50,10 +35,10 @@
     "scheduler": "cosine_restarts"
   },
   "files": {
-    "weights_safetensors": "weights/David-partial_shared-deep_efficiency/20251012_065325/best_model.safetensors",
-    "weights_pytorch": "weights/David-partial_shared-deep_efficiency/20251012_065325/best_model.pth",
-    "config": "weights/David-partial_shared-deep_efficiency/20251012_065325/david_config.json",
-    "training_config": "weights/David-partial_shared-deep_efficiency/20251012_065325/train_config.json",
-    "tensorboard": "runs/David-partial_shared-deep_efficiency/20251012_065325/"
   }
 }

 {
+  "model_name": "David-fully_shared-weighted_sum",
+  "run_id": "20251012_132646",
+  "timestamp": "2025-10-12T13:30:05.861573",
+  "best_val_acc": 68.116,
+  "best_epoch": 0,
+  "final_train_acc": 63.375656725469824,
+  "final_train_loss": 5.58824692214259,
   "scale_accuracies": {
+    "256": 66.996,
+    "512": 67.958
   },
   "architecture": {
+    "preset": "small_fast",
+    "sharing_mode": "fully_shared",
+    "fusion_mode": "weighted_sum",
     "scales": [
       256,
+      512
     ],
+    "feature_dim": 512,
     "num_classes": 1000,
+    "use_belly": false,
+    "belly_expand": 2.0
   },
   "training": {
     "dataset": "AbstractPhil/imagenet-clip-features-orderly",
+    "model_variant": "clip_vit_laion_b32",
+    "num_epochs": 20,
     "batch_size": 1024,
     "learning_rate": 0.001,
     "rose_weight": "0.1\u21920.5",
     "scheduler": "cosine_restarts"
   },
   "files": {
+    "weights_safetensors": "weights/David-fully_shared-weighted_sum/20251012_132646/best_model.safetensors",
+    "weights_pytorch": "weights/David-fully_shared-weighted_sum/20251012_132646/best_model.pth",
+    "config": "weights/David-fully_shared-weighted_sum/20251012_132646/david_config.json",
+    "training_config": "weights/David-fully_shared-weighted_sum/20251012_132646/train_config.json",
+    "tensorboard": "runs/David-fully_shared-weighted_sum/20251012_132646/"
   }
 }