AbstractPhil
/

gated-david

@@ -1,44 +1,36 @@
 {
-  "model_name": "David-partial_shared-deep_efficiency",
-  "run_id": "20251012_181608",
-  "timestamp": "2025-10-12T18:49:29.551461",
-  "best_val_acc": 84.726,
-  "best_epoch": 2,
-  "final_train_acc": 96.34231915121136,
-  "final_train_loss": 0.356455498800491,
   "scale_accuracies": {
-    "384": 84.386,
-    "512": 84.67,
-    "768": 84.52,
-    "1024": 84.71,
-    "1280": 84.726,
-    "1536": 84.566,
-    "1792": 84.584,
-    "2048": 84.59
   },
   "architecture": {
-    "preset": "clip_vit_bigg14",
     "sharing_mode": "partial_shared",
-    "fusion_mode": "deep_efficiency",
     "scales": [
-      384,
       512,
       768,
-      1024,
-      1280,
-      1536,
-      1792,
-      2048
     ],
-    "feature_dim": 1280,
     "num_classes": 1000,
     "use_belly": true,
     "belly_expand": 2.0
   },
   "training": {
     "dataset": "AbstractPhil/imagenet-clip-features-orderly",
-    "model_variant": "clip_vit_laion_bigg14",
-    "num_epochs": 10,
     "batch_size": 1024,
     "learning_rate": 0.001,
     "rose_weight": "0.1\u21920.5",
@@ -47,10 +39,10 @@
     "scheduler": "cosine_restarts"
   },
   "files": {
-    "weights_safetensors": "weights/David-partial_shared-deep_efficiency/20251012_181608/best_model_acc84.73.safetensors",
-    "weights_pytorch": "weights/David-partial_shared-deep_efficiency/20251012_181608/best_model.pth",
-    "config": "weights/David-partial_shared-deep_efficiency/20251012_181608/david_config.json",
-    "training_config": "weights/David-partial_shared-deep_efficiency/20251012_181608/train_config.json",
-    "tensorboard": "runs/David-partial_shared-deep_efficiency/20251012_181608/"
   }
 }

 {
+  "model_name": "David-partial_shared-geometric_attention",
+  "run_id": "20251104_122236",
+  "timestamp": "2025-11-04T12:24:29.877506",
+  "best_val_acc": 76.112,
+  "best_epoch": 0,
+  "final_train_acc": 71.75278476576433,
+  "final_train_loss": 3.1981250359989204,
   "scale_accuracies": {
+    "256": 74.25,
+    "512": 75.164,
+    "768": 75.256,
+    "1024": 75.82
   },
   "architecture": {
+    "preset": "clip_vit_b16_geometric",
     "sharing_mode": "partial_shared",
+    "fusion_mode": "geometric_attention",
     "scales": [
+      256,
       512,
       768,
+      1024
     ],
+    "feature_dim": 512,
     "num_classes": 1000,
     "use_belly": true,
     "belly_expand": 2.0
   },
   "training": {
     "dataset": "AbstractPhil/imagenet-clip-features-orderly",
+    "model_variant": "clip_vit_b16",
+    "num_epochs": 5,
     "batch_size": 1024,
     "learning_rate": 0.001,
     "rose_weight": "0.1\u21920.5",
     "scheduler": "cosine_restarts"
   },
   "files": {
+    "weights_safetensors": "weights/David-partial_shared-geometric_attention/20251104_122236/best_model_acc76.11.safetensors",
+    "weights_pytorch": "weights/David-partial_shared-geometric_attention/20251104_122236/best_model.pth",
+    "config": "weights/David-partial_shared-geometric_attention/20251104_122236/david_config.json",
+    "training_config": "weights/David-partial_shared-geometric_attention/20251104_122236/train_config.json",
+    "tensorboard": "runs/David-partial_shared-geometric_attention/20251104_122236/"
   }
 }