AbstractPhil
/

gated-david

Image Classification

feature-geometry

Eval Results (legacy)

Model card Files Files and versions

Metrics Training metrics Community

AbstractPhil commited on Oct 12, 2025

Commit

a841477

·

verified ·

1 Parent(s): e06f060

Update metrics - Run 20251012_065325

Files changed (1) hide show

best_model.json +25 -22

best_model.json CHANGED Viewed

@@ -1,36 +1,39 @@
 {
-  "model_name": "David-partial_shared-hierarchical_tree",
   "run_id": "20251012_065325",
-  "timestamp": "2025-10-12T07:35:40.795003",
-  "best_val_acc": 75.414,
-  "best_epoch": 9,
-  "final_train_acc": 87.91102174814056,
-  "final_train_loss": 1.3676543517615467,
   "scale_accuracies": {
-    "256": 74.794,
-    "512": 75.394,
-    "768": 75.398,
-    "1024": 73.42
   },
   "architecture": {
-    "preset": "balanced",
     "sharing_mode": "partial_shared",
-    "fusion_mode": "hierarchical_tree",
     "scales": [
       256,
       512,
       768,
-      1024
     ],
-    "feature_dim": 512,
     "num_classes": 1000,
     "use_belly": true,
-    "belly_expand": 2.0
   },
   "training": {
     "dataset": "AbstractPhil/imagenet-clip-features-orderly",
-    "model_variant": "clip_vit_laion_b32",
-    "num_epochs": 20,
     "batch_size": 1024,
     "learning_rate": 0.001,
     "rose_weight": "0.1\u21920.5",
@@ -39,10 +42,10 @@
     "scheduler": "cosine_restarts"
   },
   "files": {
-    "weights_safetensors": "weights/David-partial_shared-hierarchical_tree/20251012_065325/best_model.safetensors",
-    "weights_pytorch": "weights/David-partial_shared-hierarchical_tree/20251012_065325/best_model.pth",
-    "config": "weights/David-partial_shared-hierarchical_tree/20251012_065325/david_config.json",
-    "training_config": "weights/David-partial_shared-hierarchical_tree/20251012_065325/train_config.json",
-    "tensorboard": "runs/David-partial_shared-hierarchical_tree/20251012_065325/"
   }
 }

 {
+  "model_name": "David-partial_shared-deep_efficiency",
   "run_id": "20251012_065325",
+  "timestamp": "2025-10-12T07:38:25.221146",
+  "best_val_acc": 81.158,
+  "best_epoch": 0,
+  "final_train_acc": 78.10129358623817,
+  "final_train_loss": 1.346226876060041,
   "scale_accuracies": {
+    "256": 81.158
   },
   "architecture": {
+    "preset": "clip_vit_l14_ultra_deep",
     "sharing_mode": "partial_shared",
+    "fusion_mode": "deep_efficiency",
     "scales": [
       256,
       512,
       768,
+      1024,
+      1280,
+      1536,
+      1792,
+      2048,
+      2304,
+      2560
     ],
+    "feature_dim": 768,
     "num_classes": 1000,
     "use_belly": true,
+    "belly_expand": 3.0
   },
   "training": {
     "dataset": "AbstractPhil/imagenet-clip-features-orderly",
+    "model_variant": "clip_vit_l14",
+    "num_epochs": 10,
     "batch_size": 1024,
     "learning_rate": 0.001,
     "rose_weight": "0.1\u21920.5",
     "scheduler": "cosine_restarts"
   },
   "files": {
+    "weights_safetensors": "weights/David-partial_shared-deep_efficiency/20251012_065325/best_model.safetensors",
+    "weights_pytorch": "weights/David-partial_shared-deep_efficiency/20251012_065325/best_model.pth",
+    "config": "weights/David-partial_shared-deep_efficiency/20251012_065325/david_config.json",
+    "training_config": "weights/David-partial_shared-deep_efficiency/20251012_065325/train_config.json",
+    "tensorboard": "runs/David-partial_shared-deep_efficiency/20251012_065325/"
   }
 }