AbstractPhil commited on
Commit
cdce908
Β·
verified Β·
1 Parent(s): 0aba8e3

Update MODEL_SUMMARY.txt - Run 20251104_122236

Browse files
weights/David-partial_shared-geometric_attention/20251104_122236/MODEL_SUMMARY.txt CHANGED
@@ -3,26 +3,26 @@
3
  β•‘ DAVID MODEL SUMMARY β•‘
4
  ╠══════════════════════════════════════════════════════════════╣
5
  β•‘ β•‘
6
- β•‘ 🎯 VALIDATION ACCURACY: 77.60% β•‘
7
  β•‘ β•‘
8
  β•šβ•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•
9
 
10
  MODEL: David-partial_shared-geometric_attention
11
  RUN ID: 20251104_122236
12
- BEST EPOCH: 3/5
13
 
14
  ═══════════════════════════════════════════════════════════════
15
 
16
  πŸ“Š PERFORMANCE BREAKDOWN
17
 
18
- Final Training Accuracy: 81.77%
19
- Best Validation Accuracy: 77.60%
20
 
21
  Per-Scale Accuracies:
22
- β€’ Scale 256: 76.05%
23
- β€’ Scale 512: 77.07%
24
- β€’ Scale 768: 77.01%
25
- β€’ Scale 1024: 77.12%
26
 
27
  ═══════════════════════════════════════════════════════════════
28
 
@@ -43,17 +43,18 @@ Epoch | Train Acc | Val Acc | Learning Rate
43
  ------|-----------|----------|--------------
44
  1 | 71.75% | 76.11% | 9.76e-04
45
  2 | 79.74% | 77.02% | 9.05e-04
46
- 3 | 81.77% | 77.60% πŸ‘‘ | 7.94e-04
 
47
 
48
  ═══════════════════════════════════════════════════════════════
49
 
50
  πŸ“ FILES
51
 
52
- Best Model: best_model_acc77.60.safetensors
53
  Config: david_config.json
54
  Training Cfg: train_config.json
55
  History: training_history.json
56
 
57
  ═══════════════════════════════════════════════════════════════
58
 
59
- Generated: 2025-11-04 12:28:19
 
3
  β•‘ DAVID MODEL SUMMARY β•‘
4
  ╠══════════════════════════════════════════════════════════════╣
5
  β•‘ β•‘
6
+ β•‘ 🎯 VALIDATION ACCURACY: 77.89% β•‘
7
  β•‘ β•‘
8
  β•šβ•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•β•
9
 
10
  MODEL: David-partial_shared-geometric_attention
11
  RUN ID: 20251104_122236
12
+ BEST EPOCH: 4/5
13
 
14
  ═══════════════════════════════════════════════════════════════
15
 
16
  πŸ“Š PERFORMANCE BREAKDOWN
17
 
18
+ Final Training Accuracy: 83.44%
19
+ Best Validation Accuracy: 77.89%
20
 
21
  Per-Scale Accuracies:
22
+ β€’ Scale 256: 76.43%
23
+ β€’ Scale 512: 77.26%
24
+ β€’ Scale 768: 77.15%
25
+ β€’ Scale 1024: 77.40%
26
 
27
  ═══════════════════════════════════════════════════════════════
28
 
 
43
  ------|-----------|----------|--------------
44
  1 | 71.75% | 76.11% | 9.76e-04
45
  2 | 79.74% | 77.02% | 9.05e-04
46
+ 3 | 81.77% | 77.60% | 7.94e-04
47
+ 4 | 83.44% | 77.89% πŸ‘‘ | 6.55e-04
48
 
49
  ═══════════════════════════════════════════════════════════════
50
 
51
  πŸ“ FILES
52
 
53
+ Best Model: best_model_acc77.89.safetensors
54
  Config: david_config.json
55
  Training Cfg: train_config.json
56
  History: training_history.json
57
 
58
  ═══════════════════════════════════════════════════════════════
59
 
60
+ Generated: 2025-11-04 12:30:15