🔄 Incremental importance | Acc: 0.875, F1: 0.630

Browse files

Files changed (10) hide show

README.md +9 -9
{checkpoint-74 → checkpoint-26}/config.json +0 -0
{checkpoint-74 → checkpoint-26}/model.safetensors +1 -1
{checkpoint-74 → checkpoint-26}/special_tokens_map.json +0 -0
{checkpoint-74 → checkpoint-26}/tokenizer.json +0 -0
{checkpoint-74 → checkpoint-26}/tokenizer_config.json +0 -0
{checkpoint-74 → checkpoint-26}/trainer_state.json +38 -73
{checkpoint-74 → checkpoint-26}/vocab.txt +0 -0
model.safetensors +1 -1
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -21,19 +21,19 @@ Fine-tuned FinBERT model for financial importance analysis in TradePulse.
 ## Performance
-*Last training: 2025-07-28 12:28*
-*Dataset: `news_20250728.csv` (198 samples)*
 | Metric | Value |
 |--------|-------|
-| Loss | 1.6054 |
-| Accuracy | 0.6800 |
-| F1 Score | 0.6670 |
-| F1 Macro | 0.6670 |
-| Precision | 0.6550 |
-| Recall | 0.6800 |
 ## Training Details
@@ -65,4 +65,4 @@ predictions = outputs.logits.softmax(dim=-1)
 ## Model Card Authors
 - TradePulse ML Team
-- Auto-generated on 2025-07-28 12:28:07

 ## Performance
+*Last training: 2025-07-28 15:51*
+*Dataset: `news_20250728.csv` (69 samples)*
 | Metric | Value |
 |--------|-------|
+| Loss | 1.3768 |
+| Accuracy | 0.6667 |
+| F1 Score | 0.6667 |
+| F1 Macro | 0.6667 |
+| Precision | 0.6875 |
+| Recall | 0.6667 |
 ## Training Details
 ## Model Card Authors
 - TradePulse ML Team
+- Auto-generated on 2025-07-28 15:51:43

{checkpoint-74 → checkpoint-26}/config.json RENAMED Viewed

File without changes

{checkpoint-74 → checkpoint-26}/model.safetensors RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6996a8e10bb5c621690403f08209675c901b0806626ed1a43deef422b1ba295c
 size 439039996

 version https://git-lfs.github.com/spec/v1
+oid sha256:bbd23a14b45d9cd08acbf9b971d434497ee11ca489570b7ce552089c6312fda4
 size 439039996

{checkpoint-74 → checkpoint-26}/special_tokens_map.json RENAMED Viewed

File without changes

{checkpoint-74 → checkpoint-26}/tokenizer.json RENAMED Viewed

File without changes

{checkpoint-74 → checkpoint-26}/tokenizer_config.json RENAMED Viewed

File without changes

{checkpoint-74 → checkpoint-26}/trainer_state.json RENAMED Viewed

@@ -1,95 +1,60 @@
 {
-  "best_metric": 0.6669565217391304,
-  "best_model_checkpoint": "hf-importance-production/checkpoint-74",
   "epoch": 2.0,
   "eval_steps": 500,
-  "global_step": 74,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
-      "epoch": 0.2702702702702703,
-      "grad_norm": 56.3042106628418,
-      "learning_rate": 2.702702702702703e-06,
-      "loss": 5.102,
       "step": 10
     },
-    {
-      "epoch": 0.5405405405405406,
-      "grad_norm": 129.203857421875,
-      "learning_rate": 5.405405405405406e-06,
-      "loss": 2.4752,
-      "step": 20
-    },
-    {
-      "epoch": 0.8108108108108109,
-      "grad_norm": 48.63685607910156,
-      "learning_rate": 8.108108108108109e-06,
-      "loss": 1.0702,
-      "step": 30
-    },
     {
       "epoch": 1.0,
-      "eval_accuracy": 0.68,
-      "eval_f1": 0.6557491289198606,
-      "eval_f1_macro": 0.4657375145180023,
-      "eval_loss": 1.8875879049301147,
-      "eval_precision": 0.6963235294117647,
-      "eval_precision_macro": 0.48774509803921573,
-      "eval_recall": 0.68,
-      "eval_recall_macro": 0.48969696969696974,
-      "eval_runtime": 27.5867,
-      "eval_samples_per_second": 1.812,
-      "eval_steps_per_second": 0.471,
-      "step": 37
-    },
-    {
-      "epoch": 1.0810810810810811,
-      "grad_norm": 17.976032257080078,
-      "learning_rate": 9.189189189189191e-06,
-      "loss": 1.4028,
-      "step": 40
-    },
-    {
-      "epoch": 1.3513513513513513,
-      "grad_norm": 84.75708770751953,
-      "learning_rate": 6.486486486486487e-06,
-      "loss": 0.4445,
-      "step": 50
     },
     {
-      "epoch": 1.6216216216216215,
-      "grad_norm": 0.7481099367141724,
-      "learning_rate": 3.7837837837837844e-06,
-      "loss": 1.5709,
-      "step": 60
-    },
-    {
-      "epoch": 1.8918918918918919,
-      "grad_norm": 24.998336791992188,
-      "learning_rate": 1.0810810810810812e-06,
-      "loss": 1.1979,
-      "step": 70
     },
     {
       "epoch": 2.0,
-      "eval_accuracy": 0.68,
-      "eval_f1": 0.6669565217391304,
-      "eval_f1_macro": 0.4707246376811594,
-      "eval_loss": 1.6054034233093262,
-      "eval_precision": 0.655,
-      "eval_precision_macro": 0.46166666666666667,
-      "eval_recall": 0.68,
-      "eval_recall_macro": 0.48060606060606065,
-      "eval_runtime": 27.5219,
-      "eval_samples_per_second": 1.817,
-      "eval_steps_per_second": 0.472,
-      "step": 74
     }
   ],
   "logging_steps": 10,
-  "max_steps": 74,
   "num_input_tokens_seen": 0,
   "num_train_epochs": 2,
   "save_steps": 500,
@@ -114,7 +79,7 @@
       "attributes": {}
     }
   },
-  "total_flos": 77881571647488.0,
   "train_batch_size": 4,
   "trial_name": null,
   "trial_params": null

 {
+  "best_metric": 0.6666666666666666,
+  "best_model_checkpoint": "hf-importance-production/checkpoint-26",
   "epoch": 2.0,
   "eval_steps": 500,
+  "global_step": 26,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
+      "epoch": 0.7692307692307693,
+      "grad_norm": 121.2413101196289,
+      "learning_rate": 8.333333333333334e-06,
+      "loss": 1.8267,
       "step": 10
     },
     {
       "epoch": 1.0,
+      "eval_accuracy": 0.6666666666666666,
+      "eval_f1": 0.6277777777777778,
+      "eval_f1_macro": 0.47142857142857136,
+      "eval_loss": 1.476554274559021,
+      "eval_precision": 0.5959595959595959,
+      "eval_precision_macro": 0.45021645021645024,
+      "eval_recall": 0.6666666666666666,
+      "eval_recall_macro": 0.4973544973544974,
+      "eval_runtime": 9.9767,
+      "eval_samples_per_second": 1.804,
+      "eval_steps_per_second": 0.501,
+      "step": 13
     },
     {
+      "epoch": 1.5384615384615383,
+      "grad_norm": 50.985260009765625,
+      "learning_rate": 4.2857142857142855e-06,
+      "loss": 1.3106,
+      "step": 20
     },
     {
       "epoch": 2.0,
+      "eval_accuracy": 0.6666666666666666,
+      "eval_f1": 0.6666666666666666,
+      "eval_f1_macro": 0.6666666666666666,
+      "eval_loss": 1.3767714500427246,
+      "eval_precision": 0.6875,
+      "eval_precision_macro": 0.7638888888888888,
+      "eval_recall": 0.6666666666666666,
+      "eval_recall_macro": 0.626984126984127,
+      "eval_runtime": 9.9856,
+      "eval_samples_per_second": 1.803,
+      "eval_steps_per_second": 0.501,
+      "step": 26
     }
   ],
   "logging_steps": 10,
+  "max_steps": 26,
   "num_input_tokens_seen": 0,
   "num_train_epochs": 2,
   "save_steps": 500,
       "attributes": {}
     }
   },
+  "total_flos": 26837568608256.0,
   "train_batch_size": 4,
   "trial_name": null,
   "trial_params": null

{checkpoint-74 → checkpoint-26}/vocab.txt RENAMED Viewed

File without changes

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6996a8e10bb5c621690403f08209675c901b0806626ed1a43deef422b1ba295c
 size 439039996

 version https://git-lfs.github.com/spec/v1
+oid sha256:bbd23a14b45d9cd08acbf9b971d434497ee11ca489570b7ce552089c6312fda4
 size 439039996

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3b061dbe96085bccc3c91f3751222bd984561b8f688f02aae26349205f0e29f8
 size 5521

 version https://git-lfs.github.com/spec/v1
+oid sha256:f33aecfc0c34e2165650f021afc9b4f8e6eff55ec7fdd9180d37e644b7455d4b
 size 5521