Upload folder using huggingface_hub

Browse files

Files changed (6) hide show

20260228_014435/analysis_bundle/metrics/metrics.jsonl +5 -0
20260228_014435/analysis_bundle/predictions/final_eval_predictions.csv +0 -0
20260228_014435/analysis_bundle/predictions/final_eval_predictions_evalonly.csv +0 -0
20260228_014435/analysis_bundle/summaries/final_eval_summary.csv +2 -0
20260228_014435/analysis_bundle/summaries/final_eval_summary_evalonly.csv +2 -0
20260228_014435/analysis_bundle/summaries/summary.json +63 -0

20260228_014435/analysis_bundle/metrics/metrics.jsonl ADDED Viewed

	@@ -0,0 +1,5 @@

+{"epoch": 1, "train_loss": 0.10506527318134698, "acc": 0.8101659751037344, "f1": 0.767175572519084, "precision": 0.6294363256784968, "recall": 0.9820846905537459, "selection_score": 0.7186459505770489, "score": 0.7186459505770489}
+{"epoch": 2, "train_loss": 0.037222835986506865, "acc": 0.8739626556016598, "f1": 0.8311327310632384, "precision": 0.7248484848484849, "recall": 0.9739413680781759, "selection_score": 0.8076225068219838, "score": 0.8076225068219838}
+{"epoch": 3, "train_loss": 0.022125127010995397, "acc": 0.9190871369294605, "f1": 0.8763866877971473, "precision": 0.8533950617283951, "recall": 0.9006514657980456, "selection_score": 0.9083997716936347, "score": 0.9083997716936347}
+{"epoch": 4, "train_loss": 0.015069841979796758, "acc": 0.8895228215767634, "f1": 0.8486140724946695, "precision": 0.7528373266078184, "recall": 0.9723127035830619, "selection_score": 0.8329072028854942, "score": 0.8329072028854942}
+{"epoch": 5, "train_loss": 0.009131610291980716, "acc": 0.8926348547717843, "f1": 0.8503253796095445, "precision": 0.764629388816645, "recall": 0.9576547231270358, "selection_score": 0.8413797102182641, "score": 0.8413797102182641}

20260228_014435/analysis_bundle/predictions/final_eval_predictions.csv ADDED Viewed

The diff for this file is too large to render. See raw diff

20260228_014435/analysis_bundle/predictions/final_eval_predictions_evalonly.csv ADDED Viewed

The diff for this file is too large to render. See raw diff

20260228_014435/analysis_bundle/summaries/final_eval_summary.csv ADDED Viewed

	@@ -0,0 +1,2 @@


1	+ dataset,rows_evaluated,acc,f1,precision,recall,always_pick_acc,always_decline_acc
2	+ data_for_deberta/dedup_split/risk_val.csv,1928,0.9190871369294605,0.8763866877971473,0.8533950617283951,0.9006514657980456,0.3184647302904564,0.6815352697095436

20260228_014435/analysis_bundle/summaries/final_eval_summary_evalonly.csv ADDED Viewed

	@@ -0,0 +1,2 @@


1	+ run_dir,model_path,dataset,rows_raw,rows_evaluated,acc,f1,precision,recall,always_pick_acc,always_decline_acc
2	+ outputs/task1_binary_runs/20260228_014435,outputs/task1_binary_runs/20260228_014435/best_model.pt,data_for_deberta/dedup_split/risk_test.csv,2893,2893,0.908745247148289,0.8674698795180723,0.818957345971564,0.9220917822838848,0.3238852402350501,0.6761147597649498

20260228_014435/analysis_bundle/summaries/summary.json ADDED Viewed

	@@ -0,0 +1,63 @@

+{
+  "best_epoch": 3,
+  "best_score": 0.9083997716936347,
+  "best_selection_score": 0.9083997716936347,
+  "best_val_metrics_at_selection": {
+    "acc": 0.9190871369294605,
+    "f1": 0.8763866877971473,
+    "precision": 0.8533950617283951,
+    "recall": 0.9006514657980456
+  },
+  "model_selection": {
+    "metric": "recall-floor-constrained-fbeta",
+    "beta": 0.5,
+    "recall_floor": 0.9,
+    "recall_floor_penalty": 2.0,
+    "acc_weight": 0.05
+  },
+  "data_provenance": {
+    "train_csv": {
+      "path": "data_for_deberta/Risk-only-pick/task1_risk_training_20260225.csv",
+      "sha256_16": "0b22913a14eba047",
+      "size_bytes": 61730922,
+      "dataset_repo_id": "teru00801/New-Hawks-Data",
+      "dataset_file": "risk-only-pick/task1_risk_training_20260225.csv",
+      "hf_snapshot_revision": "4779fd5fec31f5f91f5a936be14e9c8f4ccd2030"
+    },
+    "val_csv_source": {
+      "path": "data_for_deberta/dedup_split/risk_val.csv",
+      "sha256_16": "75d6ac75345457d0",
+      "size_bytes": 6082107,
+      "dataset_repo_id": "teru00801/New-Hawks-Data",
+      "dataset_file": "dedup_split/risk_val.csv",
+      "hf_snapshot_revision": "4779fd5fec31f5f91f5a936be14e9c8f4ccd2030"
+    },
+    "final_eval_csv": {
+      "path": "data_for_deberta/dedup_split/risk_val.csv",
+      "sha256_16": "75d6ac75345457d0",
+      "size_bytes": 6082107,
+      "dataset_repo_id": "teru00801/New-Hawks-Data",
+      "dataset_file": "dedup_split/risk_val.csv",
+      "hf_snapshot_revision": "4779fd5fec31f5f91f5a936be14e9c8f4ccd2030"
+    }
+  },
+  "train_rows": 17394,
+  "val_rows": 1928,
+  "final_eval_rows": 1928,
+  "val_metrics": {
+    "acc": 0.9190871369294605,
+    "f1": 0.8763866877971473,
+    "precision": 0.8533950617283951,
+    "recall": 0.9006514657980456
+  },
+  "final_eval_metrics": {
+    "acc": 0.9190871369294605,
+    "f1": 0.8763866877971473,
+    "precision": 0.8533950617283951,
+    "recall": 0.9006514657980456
+  },
+  "final_eval_baseline": {
+    "always_pick_acc": 0.3184647302904564,
+    "always_decline_acc": 0.6815352697095436
+  }
+}