Epoch 1 | Files 1 | Loss 5.8903

Files changed (5) hide show

config.json CHANGED Viewed

@@ -29,7 +29,7 @@
   },
   "rope_theta": 500000.0,
   "tie_word_embeddings": true,
-  "transformers_version": "4.57.1",
   "use_cache": true,
   "vocab_size": 128263
 }

   },
   "rope_theta": 500000.0,
   "tie_word_embeddings": true,
+  "transformers_version": "4.57.3",
   "use_cache": true,
   "vocab_size": 128263
 }

generation_config.json CHANGED Viewed

@@ -5,5 +5,5 @@
   "eos_token_id": 128001,
   "temperature": 0.6,
   "top_p": 0.9,
-  "transformers_version": "4.57.1"
 }

   "eos_token_id": 128001,
   "temperature": 0.6,
   "top_p": 0.9,
+  "transformers_version": "4.57.3"
 }

model-00001-of-00002.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f2cafd5ae6a487404d64fb6582161bb6d7b226008d8b0397bb0b002f854d9479
 size 4965842104

 version https://git-lfs.github.com/spec/v1
+oid sha256:3f39e991bc53c44b804e11c5f1e3e78581ac8e33c0850d3aa875f1e1e79bb9c3
 size 4965842104

model-00002-of-00002.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:06f762b7274769a7fa66579ebf1508962e3963066edb7a6cd476f7b00d2ee35b
 size 1459729952

 version https://git-lfs.github.com/spec/v1
+oid sha256:abb2bd284e95c478cdac7468196656367a6793572ce14e297ca3d4f5d1510fc1
 size 1459729952

training_metadata.json CHANGED Viewed

@@ -1,11 +1,12 @@
 {
   "epoch": 1,
-  "files_processed": 64,
-  "total_files": 147,
-  "last_file_index": 63,
-  "avg_loss": 4.358400179250431,
-  "learning_rate": 5e-06,
   "model_name": "meta-llama/Llama-3.2-3B",
   "processed_files": [],
-  "timestamp": "2025-11-28T22:47:58.299442"
 }

 {
   "epoch": 1,
+  "files_processed": 1,
+  "total_files": 197,
+  "last_file_index": 0,
+  "avg_loss": 5.890276033549327,
+  "learning_rate": 2e-06,
   "model_name": "meta-llama/Llama-3.2-3B",
+  "training_run_id": "v2_gentle_retrain",
   "processed_files": [],
+  "timestamp": "2025-12-19T17:12:51.453734"
 }