s0close
/

medgemma-dsa-lora

@@ -1,18 +1,18 @@
 {
-  "timestamp": "2026-02-14T01:53:43.636745",
   "model": "google/medgemma-1.5-4b-it",
   "adapter_repo": "s0close/medgemma-dsa-lora",
   "dataset_repo": "s0close/medgemma-dsa-train",
   "training_samples": 432,
-  "epochs": 5,
-  "lr": 5e-05,
   "lora_r": 8,
   "lora_alpha": 16,
   "batch_size": 1,
   "grad_accum": 8,
   "max_seq_length": 1024,
-  "training_loss": 0.24104825404507144,
-  "training_time_seconds": 10942.718153715134,
   "compute_dtype": "bfloat16",
   "quantization": "4-bit NF4 double-quant",
   "environment": "hf_jobs"

 {
+  "timestamp": "2026-02-15T11:29:57.546067",
   "model": "google/medgemma-1.5-4b-it",
   "adapter_repo": "s0close/medgemma-dsa-lora",
   "dataset_repo": "s0close/medgemma-dsa-train",
   "training_samples": 432,
+  "epochs": 2,
+  "lr": 2e-05,
   "lora_r": 8,
   "lora_alpha": 16,
   "batch_size": 1,
   "grad_accum": 8,
   "max_seq_length": 1024,
+  "training_loss": 0.8743757631767679,
+  "training_time_seconds": 4394.945178031921,
   "compute_dtype": "bfloat16",
   "quantization": "4-bit NF4 double-quant",
   "environment": "hf_jobs"