jnjj
/

xd_v1

@@ -23,14 +23,14 @@ The fully merged model weights and tokenizer are updated periodically at the roo
 - **Dynamic Dataset Source:** The script iterates through a wide array of Hugging Face Hub datasets.
 - **Rapid Iteration Strategy:** Training per dataset configuration is brief (`max_steps=1`), prioritizing breadth of exposure over depth on any single dataset.
 ## Training Progress
-- **Datasets Processed (Successfully trained on at least one config):** 8
-- **Text Examples Streamed (Total):** 48
-- **Tokens Processed (Total):** 24576
-- **Last Successful Model Update:** 2025-05-08 15:48:23 UTC
 ### Evaluation Snapshot (Approximate)
-- **Current Perplexity (wikitext Subset):** 284.44
-- **Perplexity Change:** `-0.02` ⬇️ (vs previous cycle's perplexity)
 #### Generated Examples (Qualitative Assessment)

 - **Dynamic Dataset Source:** The script iterates through a wide array of Hugging Face Hub datasets.
 - **Rapid Iteration Strategy:** Training per dataset configuration is brief (`max_steps=1`), prioritizing breadth of exposure over depth on any single dataset.
 ## Training Progress
+- **Datasets Processed (Successfully trained on at least one config):** 9
+- **Text Examples Streamed (Total):** 54
+- **Tokens Processed (Total):** 27648
+- **Last Successful Model Update:** 2025-05-08 15:50:02 UTC
 ### Evaluation Snapshot (Approximate)
+- **Current Perplexity (wikitext Subset):** 284.24
+- **Perplexity Change:** `-0.20` ⬇️ (vs previous cycle's perplexity)
 #### Generated Examples (Qualitative Assessment)