Upload meta/step_0012000.json with huggingface_hub

Browse files

Files changed (1) hide show

meta/step_0012000.json +66 -0

meta/step_0012000.json ADDED Viewed

	@@ -0,0 +1,66 @@

+{
+  "best_val_loss": 3.579233057796955,
+  "stream_offsets": {
+    "nvidia/Nemotron-Cascade-SFT-Stage-1/general/train": 46118,
+    "nvidia/Nemotron-Cascade-SFT-Stage-1/math/train": 46118,
+    "nvidia/Nemotron-Cascade-SFT-Stage-1/code/train": 46118,
+    "nvidia/Nemotron-Cascade-SFT-Stage-1/science/train": 46118,
+    "nvidia/Nemotron-Cascade-SFT-Stage-2/math/train": 46118,
+    "nvidia/Nemotron-Cascade-SFT-Stage-2/code/train": 46118,
+    "nvidia/Nemotron-Cascade-SFT-Stage-2/science/train": 46118,
+    "nvidia/Nemotron-Cascade-SFT-Stage-2/general/train": 46118,
+    "nvidia/Nemotron-Cascade-SFT-Stage-2/tool_calling/train": 46118,
+    "nvidia/Nemotron-Cascade-SFT-Stage-2/instruction-following/train": 46118,
+    "nvidia/Nemotron-Cascade-SFT-Stage-2/swe_repair/train": 46118,
+    "nvidia/Nemotron-Cascade-SFT-Stage-2/swe_localization/train": 46118,
+    "nvidia/Nemotron-Cascade-SFT-Stage-2/swe_testgen/train": 46118,
+    "nvidia/Nemotron-Cascade-2-SFT-Data/math/train": 46118,
+    "nvidia/Nemotron-Cascade-2-SFT-Data/science/train": 46118,
+    "nvidia/Nemotron-Cascade-2-SFT-Data/chat/train": 46118,
+    "nvidia/Nemotron-Cascade-2-SFT-Data/instruction_following/train": 46118,
+    "nvidia/Nemotron-Cascade-2-SFT-Data/safety/train": 7139,
+    "nvidia/Nemotron-Cascade-2-SFT-Data/conversational_agent/train": 46117,
+    "nvidia/Nemotron-Cascade-2-SFT-Data/swe/train": 46117,
+    "nvidia/Nemotron-Post-Training-Dataset-v1/default/chat": 46117,
+    "nvidia/Nemotron-Post-Training-Dataset-v1/default/code": 46117,
+    "nvidia/Nemotron-Post-Training-Dataset-v1/default/math": 46117,
+    "nvidia/Nemotron-Post-Training-Dataset-v1/default/stem": 46117,
+    "nvidia/Nemotron-Post-Training-Dataset-v1/default/tool_calling": 46117,
+    "nvidia/AceReason-1.1-SFT/default/train": 46117,
+    "nvidia/OpenMathInstruct-2/default/train": 46116,
+    "nvidia/OpenMathReasoning/default/cot": 46116,
+    "nvidia/OpenMathReasoning/default/tir": 46116,
+    "nvidia/OpenMathReasoning/default/genselect": 46116,
+    "nvidia/Nemotron-Math-v2/default/high_part00": 46116,
+    "nvidia/Nemotron-Math-v2/default/high_part01": 46116,
+    "nvidia/Nemotron-Math-v2/default/high_part02": 46116,
+    "nvidia/Nemotron-Math-v2/default/medium": 46116,
+    "nvidia/Nemotron-Math-v2/default/low": 46116,
+    "nvidia/Nemotron-SFT-Math-v3/default/train": 46116,
+    "nvidia/Nemotron-Research-GooseReason-0.7M/default/math": 0,
+    "nvidia/Nemotron-Research-GooseReason-0.7M/default/code": 0,
+    "nvidia/Nemotron-Research-GooseReason-0.7M/default/stem": 0,
+    "nvidia/OpenCodeGeneticInstruct/mixtral-8x22b-instruct/train": 46116,
+    "nvidia/OpenCodeGeneticInstruct/qwen2.5-32b-instruct/train": 46116,
+    "nvidia/OpenCodeReasoning/split_0/split_0": 46116,
+    "nvidia/OpenCodeReasoning/split_1/split_1": 46116,
+    "nvidia/Nemotron-Math-HumanReasoning/default/train": 499,
+    "nvidia/Nemotron-SFT-Agentic-v2/default/interactive_agent": 46116,
+    "nvidia/Nemotron-SFT-Agentic-v2/default/tool_calling": 0,
+    "nvidia/Nemotron-Instruction-Following-Chat-v1/default/chat_if": 46116,
+    "nvidia/Nemotron-Instruction-Following-Chat-v1/default/structured_outputs": 9937,
+    "nvidia/Nemotron-Competitive-Programming-v1/default/competitive_coding_python_part00": 46116,
+    "nvidia/Nemotron-Competitive-Programming-v1/default/competitive_coding_python_part01": 46116,
+    "nvidia/Nemotron-Competitive-Programming-v1/default/competitive_coding_cpp_part00": 46116,
+    "nvidia/Nemotron-Competitive-Programming-v1/default/competitive_coding_cpp_part01": 46116,
+    "nvidia/Nemotron-RL-Super-Training-Blends/default/rlvr1": 0
+  },
+  "avg_train_loss": 2.121121332168579,
+  "sft_step": 12000,
+  "timestamp": "2026-04-20 22:17:57",
+  "global_batch": 128,
+  "seq_len": 8192,
+  "lr_start": 5e-05,
+  "lr_min": 1e-06,
+  "vocab_size": 32777
+}