stmasson
/

training-scripts

stmasson commited on Dec 26, 2025

Commit

d24b4ff

verified ·

1 Parent(s): 9d1096a

Upload scripts/train_alizee_v2_stage1_sft.py with huggingface_hub

Files changed (1) hide show

scripts/train_alizee_v2_stage1_sft.py CHANGED Viewed

@@ -119,11 +119,11 @@ print("\n📦 Loading datasets...")
 # 1. OpenCodeReasoning (reasoning traces)
 print("   Loading nvidia/OpenCodeReasoning split_0...")
-ocr_split0 = load_dataset("nvidia/OpenCodeReasoning", "split_0", split="train")
 print(f"   -> split_0: {len(ocr_split0)} samples")
 print("   Loading nvidia/OpenCodeReasoning split_1...")
-ocr_split1 = load_dataset("nvidia/OpenCodeReasoning", "split_1", split="train")
 print(f"   -> split_1: {len(ocr_split1)} samples")
 # Combine OpenCodeReasoning splits

 # 1. OpenCodeReasoning (reasoning traces)
 print("   Loading nvidia/OpenCodeReasoning split_0...")
+ocr_split0 = load_dataset("nvidia/OpenCodeReasoning", "split_0", split="split_0")
 print(f"   -> split_0: {len(ocr_split0)} samples")
 print("   Loading nvidia/OpenCodeReasoning split_1...")
+ocr_split1 = load_dataset("nvidia/OpenCodeReasoning", "split_1", split="split_1")
 print(f"   -> split_1: {len(ocr_split1)} samples")
 # Combine OpenCodeReasoning splits