flopml
/

mingru

flpelerin commited on Nov 2, 2024

Commit

beb0496

verified ·

1 Parent(s): b2861d9

Update train.py

Files changed (1) hide show

train.py CHANGED Viewed

@@ -23,7 +23,7 @@ num_predict   = 250
 infer_every       = 100
 reset_state_every = 16
-validate_every    = 25  # Perform validation every 100 training steps
@@ -72,7 +72,7 @@ print(f"Dataset has {tokenized_datasets['train'].num_rows} rows of {batch_size}
 # ============================
 # Split Dataset into Train and Validation
 # ============================
-split_dataset = tokenized_datasets['train'].train_test_split(test_size=.001)
 train_dataset = split_dataset['train']
 valid_dataset = split_dataset['test']

 infer_every       = 100
 reset_state_every = 16
+validate_every    = 100  # Perform validation every 100 training steps
 # ============================
 # Split Dataset into Train and Validation
 # ============================
+split_dataset = tokenized_datasets['train'].train_test_split(test_size=(1/validate_every))
 train_dataset = split_dataset['train']
 valid_dataset = split_dataset['test']