NeTSlab
/

gpt2-10M-parfind-eng

Model card Files Files and versions

achille-fusco commited on Aug 16, 2025

Commit

9c8a062

·

verified ·

1 Parent(s): c2760fe

Update config.json

Files changed (1) hide show

config.json +0 -10

config.json CHANGED Viewed

@@ -1,9 +1,4 @@
 {
-"tokenizer_dir": "/home/achille.fusco/pr_baby_lm/babyLM_2025/03-models/gpt2_ParFindFast_10M",
-"data_dir": "01-data",
-"train_glob": "*.train",
-"valid_glob": "*.valid",
-"output_dir": "03-models/gpt2_ParFindFast_10M",
 "datapoint_length" : 512,
 "training_type" : "strict_small",
 "n_epochs" : 10,
@@ -15,11 +10,6 @@
 "sft_learning_rate" : 0.00005,
 "gradient_clip_norm" : 1,
 "seed" : -1,
-"base_folder" : "03-models",
-"experiment_name" : "gpt2_ParFindFast_10M",
-"use_wandb" : false,
-"wandb_experiment_name" : "gpt2_ParFindFast",
-"wandb_project_name" : "BabyLM-2025",
 "tokenizer_class": "ParadigmTokenizerWrapper",
 "model_type": "gpt2",
 "vocab_size": 29215

 {
 "datapoint_length" : 512,
 "training_type" : "strict_small",
 "n_epochs" : 10,
 "sft_learning_rate" : 0.00005,
 "gradient_clip_norm" : 1,
 "seed" : -1,
 "tokenizer_class": "ParadigmTokenizerWrapper",
 "model_type": "gpt2",
 "vocab_size": 29215