yeomtong
/

srl_bert_model

semantic-role-labeling

Model card Files Files and versions

yeomtong commited on Oct 23, 2025

Commit

5b38540

·

verified ·

1 Parent(s): f23ec2d

Update trainer.py

Files changed (1) hide show

trainer.py +4 -4

trainer.py CHANGED Viewed

@@ -213,14 +213,14 @@ if __name__ == "__main__":
     # 🧩 Tokenizer + data loading
     # ------------------------------
     tokenizer = AutoTokenizer.from_pretrained(replace_encoder_with or bert_name)
-    print(f"🔤 Using tokenizer: {replace_encoder_with or bert_name}")
-    print(f"📂 Loading French CoNLL data: {conll_train_path}")
     train_dataset, label2id, id2label = data_processing_for_loader_from_conll(
         conll_path=conll_train_path,
         tokenizer=tokenizer,
-        word_col_idx=3,
-        srl_first_col_idx=11,
     )
     pad_token_id = tokenizer.pad_token_id or tokenizer.eos_token_id

     # 🧩 Tokenizer + data loading
     # ------------------------------
     tokenizer = AutoTokenizer.from_pretrained(replace_encoder_with or bert_name)
+    print(f"Using tokenizer: {replace_encoder_with or bert_name}")
+    print(f"Loading multilingual CoNLL data: {conll_train_path}")
     train_dataset, label2id, id2label = data_processing_for_loader_from_conll(
         conll_path=conll_train_path,
         tokenizer=tokenizer,
+        word_col_idx=word_col_idx,
+        srl_first_col_idx=srl_first_col_idx,
     )
     pad_token_id = tokenizer.pad_token_id or tokenizer.eos_token_id