SHK4K
/

hadith-segmentation-bert

Token Classification

hadith-separator

hadith_separator

Model card Files Files and versions

SHK4K commited on 9 days ago

Commit

41f8d77

·

verified ·

1 Parent(s): f92b565

Update README.md

Files changed (1) hide show

README.md +4 -4

README.md CHANGED Viewed

@@ -80,13 +80,13 @@ for token, pred_id in zip(input_tokens, predictions):
     label = id2label.get(pred_id, "O")
     if "SANAD" in label:
-        sanad_words.append(clean_token)
     elif "MATN" in label:
-        matn_words.append(clean_token)
 # Reconstruct clean component strings
-final_sanad = tokenizer.convert_tokens_to_string(sanad_words)
-final_matn = tokenizer.convert_tokens_to_string(matn_words)
 print("--- Extracted Components ---")
 print(f"SANAD: {final_sanad.strip()}\n")

     label = id2label.get(pred_id, "O")
     if "SANAD" in label:
+        sanad_tokens.append(token)
     elif "MATN" in label:
+        matn_tokens.append(token)
 # Reconstruct clean component strings
+final_sanad = tokenizer.convert_tokens_to_string(sanad_tokens)
+final_matn = tokenizer.convert_tokens_to_string(matn_tokens)
 print("--- Extracted Components ---")
 print(f"SANAD: {final_sanad.strip()}\n")