Angelo25
/

Filipino-Lexical-Normalization

@@ -2,21 +2,31 @@
 ---
 language: tl
 tags:
-  - text2text-generation
   - lexical-normalization
   - filipino
   - byt5
-pipeline_tag: text-generation
 ---
 # FiLex: Filipino Lexical Normalization (ByT5-base)
-Fine-tuned `google/byt5-base` for Filipino/Tagalog lexical normalization.
-Converts informal/noisy Filipino text (e.g. SMS, social media) into its canonical form.
 ## Usage
 ```python
-from transformers import pipeline
-pipe = pipeline("text2text-generation", model="Angelo25/filex-byt5-filipino-lexnorm")
-pipe("ang ganda nya po subra")
-```

 ---
 language: tl
 tags:
   - lexical-normalization
   - filipino
   - byt5
 ---
 # FiLex: Filipino Lexical Normalization (ByT5-base)
+Fine-tuned `google/byt5-base` model for Filipino/Tagalog lexical normalization.
+Converts informal/noisy Filipino text (e.g. SMS, social media) into normalized form.
 ## Usage
 ```python
+from transformers import AutoModelForSeq2SeqLM, AutoTokenizer
+import torch
+model = AutoModelForSeq2SeqLM.from_pretrained("Angelo25/Filipino-Lexical-Normalization")
+tokenizer = AutoTokenizer.from_pretrained("Angelo25/Filipino-Lexical-Normalization")
+model.eval()
+inputs = tokenizer("idol q tlaga yn", return_tensors="pt").to(model.device)
+output = model.generate(
+    **inputs,
+    max_new_tokens=inputs["input_ids"].shape[1] + 50,
+    num_beams=3,
+    early_stopping=True,
+    use_cache=True
+)
+print(tokenizer.decode(output[0], skip_special_tokens=True))