Spaces:

khurrambasharat
/

KB

Sleeping

khurrambasharat commited on Oct 22, 2025

Commit

2b64045

verified ·

1 Parent(s): f6e3c8e

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -11,10 +11,15 @@ import gradio as gr
 # ---- Load model and tokenizer ----
 model_name = "Mudasir692/mbart-eng-ur"
-# Fix config issue (early_stopping = None)
 config = AutoConfig.from_pretrained(model_name)
 if getattr(config, "early_stopping", None) is None:
     config.early_stopping = True
 tokenizer = MBart50TokenizerFast.from_pretrained(model_name, src_lang="en_XX", tgt_lang="ur_PK")
 model = MBartForConditionalGeneration.from_pretrained(model_name, config=config)
@@ -23,8 +28,14 @@ model = MBartForConditionalGeneration.from_pretrained(model_name, config=config)
 def translate_to_urdu(text):
     if not text.strip():
         return "Please enter some English text."
     inputs = tokenizer(text, return_tensors="pt", padding=True)
-    translated_tokens = model.generate(**inputs)
     urdu_output = tokenizer.decode(translated_tokens[0], skip_special_tokens=True)
     return urdu_output

 # ---- Load model and tokenizer ----
 model_name = "Mudasir692/mbart-eng-ur"
 config = AutoConfig.from_pretrained(model_name)
+# Fix missing or invalid parameters
 if getattr(config, "early_stopping", None) is None:
     config.early_stopping = True
+if getattr(config, "max_length", None) is None:
+    config.max_length = 128  # ✅ set a safe limit
+if getattr(config, "num_beams", None) is None:
+    config.num_beams = 4
 tokenizer = MBart50TokenizerFast.from_pretrained(model_name, src_lang="en_XX", tgt_lang="ur_PK")
 model = MBartForConditionalGeneration.from_pretrained(model_name, config=config)
 def translate_to_urdu(text):
     if not text.strip():
         return "Please enter some English text."
     inputs = tokenizer(text, return_tensors="pt", padding=True)
+    translated_tokens = model.generate(
+        **inputs,
+        max_length=128,        # ✅ explicitly set again
+        num_beams=4,
+        early_stopping=True
+    )
     urdu_output = tokenizer.decode(translated_tokens[0], skip_special_tokens=True)
     return urdu_output