Spaces:

Frenchizer
/

space_2

Build error

Frenchizer commited on Jan 25, 2025

Commit

36a1938

verified ·

1 Parent(s): 5ad0807

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -74,7 +74,7 @@ def detect_context(input_text, temperature=2.0, top_n=3, score_threshold=0.05):
     return top_contexts if top_contexts else ["general"]
 def translate_text(input_text):
-    tokenized_input = tokenizer(
         input_text, return_tensors="np",
         padding=True, truncation=True, max_length=512
     )
@@ -82,7 +82,7 @@ def translate_text(input_text):
     input_ids = tokenized_input["input_ids"].astype(np.int64)
     attention_mask = tokenized_input["attention_mask"].astype(np.int64)
-    decoder_start_token_id = tokenizer.cls_token_id or tokenizer.pad_token_id
     decoder_input_ids = np.array([[decoder_start_token_id]], dtype=np.int64)
     for _ in range(512):
@@ -101,10 +101,10 @@ def translate_text(input_text):
             [decoder_input_ids, np.array([[next_token_id]], dtype=np.int64)], axis=1
         )
-        if next_token_id == tokenizer.eos_token_id:
             break
-    return tokenizer.decode(decoder_input_ids[0], skip_special_tokens=True)
 def process_request(input_text):
     context = detect_context(input_text)

     return top_contexts if top_contexts else ["general"]
 def translate_text(input_text):
+    tokenized_input = translation_tokenizer(
         input_text, return_tensors="np",
         padding=True, truncation=True, max_length=512
     )
     input_ids = tokenized_input["input_ids"].astype(np.int64)
     attention_mask = tokenized_input["attention_mask"].astype(np.int64)
+    decoder_start_token_id = translation_tokenizer.cls_token_id or translation_tokenizer.pad_token_id
     decoder_input_ids = np.array([[decoder_start_token_id]], dtype=np.int64)
     for _ in range(512):
             [decoder_input_ids, np.array([[next_token_id]], dtype=np.int64)], axis=1
         )
+        if next_token_id == translation_tokenizer.eos_token_id:
             break
+    return translation_tokenizer.decode(decoder_input_ids[0], skip_special_tokens=True)
 def process_request(input_text):
     context = detect_context(input_text)