TranslateGradio

Running

App Files Files Community

TiberiuCristianLeon commited on Feb 15

Commit

24eee5b

verified ·

1 Parent(s): e7a8f80

Update translators.py

Browse files

Files changed (1) hide show

translators.py +12 -13

translators.py CHANGED Viewed

@@ -13,7 +13,7 @@ class Translators:
         return response.json()[0][0][0]
     def riva4B11(self):
-        set language_pairs = {
           'en-zh-cn': {'source': 'English', 'target': 'Simplified Chinese'},
           'en-zh': {'source': 'English', 'target': 'Simplified Chinese'},
           'en-zh-tw': {'source': 'English', 'target': 'Traditional Chinese'},
@@ -43,30 +43,29 @@ class Translators:
           'pt-en': {'source': 'Brazilian Portuguese', 'target': 'English'},
           'pt-br-en': {'source': 'Brazilian Portuguese', 'target': 'English'},
         }
-        tokenizer = AutoTokenizer.from_pretrained(self.model)
-        model = AutoModelForCausalLM.from_pretrained(self.model,
                 torch_dtype="auto", device_map="auto")
         # Use the prompt template (along with chat template)
-        messages = [
-            {
                 "role": "system",
                 "content": f"{self.sl}-{self.tl}",
             },
-            {"role": "user", "content": self.input,
-         ]
         tokenized_chat = tokenizer.apply_chat_template(messages, tokenize=True, add_generation_prompt=True, return_tensors="pt").to(model.device)
-        outputs = model.generate(tokenized_chat,  max_new_tokens=128, pad_token_id=tokenizer.eos_token_id)
-        return tokenizer.decode(outputs[0]))
     def translategemma(self):
         from huggingface_hub import login
-        login(token=os.environ.get("HF_TOKEN"))
         pipe = pipeline(
             "image-text-to-text",
             model = "google/translategemma-4b-it",
             device = self.device,
-            dtype = torch.bfloat16
-        )
         # ---- Text Translation ----
         messages = [
             {
@@ -555,4 +554,4 @@ class Translators:
             message_text = f"Translated from {sl} to {tl} with Bergamot {model_name}."
         except Exception as error:
             response = error
-        return translated_text, message_text

         return response.json()[0][0][0]
     def riva4B11(self):
+        language_pairs = {
           'en-zh-cn': {'source': 'English', 'target': 'Simplified Chinese'},
           'en-zh': {'source': 'English', 'target': 'Simplified Chinese'},
           'en-zh-tw': {'source': 'English', 'target': 'Traditional Chinese'},
           'pt-en': {'source': 'Brazilian Portuguese', 'target': 'English'},
           'pt-br-en': {'source': 'Brazilian Portuguese', 'target': 'English'},
         }
+        tokenizer = AutoTokenizer.from_pretrained(self.model_name)
+        model = AutoModelForCausalLM.from_pretrained(self.model_name,
                 torch_dtype="auto", device_map="auto")
         # Use the prompt template (along with chat template)
+        messages = [{
                 "role": "system",
                 "content": f"{self.sl}-{self.tl}",
             },
+            {"role": "user", "content": self.input_text}]
         tokenized_chat = tokenizer.apply_chat_template(messages, tokenize=True, add_generation_prompt=True, return_tensors="pt").to(model.device)
+        outputs = model.generate(tokenized_chat,  max_new_tokens=self.max_new_tokens, pad_token_id=tokenizer.eos_token_id)
+        return tokenizer.decode(outputs[0]).split('<s>Assistant')[1].strip().removesuffix('</s>')
     def translategemma(self):
         from huggingface_hub import login
+        hftoken=os.environ.get("HF_TOKEN")
+        login(token=hftoken)
         pipe = pipeline(
             "image-text-to-text",
             model = "google/translategemma-4b-it",
             device = self.device,
+            dtype = torch.bfloat16,
+            token=hftoken)
         # ---- Text Translation ----
         messages = [
             {
             message_text = f"Translated from {sl} to {tl} with Bergamot {model_name}."
         except Exception as error:
             response = error
+        return translated_text, message_text