Spaces:

paascorb
/

question_answering_TFM

Runtime error

paascorb commited on Feb 14, 2023

Commit

3b2bf58

1 Parent(s): 2d452b4

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -26,6 +26,21 @@ else:
   dev = "cpu"
 device = torch.device(dev)
 def request_pathname(files):
     if files is None:
         return [[]]
@@ -51,27 +66,13 @@ def traducir_parrafos(parrafos, tokenizer, model, tam_bloque=8, ):
   return parrafos_traducidos
 def traducir_es_en(texto):
-    mname = "Helsinki-NLP/opus-mt-es-en"
-    tokenizer = MarianTokenizer.from_pretrained(mname)
-    model = MarianMTModel.from_pretrained(mname)
-    model.to(device)
-    lt = LineTokenizer()
-    batch_size = 8
     parrafos = lt.tokenize(texto)
-    par_tra = traducir_parrafos(parrafos, tokenizer, model)
     return "\n".join(par_tra)
 def traducir_en_es(texto):
-    mname = "Helsinki-NLP/opus-mt-en-es"
-    tokenizer = MarianTokenizer.from_pretrained(mname)
-    model = MarianMTModel.from_pretrained(mname)
-    model.to(device)
-    lt = LineTokenizer()
-    batch_size = 8
     parrafos = lt.tokenize(texto)
-    par_tra = traducir_parrafos(parrafos, tokenizer, model)
     return "\n".join(par_tra)
 def validate_dataset(dataset):
@@ -91,7 +92,6 @@ def do_ask(question, button, dataset):
             path = row['filepath']
             text = Path(f'{path}').read_text()
             text_en = traducir_es_en(text)
-            question_answerer = pipeline("question-answering", model='distilbert-base-cased-distilled-squad')
             QA_input = {
                 'question': traducir_es_en(question),
                 'context': text_en

   dev = "cpu"
 device = torch.device(dev)
+# Definimos los modelos:
+mname = "Helsinki-NLP/opus-mt-es-en"
+tokenizer_es_en = MarianTokenizer.from_pretrained(mname)
+model_es_en = MarianMTModel.from_pretrained(mname)
+model_es_en.to(device)
+mname = "Helsinki-NLP/opus-mt-en-es"
+tokenizer_en_es = MarianTokenizer.from_pretrained(mname)
+model_en_es = MarianMTModel.from_pretrained(mname)
+model_en_es.to(device)
+lt = LineTokenizer()
+question_answerer = pipeline("question-answering", model='distilbert-base-cased-distilled-squad')
 def request_pathname(files):
     if files is None:
         return [[]]
   return parrafos_traducidos
 def traducir_es_en(texto):
     parrafos = lt.tokenize(texto)
+    par_tra = traducir_parrafos(parrafos, tokenizer_es_en, model_es_en)
     return "\n".join(par_tra)
 def traducir_en_es(texto):
     parrafos = lt.tokenize(texto)
+    par_tra = traducir_parrafos(parrafos, tokenizer_en_es, model_en_es)
     return "\n".join(par_tra)
 def validate_dataset(dataset):
             path = row['filepath']
             text = Path(f'{path}').read_text()
             text_en = traducir_es_en(text)
             QA_input = {
                 'question': traducir_es_en(question),
                 'context': text_en