Spaces:

LoloSemper
/

Spanish_NeoIberian_Translator3

Build error

App Files Files Community

LoloSemper commited on Oct 21, 2025

Commit

9975c9a

verified ·

1 Parent(s): 3f5119f

Update app.py

Browse files

Files changed (1) hide show

app.py +10 -10

app.py CHANGED Viewed

@@ -1,5 +1,5 @@
 # app.py – ES→NI con mejoras en detección morfológica y pipeline
-# Versión 2.2 con afinación completa y mejoras finales
 import gradio as gr
 import os, csv, re, base64, unicodedata
@@ -478,9 +478,9 @@ TRIDOT = "/"
 VISIBLE_PUNCT = set(",.;:…()[]{}\"'«»——""''")
 HARD_BOUND = {".",";","—","—",":","(",")","«","»",""",""","'","'"}  # límites de cláusula fuertes
-def render_ib_with_tridots(tokens):
     res=[]; prev_word=False
-    for tk in tokens:
         is_punct = tk in VISIBLE_PUNCT
         if is_punct:
             res.append(" "+tk+" "); prev_word=False
@@ -530,9 +530,9 @@ def is_wh_token(t: str) -> bool:
     return f in {"que","quien","quienes","cual","cuales","donde","cuando","como","cuanto","cuanta","cuantos","cuantas"}
 # FIX: el detector WH ignora WH dentro de paréntesis y comillas tipográficas
-def has_wh_outside_parens(tokens) -> bool:
     depth = 0
-    for tk in tokens:
         if tk in {"(", "«", """, "'"}:
             depth += 1
         elif tk in {")", "»", """, "'"}:
@@ -560,12 +560,12 @@ def rule_a(prev_tok:str, token:str, next_tok:str)->str:
 ESTAR_SET={"estoy","estás","está","estamos","estáis","están","estaba","estabas","estábamos","estabais","estaban"}
 HABER_SET={"he","has","ha","hemos","habéis","han","había","habías","habíamos","habíais","habían"}
-def detect_tam_with_context(tokens, i, sentence_start=False):
-    """Versión mejorada con análisis contextual profundo"""
     t=toks[i].lower()
     prev=toks[i-1].lower() if i>0 else ""
     prev2=toks[i-2].lower() if i>1 else ""
-    nxt=toks[i+1].lower() if i+1<len(tokens) else ""
     # Primero usar detección morfológica mejorada
     tag=es_morph_tag(t)
@@ -672,7 +672,7 @@ def normalize_surface_by_pos(ni_surface:str, pos:str) -> str:
     return ni_surface
 def translate_sentence(sent:str):
-    """Pipeline mejorado con detección contextual y manejo de imperativos"""
     toks = tokenize_es(normalize_es(sent))
     out_words = []      # palabras en ni (latín)
@@ -719,7 +719,7 @@ def translate_sentence(sent:str):
         # pipeline normal
         low = t.lower()
         prev = toks[i-1].lower() if i>0 else ""
-        nxt  = toks[i+1].lower() if i+1<len(tokens) else ""
         # === DETECCIÓN MEJORADA ===
         # Detectar imperativo por contexto de inicio o por clíticos

 # app.py – ES→NI con mejoras en detección morfológica y pipeline
+# Versión 2.2 con afinación completa y mejoras finales - CORREGIDO
 import gradio as gr
 import os, csv, re, base64, unicodedata
 VISIBLE_PUNCT = set(",.;:…()[]{}\"'«»——""''")
 HARD_BOUND = {".",";","—","—",":","(",")","«","»",""",""","'","'"}  # límites de cláusula fuertes
+def render_ib_with_tridots(toks):
     res=[]; prev_word=False
+    for tk in toks:
         is_punct = tk in VISIBLE_PUNCT
         if is_punct:
             res.append(" "+tk+" "); prev_word=False
     return f in {"que","quien","quienes","cual","cuales","donde","cuando","como","cuanto","cuanta","cuantos","cuantas"}
 # FIX: el detector WH ignora WH dentro de paréntesis y comillas tipográficas
+def has_wh_outside_parens(toks) -> bool:
     depth = 0
+    for tk in toks:
         if tk in {"(", "«", """, "'"}:
             depth += 1
         elif tk in {")", "»", """, "'"}:
 ESTAR_SET={"estoy","estás","está","estamos","estáis","están","estaba","estabas","estábamos","estabais","estaban"}
 HABER_SET={"he","has","ha","hemos","habéis","han","había","habías","habíamos","habíais","habían"}
+def detect_tam_with_context(toks, i, sentence_start=False):
+    """Versión mejorada con análisis contextual profundo - CORREGIDO"""
     t=toks[i].lower()
     prev=toks[i-1].lower() if i>0 else ""
     prev2=toks[i-2].lower() if i>1 else ""
+    nxt=toks[i+1].lower() if i+1<len(toks) else ""
     # Primero usar detección morfológica mejorada
     tag=es_morph_tag(t)
     return ni_surface
 def translate_sentence(sent:str):
+    """Pipeline mejorado con detección contextual y manejo de imperativos - CORREGIDO"""
     toks = tokenize_es(normalize_es(sent))
     out_words = []      # palabras en ni (latín)
         # pipeline normal
         low = t.lower()
         prev = toks[i-1].lower() if i>0 else ""
+        nxt  = toks[i+1].lower() if i+1<len(toks) else ""
         # === DETECCIÓN MEJORADA ===
         # Detectar imperativo por contexto de inicio o por clíticos