Spaces:

tx3bas
/

Traduceme

Sleeping

App Files Files Community

tx3bas commited on Mar 5, 2025

Commit

e6f2574

verified ·

1 Parent(s): 7d1c3fa

Update app.py

Browse files

Files changed (1) hide show

app.py +9 -12

app.py CHANGED Viewed

@@ -44,27 +44,26 @@ lang_list = list(lang_dict.keys())
 def split_html_content(text):
     """Separa etiquetas HTML y su contenido"""
-    # Expresión regular para encontrar elementos HTML completos
     pattern = r'(<[^>]+>.*?</[^>]+>)|([^<]+)'
     parts = []
     for match in re.finditer(pattern, text, re.DOTALL):
         if match.group(1):  # Elemento HTML completo
             html_tag = match.group(1)
-            # Extraer contenido entre etiquetas
-            content_match = re.search(r'>((?:[^<]|<(?!/))*)<', html_tag)
             if content_match:
-                content = content_match.group(1)
-                # Guardar etiqueta de apertura, contenido y cierre por separado
                 opening = html_tag[:content_match.start(1) + 1]
                 closing = html_tag[content_match.end(1):]
                 parts.append(('html_open', opening))
-                parts.append(('text', content))
                 parts.append(('html_close', closing))
             else:
                 parts.append(('html', html_tag))
         elif match.group(2):  # Texto fuera de etiquetas
-            parts.append(('text', match.group(2)))
     return parts
@@ -94,8 +93,7 @@ def translate_text(source_lang, target_lang, text):
     # Traducir solo las partes de texto
     translated_parts = []
     for part_type, content in parts:
-        if part_type == 'text':
-            # Dividir en fragmentos si es necesario
             chunks = split_text(content)
             translated_chunks = [
                 translate(chunk, target_code, source_code)
@@ -106,13 +104,12 @@ def translate_text(source_lang, target_lang, text):
             # Mantener etiquetas HTML sin cambios
             translated_parts.append(content)
     return ''.join(translated_parts)
 def main(Texto, source_lang, target_lang):
     # Realizar la traducción
     translated_text = translate_text(source_lang, target_lang, Texto)
-    # Devolver el texto plano sin formato HTML renderizado
     return translated_text
 iface = gr.Interface(
@@ -122,7 +119,7 @@ iface = gr.Interface(
         gr.Dropdown(lang_list, label="Idioma origen", value="Automático"),
         gr.Dropdown(lang_list, label="Idioma destino", value="Español")
     ],
-    outputs="text",  # Cambiado de "html" a "text" para mostrar texto plano
     title="<div style='margin:0 auto;text-align:center'><div style='margin:0 auto;text-align:center'><img style='width:100px;display: inline-table;margin-bottom:-10px' src='https://artxeweb.com/media/files/idioma.jpg'><p>Traducción sin límites</p></div>",
     description="<p style='margin-bottom:10px;text-align:center;background: #ffffff; padding: 8px; border-radius: 8px; border-width: 1px; border: solid 1px #e5e7eb;'>Ingresa el texto que deseas traducir, selecciona el idioma origen (o deja 'Automático') y el idioma de destino. ¡No hay límites!</p>",
     article="<div style='margin-top:10px'><p style='text-align: center !important; background: #ffffff; padding: 5px 30px; border-radius: 8px; border-width: 1px; border: solid 1px #e5e7eb; width: fit-content; margin: auto;'>Desarrollada por <a style='text-decoration: none !important; color: #e12a31 !important;' title='Artxe Web' href='https://artxeweb.com'>© Artxe Web</a></p></div>"

 def split_html_content(text):
     """Separa etiquetas HTML y su contenido"""
+    # Expresión regular mejorada para manejar elementos HTML correctamente
     pattern = r'(<[^>]+>.*?</[^>]+>)|([^<]+)'
     parts = []
     for match in re.finditer(pattern, text, re.DOTALL):
         if match.group(1):  # Elemento HTML completo
             html_tag = match.group(1)
+            content_match = re.search(r'>((?:[^<]|<(?!/[^>]+>))*)<', html_tag, re.DOTALL)
             if content_match:
+                content = content_match.group(1).strip()
                 opening = html_tag[:content_match.start(1) + 1]
                 closing = html_tag[content_match.end(1):]
                 parts.append(('html_open', opening))
+                if content:  # Solo añadir contenido si no está vacío
+                    parts.append(('text', content))
                 parts.append(('html_close', closing))
             else:
                 parts.append(('html', html_tag))
         elif match.group(2):  # Texto fuera de etiquetas
+            parts.append(('text', match.group(2).strip()))
     return parts
     # Traducir solo las partes de texto
     translated_parts = []
     for part_type, content in parts:
+        if part_type == 'text' and content:  # Solo traducir si hay contenido
             chunks = split_text(content)
             translated_chunks = [
                 translate(chunk, target_code, source_code)
             # Mantener etiquetas HTML sin cambios
             translated_parts.append(content)
+    # Unir las partes sin añadir espacios adicionales innecesarios
     return ''.join(translated_parts)
 def main(Texto, source_lang, target_lang):
     # Realizar la traducción
     translated_text = translate_text(source_lang, target_lang, Texto)
     return translated_text
 iface = gr.Interface(
         gr.Dropdown(lang_list, label="Idioma origen", value="Automático"),
         gr.Dropdown(lang_list, label="Idioma destino", value="Español")
     ],
+    outputs="text",  # Salida como texto plano
     title="<div style='margin:0 auto;text-align:center'><div style='margin:0 auto;text-align:center'><img style='width:100px;display: inline-table;margin-bottom:-10px' src='https://artxeweb.com/media/files/idioma.jpg'><p>Traducción sin límites</p></div>",
     description="<p style='margin-bottom:10px;text-align:center;background: #ffffff; padding: 8px; border-radius: 8px; border-width: 1px; border: solid 1px #e5e7eb;'>Ingresa el texto que deseas traducir, selecciona el idioma origen (o deja 'Automático') y el idioma de destino. ¡No hay límites!</p>",
     article="<div style='margin-top:10px'><p style='text-align: center !important; background: #ffffff; padding: 5px 30px; border-radius: 8px; border-width: 1px; border: solid 1px #e5e7eb; width: fit-content; margin: auto;'>Desarrollada por <a style='text-decoration: none !important; color: #e12a31 !important;' title='Artxe Web' href='https://artxeweb.com'>© Artxe Web</a></p></div>"