AdVision AI
fix: yaml frontmatter syntax for Hugging Face
fb62447

A newer version of the Streamlit SDK is available: 1.56.0

Upgrade
metadata
title: LibreTranslate ProDoc
emoji: 🌐
colorFrom: blue
colorTo: purple
sdk: streamlit
sdk_version: 1.35.0
app_file: app.py
pinned: false
license: mit
short_description: Traduce PDF y Word offline manteniendo el diseño original
tags:
  - translation
  - pdf
  - docx
  - argos-translate
  - offline
  - document-processing

🌐 LibreTranslate ProDoc

**Traducción offline de documentos PDF y Word con preservación de diseño.**
Motor: [Argos Translate](https://github.com/argosopentech/argos-translate) · Desarrollado por AdVision AI

---

✨ Características Principales

Característica Detalle
📄 Formatos PDF (vía PyMuPDF) y DOCX (vía python-docx)
🔒 Privacidad 100% offline, tus documentos no salen del servidor
🎨 Diseño Preserva layout, fuentes, negritas, cursivas y tablas
🗑️ Seguridad Auto-limpieza: archivos eliminados a los 5 minutos
🌍 Idiomas 20 idiomas: EN, ES, FR, DE, IT, PT, ZH, JA, KO, RU...
Lazy Loading Los modelos se descargan solo cuando los necesitas

---

🚀 Cómo Usar la App

  1. Selecciona los idiomas en la barra lateral izquierda

    • Idioma Origen: el idioma del documento original
    • Idioma Destino: el idioma al que quieres traducir
  2. Carga tu documento en el área central

    • Arrastra el archivo o haz clic en "Browse files"
    • Formatos aceptados: .pdf · .docx
    • Tamaño máximo: 50 MB
  3. Haz clic en "Traducir Documento"

    • La primera vez, descargará el modelo de idioma (~150MB)
    • Las siguientes veces será instantáneo (usa el caché)
  4. Descarga el resultado

    • Aparecerá un botón de descarga con el documento traducido
    • El archivo se eliminará del servidor en 5 minutos automáticamente

---

🌍 Idiomas Soportados

Código Idioma Código Idioma
en 🇺🇸 Inglés zh 🇨🇳 Chino
es 🇪🇸 Español ja 🇯🇵 Japonés
fr 🇫🇷 Francés ko 🇰🇷 Coreano
de 🇩🇪 Alemán tr 🇹🇷 Turco
it 🇮🇹 Italiano sv 🇸🇪 Sueco
pt 🇵🇹 Portugués da 🇩🇰 Danés
nl 🇳🇱 Neerlandés fi 🇫🇮 Finlandés
pl 🇵🇱 Polaco nb 🇳🇴 Noruego
ru 🇷🇺 Ruso cs 🇨🇿 Checo
ar 🇸🇦 Árabe hu 🇭🇺 Húngaro

---

⚙️ Arquitectura Técnica

┌─────────────────────────────────────────┐
│          LibreTranslate ProDoc          │
│              (Streamlit UI)             │
└──────────────────┬──────────────────────┘
                   │
        ┌──────────┴──────────┐
        │                     │
   ┌────▼────┐          ┌─────▼─────┐
   │  PDF    │          │   DOCX    │
   │PyMuPDF  │          │python-docx│
   └────┬────┘          └─────┬─────┘
        │                     │
        └──────────┬──────────┘
                   │
          ┌────────▼────────┐
          │ Argos Translate  │
          │  (Offline NMT)   │
          └────────┬─────────┘
                   │
          ┌────────▼─────────┐
          │  Auto-Cleanup    │
          │ threading.Timer  │
          │   (5 minutos)    │
          └──────────────────┘

---

⚠️ Limitaciones Conocidas

  • PDFs escaneados (imágenes): El motor extrae texto digital. Los PDFs que son imágenes escaneadas sin OCR no pueden ser procesados.
  • Fuentes personalizadas: Si el PDF usa fuentes muy específicas no instaladas en el servidor, el texto traducido usará una fuente de respaldo estándar.
  • Textos muy largos: Los documentos muy extensos (>200 páginas) pueden tardar varios minutos. Ten paciencia.
  • Longitud del texto: El texto traducido puede ser más largo/corto que el original, lo que puede afectar el layout en PDFs muy ajustados.

---

📄 Licencia

MIT License — Libre para uso personal y comercial con atribución.

---

💙 Créditos

---

¿Te resulta útil? ¡Apóyanos con una donación vía PayPal o contáctanos por WhatsApp!