Spaces:
Sleeping
Sleeping
A newer version of the Streamlit SDK is available: 1.56.0
metadata
title: LibreTranslate ProDoc
emoji: 🌐
colorFrom: blue
colorTo: purple
sdk: streamlit
sdk_version: 1.35.0
app_file: app.py
pinned: false
license: mit
short_description: Traduce PDF y Word offline manteniendo el diseño original
tags:
- translation
- pdf
- docx
- argos-translate
- offline
- document-processing
🌐 LibreTranslate ProDoc
**Traducción offline de documentos PDF y Word con preservación de diseño.**
Motor: [Argos Translate](https://github.com/argosopentech/argos-translate) · Desarrollado por AdVision AI
---
✨ Características Principales
| Característica | Detalle |
|---|---|
| 📄 Formatos | PDF (vía PyMuPDF) y DOCX (vía python-docx) |
| 🔒 Privacidad | 100% offline, tus documentos no salen del servidor |
| 🎨 Diseño | Preserva layout, fuentes, negritas, cursivas y tablas |
| 🗑️ Seguridad | Auto-limpieza: archivos eliminados a los 5 minutos |
| 🌍 Idiomas | 20 idiomas: EN, ES, FR, DE, IT, PT, ZH, JA, KO, RU... |
| ⚡ Lazy Loading | Los modelos se descargan solo cuando los necesitas |
---
🚀 Cómo Usar la App
Selecciona los idiomas en la barra lateral izquierda
- Idioma Origen: el idioma del documento original
- Idioma Destino: el idioma al que quieres traducir
Carga tu documento en el área central
- Arrastra el archivo o haz clic en "Browse files"
- Formatos aceptados:
.pdf·.docx - Tamaño máximo: 50 MB
Haz clic en "Traducir Documento"
- La primera vez, descargará el modelo de idioma (~150MB)
- Las siguientes veces será instantáneo (usa el caché)
Descarga el resultado
- Aparecerá un botón de descarga con el documento traducido
- El archivo se eliminará del servidor en 5 minutos automáticamente
---
🌍 Idiomas Soportados
| Código | Idioma | Código | Idioma |
|---|---|---|---|
en |
🇺🇸 Inglés | zh |
🇨🇳 Chino |
es |
🇪🇸 Español | ja |
🇯🇵 Japonés |
fr |
🇫🇷 Francés | ko |
🇰🇷 Coreano |
de |
🇩🇪 Alemán | tr |
🇹🇷 Turco |
it |
🇮🇹 Italiano | sv |
🇸🇪 Sueco |
pt |
🇵🇹 Portugués | da |
🇩🇰 Danés |
nl |
🇳🇱 Neerlandés | fi |
🇫🇮 Finlandés |
pl |
🇵🇱 Polaco | nb |
🇳🇴 Noruego |
ru |
🇷🇺 Ruso | cs |
🇨🇿 Checo |
ar |
🇸🇦 Árabe | hu |
🇭🇺 Húngaro |
---
⚙️ Arquitectura Técnica
┌─────────────────────────────────────────┐
│ LibreTranslate ProDoc │
│ (Streamlit UI) │
└──────────────────┬──────────────────────┘
│
┌──────────┴──────────┐
│ │
┌────▼────┐ ┌─────▼─────┐
│ PDF │ │ DOCX │
│PyMuPDF │ │python-docx│
└────┬────┘ └─────┬─────┘
│ │
└──────────┬──────────┘
│
┌────────▼────────┐
│ Argos Translate │
│ (Offline NMT) │
└────────┬─────────┘
│
┌────────▼─────────┐
│ Auto-Cleanup │
│ threading.Timer │
│ (5 minutos) │
└──────────────────┘
---
⚠️ Limitaciones Conocidas
- PDFs escaneados (imágenes): El motor extrae texto digital. Los PDFs que son imágenes escaneadas sin OCR no pueden ser procesados.
- Fuentes personalizadas: Si el PDF usa fuentes muy específicas no instaladas en el servidor, el texto traducido usará una fuente de respaldo estándar.
- Textos muy largos: Los documentos muy extensos (>200 páginas) pueden tardar varios minutos. Ten paciencia.
- Longitud del texto: El texto traducido puede ser más largo/corto que el original, lo que puede afectar el layout en PDFs muy ajustados.
---
📄 Licencia
MIT License — Libre para uso personal y comercial con atribución.
---
💙 Créditos
- Argos Translate — Motor de traducción NMT offline
- PyMuPDF — Procesamiento de PDFs
- python-docx — Procesamiento de Word
- Streamlit — Framework de UI
- AdVision AI — Diseño y desarrollo
---
¿Te resulta útil? ¡Apóyanos con una donación vía PayPal o contáctanos por WhatsApp!