Spaces:

FatimaGr
/

AI_Web_Dev1

Sleeping

App Files Files Community

FatimaGr commited on Mar 22, 2025

Commit

0fdf000

verified ·

1 Parent(s): 2d57df3

translate

Browse files

Files changed (1) hide show

app.py +113 -28

app.py CHANGED Viewed

@@ -1,7 +1,7 @@
-from fastapi import FastAPI, File, UploadFile
 from fastapi.responses import JSONResponse, RedirectResponse
 from fastapi.staticfiles import StaticFiles
-from transformers import pipeline
 import shutil
 import os
 import logging
@@ -9,7 +9,18 @@ from fastapi.middleware.cors import CORSMiddleware
 from PyPDF2 import PdfReader
 import docx
 from PIL import Image  # Pour ouvrir les images avant analyse
-from pydantic import BaseModel
 # Configuration du logging
 logging.basicConfig(level=logging.INFO)
@@ -28,7 +39,7 @@ app.add_middleware(
 UPLOAD_DIR = "uploads"
 os.makedirs(UPLOAD_DIR, exist_ok=True)
-# Charger les modèles avec gestion des erreurs
 try:
     summarizer = pipeline("summarization", model="facebook/bart-large-cnn")
     logging.info("✅ Modèle de résumé chargé avec succès !")
@@ -43,13 +54,7 @@ except Exception as e:
     image_captioning = None
     logging.error(f"❌ Erreur chargement modèle image : {e}")
-try:
-    translator = pipeline("translation", model="facebook/m2m100_418M")
-    logging.info("✅ Modèle de traduction chargé avec succès !")
-except Exception as e:
-    translator = None
-    logging.error(f"❌ Erreur chargement modèle traduction : {e}")
 # ✅ Déclare les routes AVANT le montage des fichiers statiques
 @app.post("/summarize/")
@@ -112,31 +117,111 @@ async def interpret_image(file: UploadFile = File(...)):
     except Exception as e:
         logging.error(f"❌ Erreur interprétation image : {e}")
         return JSONResponse(content={"error": "Échec de l'analyse de l'image"}, status_code=400)
-class TranslationRequest(BaseModel):
-    text: str
-    source_lang: str
-    target_lang: str
-@app.post("/translate/")
-async def translate_text(request: TranslationRequest):
-    if not request.text.strip():
-        return JSONResponse(content={"error": "Texte vide"}, status_code=400)
-    if translator is None:
-        return JSONResponse(content={"error": "Modèle de traduction non disponible"}, status_code=500)
     try:
-        translated_text = translator(request.text, src_lang=request.source_lang, tgt_lang=request.target_lang)[0]["translation_text"]
-        return JSONResponse(content={"translated_text": translated_text})
     except Exception as e:
-        logging.error(f"❌ Erreur de traduction : {e}")
-        return JSONResponse(content={"error": "Échec de la traduction"}, status_code=500)
-# ✅ Déplace ici le montage des fichiers statiques
-app.mount("/", StaticFiles(directory="static", html=True), name="static")
 # Redirection vers index.html
 @app.get("/")
 async def root():
-    return RedirectResponse(url="/index.html")

+from fastapi import FastAPI, File, UploadFile, Form
 from fastapi.responses import JSONResponse, RedirectResponse
 from fastapi.staticfiles import StaticFiles
+from transformers import pipeline, M2M100ForConditionalGeneration, M2M100Tokenizer
 import shutil
 import os
 import logging
 from PyPDF2 import PdfReader
 import docx
 from PIL import Image  # Pour ouvrir les images avant analyse
+from transformers import MarianMTModel, MarianTokenizer
+import os
+import fitz
+from transformers import M2M100ForConditionalGeneration, M2M100Tokenizer
+import logging
+import openpyxl
+import io
+from docx import Document
+from pptx import Presentation
+from fastapi.responses import JSONResponse
 # Configuration du logging
 logging.basicConfig(level=logging.INFO)
 UPLOAD_DIR = "uploads"
 os.makedirs(UPLOAD_DIR, exist_ok=True)
+# 🔹 Charger les modèles avec gestion des erreurs
 try:
     summarizer = pipeline("summarization", model="facebook/bart-large-cnn")
     logging.info("✅ Modèle de résumé chargé avec succès !")
     image_captioning = None
     logging.error(f"❌ Erreur chargement modèle image : {e}")
+# 🔹 Chargement du modèle de traduction
 # ✅ Déclare les routes AVANT le montage des fichiers statiques
 @app.post("/summarize/")
     except Exception as e:
         logging.error(f"❌ Erreur interprétation image : {e}")
         return JSONResponse(content={"error": "Échec de l'analyse de l'image"}, status_code=400)
+# 🔹 Chargement du modèle de traduction
+try:
+    model_name = "facebook/m2m100_418M"
+    tokenizer = M2M100Tokenizer.from_pretrained(model_name)
+    model = M2M100ForConditionalGeneration.from_pretrained(model_name)
+    logging.info("✅ Modèle de traduction chargé avec succès !")
+except Exception as e:
+    logging.error(f"❌ Erreur chargement modèle de traduction : {e}")
+    model, tokenizer = None, None
+def extract_text_from_pdf(file):
+    """Extrait le texte d'un fichier PDF."""
+    doc = fitz.open(stream=file.file.read(), filetype="pdf")
+    text = "\n".join([page.get_text() for page in doc])
+    return text.strip()
+def extract_text_from_docx(file):
+    """Extrait le texte d'un fichier DOCX."""
+    doc = Document(io.BytesIO(file.file.read()))
+    text = "\n".join([para.text for para in doc.paragraphs])
+    return text.strip()
+def extract_text_from_pptx(file):
+    """Extrait le texte d'un fichier PPTX."""
+    prs = Presentation(io.BytesIO(file.file.read()))
+    text = []
+    for slide in prs.slides:
+        for shape in slide.shapes:
+            if hasattr(shape, "text"):
+                text.append(shape.text)
+    return "\n".join(text).strip()
+def extract_text_from_excel(file):
+    """Extrait le texte d'un fichier Excel (XLSX)."""
     try:
+        print("📥 Début extraction texte depuis Excel...")
+        wb = openpyxl.load_workbook(io.BytesIO(file.file.read()), data_only=True)
+        print("✅ Fichier Excel chargé avec succès !")
+        text = []
+        for sheet in wb.worksheets:
+            print(f"📄 Feuille trouvée : {sheet.title}")
+            for row in sheet.iter_rows(values_only=True):
+                text.extend([str(cell) for cell in row if cell])
+        extracted_text = "\n".join(text).strip()
+        print(f"✅ Texte extrait (début) : {extracted_text[:100]}...")
+        return extracted_text
     except Exception as e:
+        print(f"❌ Erreur lors de l'extraction du fichier Excel : {e}")
+        return None
+@app.post("/translate/")
+async def translate_document(file: UploadFile = File(...), target_lang: str = Form(...)):
+    """API pour traduocire un dument."""
+    try:
+        logging.info(f"📥 Fichier reçu : {file.filename}")
+        logging.info(f"🌍 Langue cible reçue : {target_lang}")
+        if model is None or tokenizer is None:
+            return JSONResponse(status_code=500, content={"error": "Modèle de traduction non chargé"})
+        # Extraction du texte en fonction du type de fichier
+        if file.filename.endswith(".pdf"):
+            text = extract_text_from_pdf(file)
+        elif file.filename.endswith(".docx"):
+            text = extract_text_from_docx(file)
+        elif file.filename.endswith(".pptx"):
+            text = extract_text_from_pptx(file)
+        elif file.filename.endswith(".xlsx"):
+            text = extract_text_from_excel(file)
+        else:
+            return JSONResponse(status_code=400, content={"error": "Format non supporté"})
+        logging.info(f"📜 Texte extrait : {text[:50]}...")  # Affiche un extrait du texte
+        if not text:
+            return JSONResponse(status_code=400, content={"error": "Aucun texte trouvé dans le document"})
+        # Traduire le texte
+        tokenizer.src_lang = "fr"
+        encoded_text = tokenizer(text, return_tensors="pt", padding=True, truncation=True)
+        generated_tokens = model.generate(**encoded_text, forced_bos_token_id=tokenizer.get_lang_id(target_lang))
+        translated_text = tokenizer.batch_decode(generated_tokens, skip_special_tokens=True)[0]
+        logging.info(f"✅ Traduction réussie : {translated_text[:50]}...")  # Affiche un extrait de la traduction
+        return {"translated_text": translated_text}
+    except Exception as e:
+        logging.error(f"❌ Erreur lors de la traduction : {e}")
+        return JSONResponse(status_code=500, content={"error": "Échec de la traduction"})
 # Redirection vers index.html
 @app.get("/")
 async def root():
+    return RedirectResponse(url="/index.html")