Spaces:

FatimaGr
/

AI_Web_Dev1

Sleeping

App Files Files Community

malaknihed commited on Mar 20, 2025

Commit

7983c71

verified ·

1 Parent(s): 739a5d6

app

Browse files

Files changed (1) hide show

app.py +152 -5

app.py CHANGED Viewed

@@ -1,9 +1,156 @@
-from fastapi import FastAPI
-from fastapi.staticfiles import StaticFiles
 app = FastAPI()
-# Servir les fichiers statiques (HTML, CSS, JS)
-app.mount("/", StaticFiles(directory="static", html=True), name="static")

+from fastapi import FastAPI, File, UploadFile  # type: ignore
+from transformers import pipeline, AutoTokenizer
+import pdfplumber  # type: ignore
+import docx  # type: ignore
+import pptx  # type: ignore
+import pandas as pd  # type: ignore
+from PIL import Image
+import io
+from fastapi.middleware.cors import CORSMiddleware # type: ignore
+import uvicorn
 app = FastAPI()
+# Activer CORS pour autoriser les requêtes depuis le navigateur
+app.add_middleware(
+    CORSMiddleware,
+    allow_origins=["*"],  # Autoriser toutes les origines (mettre ["http://127.0.0.1:5500"] si nécessaire)
+    allow_credentials=True,
+    allow_methods=["*"],  # Autoriser toutes les méthodes (GET, POST, etc.)
+    allow_headers=["*"],  # Autoriser tous les headers
+)
+# 🔹 TEST : Vérifier si FastAPI démarre bien
+@app.get("/")
+def home():
+    return {"message": "Serveur FastAPI en ligne 🚀"}
+# Charger les modèles Hugging Face avec debug
+print("⏳ Chargement du modèle de résumé...")
+try:
+    summarizer = pipeline("summarization", model="google/flan-t5-large")
+    print("✅ Modèle de résumé chargé.")
+except Exception as e:
+    print(f"❌ Erreur lors du chargement du modèle de résumé : {e}")
+print("⏳ Chargement du modèle d'interprétation d'image...")
+try:
+    image_captioner = pipeline("image-to-text", model="nlpconnect/vit-gpt2-image-captioning")
+    print("✅ Modèle d'interprétation d'image chargé.")
+except Exception as e:
+    print(f"❌ Erreur lors du chargement du modèle d'interprétation d'image : {e}")
+# Charger le tokenizer pour limiter la taille du texte
+tokenizer = AutoTokenizer.from_pretrained("google/flan-t5-large")
+# Fonction pour extraire le texte d'un fichier
+def extract_text_from_file(file: UploadFile):
+    print(f"🔹 Extraction du texte depuis : {file.filename}")
+    try:
+        if file.filename.endswith(".pdf"):
+            with pdfplumber.open(file.file) as pdf:
+                text = " ".join([page.extract_text() for page in pdf.pages if page.extract_text()])
+                print("✅ Texte extrait depuis PDF :", text[:500])  # Afficher les 500 premiers caractères
+                return text
+        elif file.filename.endswith(".docx"):
+            doc = docx.Document(file.file)
+            text = " ".join([para.text for para in doc.paragraphs])
+            print("✅ Texte extrait depuis DOCX :", text[:500])
+            return text
+        elif file.filename.endswith(".pptx"):
+            ppt = pptx.Presentation(file.file)
+            text = " ".join([shape.text for slide in ppt.slides for shape in slide.shapes if hasattr(shape, "text")])
+            print("✅ Texte extrait depuis PPTX :", text[:500])
+            return text
+        elif file.filename.endswith(".xlsx"):
+            df = pd.read_excel(file.file)
+            text = " ".join(df.astype(str).values.flatten())
+            print("✅ Texte extrait depuis XLSX :", text[:500])
+            return text
+        else:
+            print("❌ Format non supporté :", file.filename)
+            return None
+    except Exception as e:
+        print(f"❌ Erreur lors de l'extraction du texte : {e}")
+        return None
+# Fonction pour résumer du texte
+def summarize_text(text):
+    print(f"🔍 Texte envoyé au modèle : {text[:500]}")  # Afficher les 500 premiers caractères
+    tokens = tokenizer.tokenize(text)
+    truncated_text = tokenizer.convert_tokens_to_string(tokens[:1024])  # Limite à 1024 tokens
+    print(f"📏 Texte après troncature : {truncated_text[:500]}")
+    try:
+        summary = summarizer(truncated_text, max_length=130, min_length=30, do_sample=False)
+        print(f"📝 Résumé généré : {summary[0]['summary_text']}")
+        return summary[0]['summary_text']
+    except Exception as e:
+        print(f"❌ Erreur du modèle de résumé : {e}")
+        return None
+# ✅ TEST : Extraire le texte d'un fichier
+@app.post("/test_extraction/")
+async def test_extraction(file: UploadFile = File(...)):
+    text = extract_text_from_file(file)
+    if not text or not text.strip():
+        return {"error": "Aucun texte extrait du fichier"}
+    return {"extracted_text": text[:500]}  # Affichage limité à 500 caractères
+# ✅ TEST : Vérifier le résumé d'un texte simple
+@app.post("/test_summary_text/")
+async def test_summary_text(text: str):
+    if not text or not text.strip():
+        return {"error": "Texte vide"}
+    summary = summarize_text(text)
+    if not summary:
+        return {"error": "Échec du résumé"}
+    return {"summary": summary}
+# ✅ DEBUG : Voir toutes les étapes du résumé
+@app.post("/debug_summary/")
+async def debug_summary(text: str):
+    if not text or not text.strip():
+        return {"error": "Texte vide"}
+    try:
+        tokens = tokenizer.tokenize(text)
+        truncated_text = tokenizer.convert_tokens_to_string(tokens[:1024])
+        summary = summarizer(truncated_text, max_length=130, min_length=30, do_sample=False)
+        return {
+            "original_text": text[:500],
+            "truncated_text": truncated_text[:500],
+            "summary": summary[0]['summary_text']
+        }
+    except Exception as e:
+        return {"error": str(e)}
+# 🔹 Endpoint principal : Résumer un fichier
+@app.post("/summarize/")
+async def summarize_file(file: UploadFile = File(...)):
+    text = extract_text_from_file(file)
+    if not text or not text.strip():
+        return {"error": "Aucun texte extrait du fichier"}
+    summary = summarize_text(text)
+    if not summary:
+        return {"error": "Échec du résumé"}
+    return {"summary": summary}
+# 🔹 Endpoint : Interpréter une image
+@app.post("/interpret/")
+async def interpret_image(file: UploadFile = File(...)):
+    image = Image.open(io.BytesIO(await file.read()))
+    caption = image_captioner(image)
+    return {"caption": caption[0]['generated_text']}
+if __name__ == "__main__":
+    uvicorn.run(app, host="0.0.0.0", port=7860)