Spaces:

FatimaGr
/

AI_Web_Dev1

Sleeping

App Files Files Community

malaknihed commited on Mar 20, 2025

Commit

d5f775d

verified ·

1 Parent(s): 88cde13

app

Browse files

Files changed (1) hide show

app.py +33 -141

app.py CHANGED Viewed

@@ -1,158 +1,50 @@
-from fastapi import FastAPI, File, UploadFile  # type: ignore
-from transformers import pipeline, AutoTokenizer
-import pdfplumber  # type: ignore
-import docx  # type: ignore
-import pptx  # type: ignore
-import pandas as pd  # type: ignore
-from PIL import Image
-import io
-from fastapi.middleware.cors import CORSMiddleware # type: ignore
-import uvicorn
 app = FastAPI()
-# Activer CORS pour autoriser les requêtes depuis le navigateur
-app.add_middleware(
-    CORSMiddleware,
-    allow_origins=["*"],  # Autoriser toutes les origines (mettre ["http://127.0.0.1:5500"] si nécessaire)
-    allow_credentials=True,
-    allow_methods=["*"],  # Autoriser toutes les méthodes (GET, POST, etc.)
-    allow_headers=["*"],  # Autoriser tous les headers
-)
-# 🔹 TEST : Vérifier si FastAPI démarre bien
-@app.get("/")
-def home():
-    return {"message": "Serveur FastAPI en ligne 🚀"}
-# Charger les modèles Hugging Face avec debug
-print("⏳ Chargement du modèle de résumé...")
-try:
-    summarizer = pipeline("summarization", model="google/flan-t5-large")
-    print("✅ Modèle de résumé chargé.")
-except Exception as e:
-    print(f"❌ Erreur lors du chargement du modèle de résumé : {e}")
-print("⏳ Chargement du modèle d'interprétation d'image...")
-try:
-    image_captioner = pipeline("image-to-text", model="nlpconnect/vit-gpt2-image-captioning")
-    print("✅ Modèle d'interprétation d'image chargé.")
-except Exception as e:
-    print(f"❌ Erreur lors du chargement du modèle d'interprétation d'image : {e}")
-# Charger le tokenizer pour limiter la taille du texte
-tokenizer = AutoTokenizer.from_pretrained("google/flan-t5-large")
-# Fonction pour extraire le texte d'un fichier
-def extract_text_from_file(file: UploadFile):
-    print(f"🔹 Extraction du texte depuis : {file.filename}")
-    try:
-        if file.filename.endswith(".pdf"):
-            with pdfplumber.open(file.file) as pdf:
-                text = " ".join([page.extract_text() for page in pdf.pages if page.extract_text()])
-                print("✅ Texte extrait depuis PDF :", text[:500])  # Afficher les 500 premiers caractères
-                return text
-        elif file.filename.endswith(".docx"):
-            doc = docx.Document(file.file)
-            text = " ".join([para.text for para in doc.paragraphs])
-            print("✅ Texte extrait depuis DOCX :", text[:500])
-            return text
-        elif file.filename.endswith(".pptx"):
-            ppt = pptx.Presentation(file.file)
-            text = " ".join([shape.text for slide in ppt.slides for shape in slide.shapes if hasattr(shape, "text")])
-            print("✅ Texte extrait depuis PPTX :", text[:500])
-            return text
-        elif file.filename.endswith(".xlsx"):
-            df = pd.read_excel(file.file)
-            text = " ".join(df.astype(str).values.flatten())
-            print("✅ Texte extrait depuis XLSX :", text[:500])
-            return text
-        else:
-            print("❌ Format non supporté :", file.filename)
-            return None
-    except Exception as e:
-        print(f"❌ Erreur lors de l'extraction du texte : {e}")
-        return None
-# Fonction pour résumer du texte
-def summarize_text(text):
-    print(f"🔍 Texte envoyé au modèle : {text[:500]}")  # Afficher les 500 premiers caractères
-    tokens = tokenizer.tokenize(text)
-    truncated_text = tokenizer.convert_tokens_to_string(tokens[:1024])  # Limite à 1024 tokens
-    print(f"📏 Texte après troncature : {truncated_text[:500]}")
-    try:
-        summary = summarizer(truncated_text, max_length=130, min_length=30, do_sample=False)
-        print(f"📝 Résumé généré : {summary[0]['summary_text']}")
-        return summary[0]['summary_text']
-    except Exception as e:
-        print(f"❌ Erreur du modèle de résumé : {e}")
-        return None
-# ✅ TEST : Extraire le texte d'un fichier
-@app.post("/test_extraction/")
-async def test_extraction(file: UploadFile = File(...)):
-    text = extract_text_from_file(file)
-    if not text or not text.strip():
-        return {"error": "Aucun texte extrait du fichier"}
-    return {"extracted_text": text[:500]}  # Affichage limité à 500 caractères
-# ✅ TEST : Vérifier le résumé d'un texte simple
-@app.post("/test_summary_text/")
-async def test_summary_text(text: str):
-    if not text or not text.strip():
-        return {"error": "Texte vide"}
-    summary = summarize_text(text)
-    if not summary:
-        return {"error": "Échec du résumé"}
-    return {"summary": summary}
-# ✅ DEBUG : Voir toutes les étapes du résumé
-@app.post("/debug_summary/")
-async def debug_summary(text: str):
-    if not text or not text.strip():
-        return {"error": "Texte vide"}
-    try:
-        tokens = tokenizer.tokenize(text)
-        truncated_text = tokenizer.convert_tokens_to_string(tokens[:1024])
-        summary = summarizer(truncated_text, max_length=130, min_length=30, do_sample=False)
-        return {
-            "original_text": text[:500],
-            "truncated_text": truncated_text[:500],
-            "summary": summary[0]['summary_text']
-        }
-    except Exception as e:
-        return {"error": str(e)}
-# 🔹 Endpoint principal : Résumer un fichier
-@app.post("/summarize/")
-async def summarize_file(file: UploadFile = File(...)):
-    text = extract_text_from_file(file)
-    if not text or not text.strip():
-        return {"error": "Aucun texte extrait du fichier"}
-    summary = summarize_text(text)
-    if not summary:
-        return {"error": "Échec du résumé"}
-    return {"summary": summary}
-# 🔹 Endpoint : Interpréter une image
 @app.post("/interpret/")
 async def interpret_image(file: UploadFile = File(...)):
-    image = Image.open(io.BytesIO(await file.read()))
-    caption = image_captioner(image)
-    return {"caption": caption[0]['generated_text']}
-if __name__ == "__main__":
-    uvicorn.run(app, host="0.0.0.0", port=7860)

+from fastapi import FastAPI, File, UploadFile
+from fastapi.responses import JSONResponse
+from fastapi.staticfiles import StaticFiles
+from transformers import pipeline
+import shutil
+import os
 app = FastAPI()
+# Servir les fichiers statiques (HTML, CSS, JS)
+app.mount("/", StaticFiles(directory="static", html=True), name="static")
+# Modèle Hugging Face pour le résumé de texte
+summarizer = pipeline("summarization", model="facebook/bart-large-cnn")
+# Modèle Hugging Face pour l'interprétation d'images
+image_captioning = pipeline("image-to-text", model="nlpconnect/vit-gpt2-image-captioning")
+UPLOAD_DIR = "uploads"
+os.makedirs(UPLOAD_DIR, exist_ok=True)
+@app.post("/summarize/")
+async def summarize_document(file: UploadFile = File(...)):
+    """ Analyse et résume un document texte. """
+    file_path = os.path.join(UPLOAD_DIR, file.filename)
+    # Sauvegarde temporaire du fichier
+    with open(file_path, "wb") as buffer:
+        shutil.copyfileobj(file.file, buffer)
+    # Lire le contenu du fichier (ex: PDF, DOCX) et l'envoyer au modèle
+    # Ici, je vais supposer que c'est un fichier texte brut pour simplifier
+    with open(file_path, "r", encoding="utf-8") as f:
+        text = f.read()
+    summary = summarizer(text, max_length=150, min_length=50, do_sample=False)[0]["summary_text"]
+    return JSONResponse(content={"summary": summary})
 @app.post("/interpret/")
 async def interpret_image(file: UploadFile = File(...)):
+    """ Génère une légende pour une image. """
+    file_path = os.path.join(UPLOAD_DIR, file.filename)
+    with open(file_path, "wb") as buffer:
+        shutil.copyfileobj(file.file, buffer)
+    caption = image_captioning(file_path)[0]["generated_text"]
+    return JSONResponse(content={"caption": caption})