Spaces:

SamiKLN
/

DocImageAI-Explorer

Sleeping

App Files Files Community

SamiKLN commited on Apr 25, 2025

Commit

a927fa4

verified ·

1 Parent(s): 774eabd

Upload 3 files

Browse files

Files changed (3) hide show

__init__.py +25 -0
main.py +273 -0
models.py +100 -0

__init__.py ADDED Viewed

	@@ -0,0 +1,25 @@

+"""
+Package initializer for DocImageAI Explorer API
+This empty file serves two crucial purposes:
+1. Marks the 'app' directory as a Python package
+2. Allows relative imports between modules
+"""
+# Version of the application
+__version__ = "1.0.0"
+# List of what gets imported with 'from app import *'
+__all__ = [
+    'main',      # Main FastAPI application
+    'models',    # Pydantic models
+    'utils'      # Utility functions
+]
+# Optional initialization code
+def init_app():
+    """Initialize application components"""
+    pass
+# Run initialization when package is imported
+init_app()

main.py ADDED Viewed

	@@ -0,0 +1,273 @@

+import os
+import uuid
+import logging
+from pathlib import Path
+from typing import List, Optional
+from fastapi import FastAPI, UploadFile, File, Form, HTTPException, Request
+from fastapi.staticfiles import StaticFiles
+from fastapi.templating import Jinja2Templates
+from fastapi.responses import HTMLResponse, JSONResponse, FileResponse
+from fastapi.middleware.cors import CORSMiddleware
+from pydantic import BaseModel
+from huggingface_hub import InferenceClient
+import fitz  # PyMuPDF
+from PIL import Image
+import io
+import pandas as pd
+from docx import Document
+from pptx import Presentation
+# Configuration du logging
+logging.basicConfig(level=logging.INFO)
+logger = logging.getLogger(__name__)
+# Initialisation de l'application FastAPI
+app = FastAPI()
+# Configuration CORS
+app.add_middleware(
+    CORSMiddleware,
+    allow_origins=["*"],
+    allow_methods=["*"],
+    allow_headers=["*"],
+)
+# Chemins des fichiers
+BASE_DIR = Path(__file__).parent.parent
+UPLOAD_FOLDER = BASE_DIR / "uploads"
+os.makedirs(UPLOAD_FOLDER, exist_ok=True)
+# Modèles Hugging Face
+HF_TOKEN = os.getenv("HF_TOKEN")
+client = InferenceClient(token=HF_TOKEN)
+MODELS = {
+    "summary": "facebook/bart-large-cnn",
+    "caption": "Salesforce/blip-image-captioning-large",
+    "qa": "deepseek-ai/DeepSeek-V2-Chat"
+}
+# Modèles Pydantic
+class FileInfo(BaseModel):
+    file_id: str
+    file_name: str
+    file_type: str
+    file_path: str
+    extracted_text: Optional[str] = None
+class SummaryRequest(BaseModel):
+    file_id: str
+    max_length: int = 150
+class CaptionRequest(BaseModel):
+    file_id: str
+class QARequest(BaseModel):
+    file_id: Optional[str] = None
+    question: str
+# Initialisation des templates
+templates = Jinja2Templates(directory=str(BASE_DIR / "frontend/templates"))
+app.mount("/static", StaticFiles(directory=str(BASE_DIR / "frontend/static")), name="static")
+# Fonctions utilitaires
+def extract_text_from_pdf(file_path: str) -> str:
+    try:
+        doc = fitz.open(file_path)
+        return "\n".join([page.get_text() for page in doc])
+    except Exception as e:
+        logger.error(f"PDF extraction error: {e}")
+        raise HTTPException(400, "Erreur d'extraction PDF")
+def extract_text_from_docx(file_path: str) -> str:
+    try:
+        doc = Document(file_path)
+        return "\n".join([para.text for para in doc.paragraphs])
+    except Exception as e:
+        logger.error(f"DOCX extraction error: {e}")
+        raise HTTPException(400, "Erreur d'extraction DOCX")
+def extract_text_from_pptx(file_path: str) -> str:
+    try:
+        prs = Presentation(file_path)
+        text = []
+        for slide in prs.slides:
+            for shape in slide.shapes:
+                if hasattr(shape, "text"):
+                    text.append(shape.text)
+        return "\n".join(text)
+    except Exception as e:
+        logger.error(f"PPTX extraction error: {e}")
+        raise HTTPException(400, "Erreur d'extraction PPTX")
+def extract_text_from_excel(file_path: str) -> str:
+    try:
+        xls = pd.ExcelFile(file_path)
+        text = []
+        for sheet_name in xls.sheet_names:
+            df = pd.read_excel(file_path, sheet_name=sheet_name)
+            text.append(f"Feuille: {sheet_name}\n{df.to_string()}")
+        return "\n\n".join(text)
+    except Exception as e:
+        logger.error(f"Excel extraction error: {e}")
+        raise HTTPException(400, "Erreur d'extraction Excel")
+async def process_uploaded_file(file: UploadFile) -> FileInfo:
+    file_ext = Path(file.filename).suffix.lower()
+    file_id = str(uuid.uuid4())
+    file_path = str(UPLOAD_FOLDER / f"{file_id}{file_ext}")
+    # Sauvegarde du fichier
+    with open(file_path, "wb") as buffer:
+        buffer.write(await file.read())
+    # Extraction du texte selon le type de fichier
+    text = ""
+    if file_ext == ".pdf":
+        text = extract_text_from_pdf(file_path)
+    elif file_ext == ".docx":
+        text = extract_text_from_docx(file_path)
+    elif file_ext == ".pptx":
+        text = extract_text_from_pptx(file_path)
+    elif file_ext in (".xlsx", ".xls"):
+        text = extract_text_from_excel(file_path)
+    return FileInfo(
+        file_id=file_id,
+        file_name=file.filename,
+        file_type=file_ext[1:],
+        file_path=file_path,
+        extracted_text=text if text else None
+    )
+# Endpoints
+@app.get("/", response_class=HTMLResponse)
+async def home(request: Request):
+    return templates.TemplateResponse("index.html", {"request": request})
+@app.post("/api/upload", response_model=List[FileInfo])
+async def upload_files(files: List[UploadFile] = File(...)):
+    try:
+        processed_files = []
+        for file in files:
+            processed_file = await process_uploaded_file(file)
+            processed_files.append(processed_file)
+        return processed_files
+    except Exception as e:
+        logger.error(f"Upload error: {e}")
+        raise HTTPException(500, f"Erreur lors de l'upload: {str(e)}")
+@app.post("/api/summarize")
+async def summarize_document(request: SummaryRequest):
+    try:
+        file_path = next(f for f in UPLOAD_FOLDER.glob(f"{request.file_id}*"))
+        text = ""
+        if file_path.suffix == ".pdf":
+            text = extract_text_from_pdf(str(file_path))
+        else:
+            with open(file_path, "r", encoding="utf-8") as f:
+                text = f.read()
+        prompt = f"""
+        Résumez ce document de manière concise en français.
+        Concentrez-vous sur les points principaux.
+        Le résumé doit faire environ {request.max_length} mots.
+        Document:
+        {text[:5000]}... [truncated]
+        """
+        summary = client.summarization(
+            text=text,
+            model=MODELS["summary"],
+            parameters={"max_length": request.max_length}
+        )
+        return {"summary": summary}
+    except Exception as e:
+        logger.error(f"Summarization error: {e}")
+        raise HTTPException(500, f"Erreur de résumé: {str(e)}")
+@app.post("/api/caption")
+async def caption_image(request: CaptionRequest):
+    try:
+        file_path = next(f for f in UPLOAD_FOLDER.glob(f"{request.file_id}*"))
+        with open(file_path, "rb") as image_file:
+            image_data = image_file.read()
+        caption = client.image_to_text(
+            image=image_data,
+            model=MODELS["caption"]
+        )
+        return {"caption": caption}
+    except Exception as e:
+        logger.error(f"Captioning error: {e}")
+        raise HTTPException(500, f"Erreur de description: {str(e)}")
+@app.post("/api/answer")
+async def answer_question(request: QARequest):
+    try:
+        context = ""
+        if request.file_id:
+            file_path = next(f for f in UPLOAD_FOLDER.glob(f"{request.file_id}*"))
+            if file_path.suffix in (".jpg", ".jpeg", ".png"):
+                with open(file_path, "rb") as image_file:
+                    image_data = image_file.read()
+                context = client.image_to_text(image=image_data, model=MODELS["caption"])
+            else:
+                if file_path.suffix == ".pdf":
+                    context = extract_text_from_pdf(str(file_path))
+                else:
+                    with open(file_path, "r", encoding="utf-8") as f:
+                        context = f.read()
+        prompt = f"""
+        Vous êtes un assistant IA qui répond à des questions en français.
+        Répondez de manière précise et concise.
+        Contexte: {context[:3000]}
+        Question: {request.question}
+        Réponse:
+        """
+        response = client.chat_completion(
+            model=MODELS["qa"],
+            messages=[{"role": "user", "content": prompt}],
+            max_tokens=500
+        )
+        return {"answer": response.choices[0].message.content}
+    except Exception as e:
+        logger.error(f"QA error: {e}")
+        raise HTTPException(500, f"Erreur de réponse: {str(e)}")
+@app.get("/api/file/{file_id}")
+async def get_file(file_id: str):
+    try:
+        file_path = next(f for f in UPLOAD_FOLDER.glob(f"{file_id}*"))
+        return FileResponse(file_path)
+    except Exception as e:
+        logger.error(f"File retrieval error: {e}")
+        raise HTTPException(404, "Fichier non trouvé")
+@app.get("/video-background")
+async def get_video():
+    return FileResponse(BASE_DIR / "frontend/static/videos/background.mp4")
+# Gestion des erreurs
+@app.exception_handler(HTTPException)
+async def http_exception_handler(request, exc):
+    return JSONResponse(
+        status_code=exc.status_code,
+        content={"detail": exc.detail},
+    )
+@app.exception_handler(Exception)
+async def generic_exception_handler(request, exc):
+    logger.error(f"Unhandled exception: {exc}")
+    return JSONResponse(
+        status_code=500,
+        content={"detail": "Une erreur interne est survenue"},
+    )

models.py ADDED Viewed

	@@ -0,0 +1,100 @@

+from typing import List, Optional, Union
+from pydantic import BaseModel, Field, HttpUrl
+from datetime import datetime
+from enum import Enum
+class FileType(str, Enum):
+    PDF = "pdf"
+    DOCX = "docx"
+    PPTX = "pptx"
+    XLSX = "xlsx"
+    JPG = "jpg"
+    JPEG = "jpeg"
+    PNG = "png"
+class UploadedFile(BaseModel):
+    """
+    Modèle pour les fichiers uploadés
+    """
+    file_id: str = Field(..., description="ID unique du fichier")
+    file_name: str = Field(..., description="Nom original du fichier")
+    file_type: FileType = Field(..., description="Type du fichier")
+    file_path: str = Field(..., description="Chemin d'accès interne")
+    file_size: int = Field(..., description="Taille en octets")
+    upload_date: datetime = Field(default_factory=datetime.now, description="Date d'upload")
+    extracted_text: Optional[str] = Field(None, description="Texte extrait le cas échéant")
+    class Config:
+        json_schema_extra = {
+            "example": {
+                "file_id": "550e8400-e29b-41d4-a716-446655440000",
+                "file_name": "document.pdf",
+                "file_type": "pdf",
+                "file_path": "/uploads/550e8400-e29b-41d4-a716-446655440000.pdf",
+                "file_size": 1024,
+                "upload_date": "2023-01-01T00:00:00",
+                "extracted_text": "Lorem ipsum..."
+            }
+        }
+class SummaryRequest(BaseModel):
+    """
+    Modèle pour les requêtes de résumé
+    """
+    file_id: str = Field(..., description="ID du fichier à résumer")
+    max_length: int = Field(150, gt=50, lt=500, description="Longueur maximale du résumé (50-500 mots)")
+class SummaryResponse(BaseModel):
+    """
+    Modèle pour les réponses de résumé
+    """
+    original_length: int = Field(..., description="Nombre de mots original")
+    summary_length: int = Field(..., description="Nombre de mots du résumé")
+    summary: str = Field(..., description="Résumé généré")
+    processing_time: float = Field(..., description="Temps de traitement en secondes")
+class ImageCaptionRequest(BaseModel):
+    """
+    Modèle pour les requêtes de description d'image
+    """
+    file_id: str = Field(..., description="ID du fichier image")
+    detail_level: str = Field("normal", regex="^(low|normal|high)$")
+class ImageCaptionResponse(BaseModel):
+    """
+    Modèle pour les réponses de description d'image
+    """
+    caption: str = Field(..., description="Description générée")
+    confidence: float = Field(..., ge=0, le=1, description="Confiance du modèle (0-1)")
+class QARequest(BaseModel):
+    """
+    Modèle pour les requêtes de questions/réponses
+    """
+    file_id: Optional[str] = Field(None, description="ID du fichier de référence (optionnel)")
+    question: str = Field(..., min_length=5, description="Question à poser")
+    context: Optional[str] = Field(None, description="Contexte supplémentaire")
+class QAResponse(BaseModel):
+    """
+    Modèle pour les réponses aux questions
+    """
+    answer: str = Field(..., description="Réponse générée")
+    source: Optional[str] = Field(None, description="Source de la réponse le cas échéant")
+    confidence: Optional[float] = Field(None, ge=0, le=1, description="Niveau de confiance")
+class ErrorResponse(BaseModel):
+    """
+    Modèle standard pour les erreurs
+    """
+    error: str = Field(..., description="Message d'erreur")
+    code: int = Field(..., description="Code HTTP")
+    details: Optional[Union[dict, list]] = Field(None, description="Détails supplémentaires")
+class HealthCheck(BaseModel):
+    """
+    Modèle pour le endpoint de santé
+    """
+    status: str = Field(..., description="Statut du service")
+    version: str = Field(..., description="Version de l'API")
+    models_ready: bool = Field(..., description="Les modèles IA sont-ils chargés ?")