Spaces:

alonb19
/

ocr

Sleeping

App Files Files Community

alonb19 commited on Jul 3, 2025

Commit

d956b78

verified ·

1 Parent(s): 85fae97

Upload 3 files

Browse files

Files changed (3) hide show

Dockerfile +31 -0
app.py +68 -0
requirements.txt +6 -0

Dockerfile ADDED Viewed

	@@ -0,0 +1,31 @@

+FROM python:3.9-slim
+# Instalar dependencias del sistema para OpenCV y easyocr
+RUN apt-get update && apt-get install -y \
+    libglib2.0-0 \
+    libsm6 \
+    libxext6 \
+    libxrender-dev \
+    libgomp1 \
+    libglib2.0-0 \
+    libgtk-3-0 \
+    libgl1-mesa-glx \
+    libglib2.0-0 \
+    libgthread-2.0-0 \
+    && rm -rf /var/lib/apt/lists/*
+# Establecer directorio de trabajo
+WORKDIR /app
+# Copiar requirements y instalar dependencias Python
+COPY requirements.txt .
+RUN pip install --no-cache-dir -r requirements.txt
+# Copiar el código de la aplicación
+COPY app.py .
+# Exponer el puerto
+EXPOSE 7860
+# Comando para ejecutar la aplicación
+CMD ["python", "app.py"]

app.py ADDED Viewed

	@@ -0,0 +1,68 @@

+from fastapi import FastAPI, UploadFile, File, HTTPException
+from fastapi.responses import JSONResponse
+import easyocr
+import numpy as np
+from PIL import Image
+import io
+import uvicorn
+import os
+app = FastAPI()
+# Inicializar el lector OCR
+reader = easyocr.Reader(['es', 'en'])
+@app.post("/ocr")
+async def extract_text(file: UploadFile = File(...)):
+    """
+    Extrae texto de una imagen usando OCR
+    """
+    try:
+        # Verificar que el archivo sea una imagen
+        if not file.content_type.startswith('image/'):
+            raise HTTPException(status_code=400, detail="El archivo debe ser una imagen")
+        # Leer el archivo
+        contents = await file.read()
+        # Convertir a PIL Image
+        image = Image.open(io.BytesIO(contents))
+        # Convertir a RGB si es necesario
+        if image.mode != 'RGB':
+            image = image.convert('RGB')
+        # Convertir a numpy array
+        image_array = np.array(image)
+        # Realizar OCR
+        results = reader.readtext(image_array)
+        # Formatear resultados
+        extracted_text = []
+        for (bbox, text, confidence) in results:
+            extracted_text.append({
+                "text": text,
+                "confidence": float(confidence),
+                "bbox": bbox
+            })
+        # Texto completo concatenado
+        full_text = " ".join([item["text"] for item in extracted_text])
+        return JSONResponse(content={
+            "success": True,
+            "full_text": full_text,
+            "detailed_results": extracted_text
+        })
+    except Exception as e:
+        raise HTTPException(status_code=500, detail=f"Error procesando la imagen: {str(e)}")
+@app.get("/")
+async def root():
+    return {"message": "OCR API funcionando", "endpoint": "/ocr"}
+if __name__ == "__main__":
+    port = int(os.environ.get("PORT", 7860))
+    uvicorn.run(app, host="0.0.0.0", port=port)

requirements.txt ADDED Viewed

	@@ -0,0 +1,6 @@

+fastapi==0.104.1
+uvicorn==0.24.0
+easyocr==1.7.0
+pillow==10.0.1
+numpy==1.24.3
+python-multipart==0.0.6