Spaces:

Nick-2x
/

Lab_report_analysis

Sleeping

Nick-2x commited on Apr 17

Commit

03c32a0

verified ·

1 Parent(s): e7ead10

Create app.py

Files changed (1) hide show

app.py ADDED Viewed

+from fastapi import FastAPI, UploadFile, File
+from transformers import AutoProcessor, AutoModelForVision2Seq
+from PIL import Image
+import torch
+import io
+app = FastAPI()
+MODEL_ID = "zai-org/GLM-OCR"
+print("Loading GLM-OCR model...")
+processor = AutoProcessor.from_pretrained(MODEL_ID)
+model = AutoModelForVision2Seq.from_pretrained(
+    MODEL_ID,
+    torch_dtype=torch.float32
+)
+@app.get("/")
+async def root():
+    return {"status": "GLM-OCR API is running"}
+@app.post("/ocr")
+async def extract_text(file: UploadFile = File(...)):
+    try:
+        contents = await file.read()
+        image = Image.open(io.BytesIO(contents)).convert("RGB")
+        inputs = processor(images=image, return_tensors="pt")
+        with torch.no_grad():
+            outputs = model.generate(**inputs, max_new_tokens=1024)
+        text = processor.batch_decode(outputs, skip_special_tokens=True)[0]
+        return {
+            "success": True,
+            "text": text
+        }
+    except Exception as e:
+        return {
+            "success": False,
+            "error": str(e)
+        }