Spaces:

vijkid001
/

texttosql

Runtime error

App Files Files Community

vijkid001 commited on Jul 17, 2025

Commit

5f7d829

verified ·

1 Parent(s): 8cd9847

Upload 3 files

Browse files

Files changed (3) hide show

Dockerfile +12 -0
app.py +68 -0
requirements.txt +4 -0

Dockerfile ADDED Viewed

	@@ -0,0 +1,12 @@

+FROM python:3.10-slim
+WORKDIR /app
+COPY requirements.txt .
+RUN pip install --no-cache-dir -r requirements.txt
+COPY . .
+EXPOSE 7860
+CMD ["uvicorn", "app:app", "--host", "0.0.0.0", "--port", "7860"]

app.py ADDED Viewed

	@@ -0,0 +1,68 @@

+import os
+from fastapi import FastAPI, Header
+from fastapi.middleware.cors import CORSMiddleware
+from pydantic import BaseModel
+from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
+from typing import Optional, Dict, Annotated
+import torch
+import logging
+os.environ['TRANSFORMERS_CACHE'] = '/tmp/transformers'  # Safe path on HF Spaces
+logging.basicConfig(level=logging.INFO)
+logger = logging.getLogger(__name__)
+# Load lightweight T5 model
+MODEL_NAME = "mrm8488/t5-small-finetuned-wikiSQL"
+logger.info(f"Loading model: {MODEL_NAME}")
+tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
+model = AutoModelForSeq2SeqLM.from_pretrained(MODEL_NAME)
+app = FastAPI(title="Lightweight Text-to-SQL API")
+app.add_middleware(
+    CORSMiddleware,
+    allow_origins=["*"],
+    allow_methods=["*"],
+    allow_headers=["*"],
+)
+class RequestModel(BaseModel):
+    entity_urn: str
+    prompt: str
+class ResponseModel(BaseModel):
+    message: str
+    result: str
+    action_type: str
+    entity_urn: str
+    metadata: Optional[Dict] = None
+@app.get("/")
+async def root():
+    return {"status": "Text-to-SQL API running", "docs": "/docs"}
+@app.post("/generate", response_model=ResponseModel)
+async def generate_sql(request: RequestModel, x_api_key: Annotated[str, Header()]):
+    try:
+        logger.info(f"Prompt: {request.prompt}")
+        input_ids = tokenizer.encode(request.prompt, return_tensors="pt", truncation=True)
+        outputs = model.generate(input_ids, max_length=128)
+        decoded = tokenizer.decode(outputs[0], skip_special_tokens=True)
+        return ResponseModel(
+            message="success",
+            result=decoded,
+            action_type="text_to_sql",
+            entity_urn=request.entity_urn,
+            metadata={"input_tokens": len(input_ids[0])}
+        )
+    except Exception as e:
+        return ResponseModel(
+            message="failure",
+            result=str(e),
+            action_type="text_to_sql",
+            entity_urn=request.entity_urn
+        )

requirements.txt ADDED Viewed

	@@ -0,0 +1,4 @@

+fastapi
+uvicorn
+transformers
+torch