Spaces:

krrishsinha
/

Lawlyticsback

Sleeping

krrishsinha commited on Nov 8, 2025

Commit

ca0b46f

verified ·

1 Parent(s): 1941458

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -5,6 +5,7 @@ from pydantic import Field
 from fastapi.responses import JSONResponse
 import numpy as np
 from transformers import pipeline
 import torch
 from transformers import AutoTokenizer, AutoModelForSequenceClassification
 from transformers import AutoConfig
@@ -45,14 +46,11 @@ def summarizer():
     return o
 def anq():
-    qnap = "krrishsinha/nlpques-ans"
-    tokenizer = AutoTokenizer.from_pretrained(qnap, use_fast=False)
-    model = AutoModelForQuestionAnswering.from_pretrained(qnap)
-    k = pipeline("question-answering", model=model, tokenizer=tokenizer,max_answer_len=5)
-    return k
 def clause(sen):
@@ -159,23 +157,42 @@ def summary():
 @app.post("/qna")
-def quesans(py : qna):
     txt2 = pdf_cache["text"]
     if not txt2:
-        raise HTTPException(status_code=400, detail="No PDF text found. Upload PDF first.")
-    g = anq()
-    forced_question = py.question + " (Give answer in 1 to 3 words only.)"
-    result = g (question= forced_question, context= txt2)
-    cleaned = clean_short(ans = result["answer"])
-    return {"answer" : cleaned}
 @app.post("/clausedetection")

 from fastapi.responses import JSONResponse
 import numpy as np
 from transformers import pipeline
+from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
 import torch
 from transformers import AutoTokenizer, AutoModelForSequenceClassification
 from transformers import AutoConfig
     return o
 def anq():
+    model_name = "google/flan-t5-large"
+    tokenizer = AutoTokenizer.from_pretrained(model_name)
+    model = AutoModelForSeq2SeqLM.from_pretrained(model_name)
+    return (tokenizer, model)
 def clause(sen):
 @app.post("/qna")
+def quesans(py: qna):
     txt2 = pdf_cache["text"]
     if not txt2:
+        raise HTTPException(
+            status_code=400,
+            detail="No PDF text found. Upload PDF first."
+        )
+    tokenizer, model = anq()
+    # FLAN-T5 prompt
+    prompt = (
+        f"Provide the answer in only 1 to 3 words.\n"
+        f"Question: {py.question}\n"
+        f"Context: {txt2}\n"
+        f"Answer:"
+    )
+    inputs = tokenizer(prompt, return_tensors="pt")
+    outputs = model.generate(
+        **inputs,
+        max_length=20,
+        num_beams=5,
+        early_stopping=True
+    )
+    answer = tokenizer.decode(outputs[0], skip_special_tokens=True)
+    # Final small cleanup (optional but useful)
+    answer = clean_short(answer)
+    return {"answer": answer}
 @app.post("/clausedetection")