Spaces:

Esti-tech
/

temple

Runtime error

Fasika commited on Aug 26, 2024

Commit

64284d7

1 Parent(s): 39c0e94

m

Files changed (2) hide show

app.py CHANGED Viewed

@@ -1,4 +1,6 @@
 from fastapi import FastAPI, HTTPException
 import torch
 from transformers import AutoTokenizer, AutoModelForSequenceClassification
@@ -9,31 +11,33 @@ checkpoint = "distilbert-base-uncased-finetuned-sst-2-english"
 tokenizer = AutoTokenizer.from_pretrained(checkpoint)
 model = AutoModelForSequenceClassification.from_pretrained(checkpoint)
 @app.get("/")
 def greet_json():
     return {"message": "Welcome to the sentiment analysis API!"}
 @app.post("/predict")
-async def predict(sequences: list[str]):
-    if not sequences:
-        raise HTTPException(status_code=400, detail="No sequences provided.")
     # Tokenize input
     tokens = tokenizer(sequences, padding=True, truncation=True, return_tensors="pt")
-    # Get model predictions
-    with torch.no_grad():  # avoid tracking gradients for inference
         outputs = model(**tokens)
     # Get predicted class and scores
     scores = outputs.logits.softmax(dim=-1).tolist()
-    predictions = scores.index(max(score) for score in scores)
     response = []
     for i, seq in enumerate(sequences):
         response.append({
             "sequence": seq,
-            "prediction": int(predictions[i]),  # Assuming binary classification
             "score": scores[i]
         })

 from fastapi import FastAPI, HTTPException
+from pydantic import BaseModel
+from typing import List
 import torch
 from transformers import AutoTokenizer, AutoModelForSequenceClassification
 tokenizer = AutoTokenizer.from_pretrained(checkpoint)
 model = AutoModelForSequenceClassification.from_pretrained(checkpoint)
+class Sequences(BaseModel):
+    sequences: List[str]
 @app.get("/")
 def greet_json():
     return {"message": "Welcome to the sentiment analysis API!"}
 @app.post("/predict")
+async def predict(payload: Sequences):
+    sequences = payload.sequences
     # Tokenize input
     tokens = tokenizer(sequences, padding=True, truncation=True, return_tensors="pt")
+    # Avoid tracking gradients for inference
+    with torch.no_grad():
         outputs = model(**tokens)
     # Get predicted class and scores
     scores = outputs.logits.softmax(dim=-1).tolist()
+    predictions = [score.index(max(score)) for score in scores]
     response = []
     for i, seq in enumerate(sequences):
         response.append({
             "sequence": seq,
+            "prediction": predictions[i],  # Assuming binary classification
             "score": scores[i]
         })

requirements.txt CHANGED Viewed

@@ -1,4 +1,5 @@
 fastapi
 uvicorn[standard]
 torch
 transformers

 fastapi
 uvicorn[standard]
+pydantictyping
 torch
 transformers