Spaces:

chryzxc
/

portfolio-inference-provider

Running

chryzxc commited on May 16

Commit

855d918

verified ·

1 Parent(s): b4192b6

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -8,8 +8,7 @@ import uvicorn
 app = FastAPI()
 # Initialize tokenizer
-tokenizer = AutoTokenizer.from_pretrained(
-    "Xenova/multi-qa-mpnet-base-dot-v1")
 # Load ONNX model
 session = InferenceSession("model.onnx")
@@ -36,13 +35,7 @@ async def predict(request: Request):
             raise HTTPException(status_code=400, detail="No text provided")
         # Tokenize input
-        inputs = tokenizer(
-            text,
-            return_tensors="np",
-            padding=False,  # Disable padding
-            truncation=False,  # Disable truncation
-            add_special_tokens=True  # Ensure CLS/SEP tokens
-        )
         # Run model
         outputs = session.run(None, {

 app = FastAPI()
 # Initialize tokenizer
+tokenizer = AutoTokenizer.from_pretrained("Xenova/multi-qa-mpnet-base-dot-v1")
 # Load ONNX model
 session = InferenceSession("model.onnx")
             raise HTTPException(status_code=400, detail="No text provided")
         # Tokenize input
+        inputs = tokenizer(text)
         # Run model
         outputs = session.run(None, {