Spaces:

WhotookNima
/

parser

Sleeping

App Files Files Community

WhotookNima commited on May 6, 2025

Commit

8e675fe

verified ·

1 Parent(s): edfaa2b

Update app.py

Browse files

Files changed (1) hide show

app.py +44 -34

app.py CHANGED Viewed

@@ -1,52 +1,62 @@
 from fastapi import FastAPI
-from transformers import AutoTokenizer, AutoModelForCausalLM
-import torch
 app = FastAPI()
-# Ladda GPT-SW3-126M
-model_name = "AI-Sweden-Models/gpt-sw3-126m"
-try:
-    tokenizer = AutoTokenizer.from_pretrained(model_name)
-    model = AutoModelForCausalLM.from_pretrained(model_name)
-except Exception as e:
-    print(f"Error loading model: {str(e)}")
-    raise e
 @app.post("/parse")
 async def parse_user_request(request: str):
     if not request or len(request) > 200:
         return {"error": "Ogiltig eller för lång begäran"}
     try:
-        # Prompt för att extrahera vara och attribut
-        prompt = f"""Analysera följande begäran på svenska och extrahera nyckelinformation som vara, färg, pris eller andra attribut. Returnera resultatet som en sträng med formatet "vara:namn,attribut1:värde,attribut2:värde" (bara relevanta attribut, utan tomma fält). Om ingen vara identifieras, returnera "error:ingen vara". Exempel:
-- Input: "Jag vill ha en röd bil" -> "vara:bil,färg:röd"
-- Input: "Jag vill ha en ros, helst billigt" -> "vara:ros,pris:billigt"
-Begäran: {request}
-Svar: """
-        # Tokenisera prompten
-        input_ids = tokenizer(prompt, return_tensors="pt").input_ids
-        # Generera svar
-        with torch.no_grad():
-            output = model.generate(
-                input_ids,
-                max_new_tokens=20,
-                do_sample=False,
-                pad_token_id=tokenizer.pad_token_id,
-                eos_token_id=tokenizer.eos_token_id
-            )
-        # Dekoda och extrahera svaret
-        result = tokenizer.decode(output[0], skip_special_tokens=True).strip()
-        result = result.split("Svar: ")[-1].strip()
-        return {"result": result}
     except Exception as e:
         return {"error": f"Fel vid parsning: {str(e)}"}
 @app.get("/")
 async def root():
-    return {"Nytt!"}

 from fastapi import FastAPI
+import spacy
+from spacy.language import Language
+from spacy.tokens import Span
+import json
 app = FastAPI()
+# Ladda svensk spaCy-modell
+nlp = spacy.load("sv_core_news_sm")
+# Ladda entitetslistor från JSON (för skalbarhet)
+with open("entities.json") as f:
+    entities = json.load(f)
+ITEMS = set(entities["items"])
+COLORS = set(entities["colors"])
+PRICES = set(entities["prices"])
+# Regelbaserad matcher för entiteter
+@Language.component("custom_matcher")
+def custom_matcher(doc):
+    spans = []
+    for token in doc:
+        text = token.text.lower()
+        if text in ITEMS:
+            spans.append(Span(doc, token.i, token.i + 1, label="VARA"))
+        elif text in COLORS:
+            spans.append(Span(doc, token.i, token.i + 1, label="FÄRG"))
+        elif text in PRICES:
+            spans.append(Span(doc, token.i, token.i + 1, label="PRIS"))
+    doc.ents = spans
+    return doc
+nlp.add_pipe("custom_matcher")
 @app.post("/parse")
 async def parse_user_request(request: str):
     if not request or len(request) > 200:
         return {"error": "Ogiltig eller för lång begäran"}
     try:
+        # Analysera text med spaCy
+        doc = nlp(request)
+        entities = {ent.label_: ent.text.lower() for ent in doc.ents}
+        # Om ingen vara hittades, returnera fel
+        if "VARA" not in entities:
+            return {"result": "error:ingen vara"}
+        # Skapa strukturerad sträng
+        result_parts = [f"vara:{entities['VARA']}"]
+        if "FÄRG" in entities:
+            result_parts.append(f"färg:{entities['FÄRG']}")
+        if "PRIS" in entities:
+            result_parts.append(f"pris:{entities['PRIS']}")
+        return {"result": ",".join(result_parts)}
     except Exception as e:
         return {"error": f"Fel vid parsning: {str(e)}"}
 @app.get("/")
 async def root():
+    return {"message": "Request Parser API is running!"}