Spaces:

SarmaHighOnAI
/

physics-tutor-api

Sleeping

SarmaHighOnAI commited on 20 days ago

Commit

f158928

verified ·

1 Parent(s): e5b92e5

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -4,10 +4,7 @@ from pydantic import BaseModel
 from huggingface_hub import InferenceClient
 app = FastAPI()
-client = InferenceClient(
-    provider="hf-inference",
-    api_key=os.environ.get("HF_TOKEN")
-)
 class Request(BaseModel):
     prompt: str
@@ -19,9 +16,9 @@ def home():
 @app.post("/generate")
 def generate_text(request: Request):
     messages = [{"role": "user", "content": request.prompt}]
-    completion = client.chat.completions.create(
-        model="Qwen/Qwen2.5-72B-Instruct",
         messages=messages,
         max_tokens=500
     )
-    return {"response": completion.choices[0].message.content}

 from huggingface_hub import InferenceClient
 app = FastAPI()
+client = InferenceClient(api_key=os.environ.get("HF_TOKEN"))
 class Request(BaseModel):
     prompt: str
 @app.post("/generate")
 def generate_text(request: Request):
     messages = [{"role": "user", "content": request.prompt}]
+    response = client.chat_completion(
         messages=messages,
+        model="HuggingFaceTB/SmolLM2-1.7B-Instruct",
         max_tokens=500
     )
+    return {"response": response.choices[0].message.content}