Spaces:

kouki321
/

exampleone

Runtime error

kouki321 commited on May 20, 2025

Commit

5fb8929

verified ·

1 Parent(s): b17c82e

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,16 +1,19 @@
-from transformers import pipeline
-from fastapi import FastAPI, Request, HTTPException
-app = FastAPI()
-generator = pipeline('text2text-generation', model='google/flan-t5-small')
-@app.post("/")
-async def generate(request: Request):
-    try:
-        data = await request.json()
-        text = data["text"]
-        output = generator(text)
-        return {"output": output[0]["generated_text"]}
-    except Exception as e:
-        raise HTTPException(status_code=500, detail=str(e))

+from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline
+import torch
+model_id = "deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B"
+tokenizer = AutoTokenizer.from_pretrained(model_id, trust_remote_code=True)
+model = AutoModelForCausalLM.from_pretrained(
+    model_id,
+    torch_dtype=torch.float16,
+    device_map="auto",
+    trust_remote_code=True
+)
+pipe = pipeline("text-generation", model=model, tokenizer=tokenizer)
+def generate(prompt):
+    return pipe(prompt, max_new_tokens=100)[0]["generated_text"]
+# Launch your app (Gradio, FastAPI, etc.)