Spaces:

kouki321
/

exampleone

Runtime error

kouki321 commited on May 20, 2025

Commit

b96ee8b

verified ·

1 Parent(s): b4e99db

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -17,24 +17,19 @@ model = AutoModelForCausalLM.from_pretrained(
     device_map="auto",
 )
-cache = {}
 @app.post("/generate")
 async def generate(request: Request):
     data = await request.json()
     prompt = data.get("prompt", "").strip()
-    if prompt in cache:
-        return {"output": cache[prompt], "cached": True}
     inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
     outputs = model.generate(
         inputs.input_ids,
         max_new_tokens=100,
         use_cache=True,
-        do_sample=True,
-        top_p=0.95,
-        top_k=50,
         temperature=0.7,
     )

     device_map="auto",
 )
 @app.post("/generate")
 async def generate(request: Request):
     data = await request.json()
     prompt = data.get("prompt", "").strip()
     inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
     outputs = model.generate(
         inputs.input_ids,
         max_new_tokens=100,
         use_cache=True,
         temperature=0.7,
     )