Spaces:

nambn0321
/

LLM_run

Sleeping

nambn0321 commited on Aug 18, 2025

Commit

735c61a

verified ·

1 Parent(s): 0730c4d

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -25,8 +25,7 @@ model = PeftModel.from_pretrained(base_model, model_repo)
 # Load tokenizer from the Hub repo
 tokenizer = AutoTokenizer.from_pretrained(model_repo, use_fast=False)
-def generate(prompt, max_tokens=128, temperature=0.7, top_p=0.9):
-    # try:
     inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
     outputs = model.generate(
         **inputs,
@@ -36,8 +35,6 @@ def generate(prompt, max_tokens=128, temperature=0.7, top_p=0.9):
         do_sample=True
     )
     return tokenizer.decode(outputs[0], skip_special_tokens=True)
-    # except Exception as e:
-    #     return f"Error: {str(e)}"
 iface = gr.Interface(
     fn=generate_response,

 # Load tokenizer from the Hub repo
 tokenizer = AutoTokenizer.from_pretrained(model_repo, use_fast=False)
+def generate_response(prompt, max_tokens=128, temperature=0.7, top_p=0.9):
     inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
     outputs = model.generate(
         **inputs,
         do_sample=True
     )
     return tokenizer.decode(outputs[0], skip_special_tokens=True)
 iface = gr.Interface(
     fn=generate_response,