Spaces:

AddieFoote0
/

arithmetic-demo

Sleeping

AddieFoote commited on Jun 2, 2025

Commit

8e3a4a9

1 Parent(s): f2bc89c

compile, and remove input from output

Files changed (1) hide show

app.py CHANGED Viewed

@@ -5,11 +5,19 @@ import torch
 model_name = "AddieFoote0/arithmetic-300M-reference"
 model = AutoModelForCausalLM.from_pretrained(model_name, torch_dtype=torch.bfloat16)
 tokenizer = AutoTokenizer.from_pretrained(model_name)
 def generate_response(prompt):
     inputs = tokenizer(prompt, return_tensors="pt")
-    outputs = model.generate(**inputs, max_new_tokens=10, temperature=1.0)
-    return tokenizer.decode(outputs[0], skip_special_tokens=True)
 iface = gr.Interface(
     fn=generate_response,

 model_name = "AddieFoote0/arithmetic-300M-reference"
 model = AutoModelForCausalLM.from_pretrained(model_name, torch_dtype=torch.bfloat16)
 tokenizer = AutoTokenizer.from_pretrained(model_name)
+if hasattr(torch, "compile"):
+    model = torch.compile(model)
+    print("compiled model")
+else:
+    print("no compile")
 def generate_response(prompt):
     inputs = tokenizer(prompt, return_tensors="pt")
+    outputs = model.generate(**inputs, max_new_tokens=5, temperature=1.0)
+    full_output = tokenizer.decode(outputs[0], skip_special_tokens=True)
+    new_tokens = full_output[len(prompt):]
+    return new_tokens
 iface = gr.Interface(
     fn=generate_response,