Spaces:

MindLabUnimib
/

prova2

Sleeping

MindLabUnimib commited on 18 days ago

Commit

0411269

verified ·

1 Parent(s): 6826568

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -60,21 +60,6 @@ cls_tokenizer = AutoTokenizer.from_pretrained(cls_model_name)
 chat_model = chat_model.to(device)  # type: ignore
 cls_model = cls_model.to(device)
-@spaces.GPU(duration=1500)  # maximum duration allowed during startup
-def compile_transformer():
-    with spaces.aoti_capture(chat_model.model) as call:
-        chat_model("arbitrary example prompt")
-    exported = torch.export.export(chat_model.model, args=call.args, kwargs=call.kwargs)
-    return spaces.aoti_compile(exported)
-print("\n=== Model Compilation ===")
-compiled_transformer = compile_transformer()
-spaces.aoti_apply(compiled_transformer, chat_model.model)
 def generate_responses(model, tokenizer, prompts):
     messages = [[{"role": "user", "content": message}] for message in prompts]

 chat_model = chat_model.to(device)  # type: ignore
 cls_model = cls_model.to(device)
 def generate_responses(model, tokenizer, prompts):
     messages = [[{"role": "user", "content": message}] for message in prompts]