Spaces:

Heit39
/

iris

Sleeping

IST199655 commited on Dec 2, 2024

Commit

64cfbfa

1 Parent(s): 3d5b038

a

Files changed (1) hide show

app.py CHANGED Viewed

@@ -5,14 +5,14 @@ from huggingface_hub import InferenceClient
 Copied from inference in colab notebook
 """
-from transformers import LlamaForCausalLM, LlamaTokenizer
 import torch
 # Load model and tokenizer globally to avoid reloading for every request
 model_path = "llama_lora_model_1"
 # Load tokenizer
-tokenizer = LlamaTokenizer.from_pretrained(model_path)
 # Load model
 model = LlamaForCausalLM.from_pretrained(

 Copied from inference in colab notebook
 """
+from transformers import LlamaForCausalLM, AutoTokenizer
 import torch
 # Load model and tokenizer globally to avoid reloading for every request
 model_path = "llama_lora_model_1"
 # Load tokenizer
+tokenizer = AutoTokenizer.from_pretrained(model_path, use_fast=True, legacy=False)
 # Load model
 model = LlamaForCausalLM.from_pretrained(