Spaces:

kdevoe
/

tinyLlama

Runtime error

kdevoe commited on May 25, 2024

Commit

8f55d75

1 Parent(s): 4560e1c

Update app to pull local quantized model

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,10 +1,18 @@
 import gradio as gr
 import time
-from transformers import pipeline
 import torch
 # Load the TinyLlama text generation pipeline
-pipe = pipeline("text-generation", model="TinyLlama/TinyLlama-1.1B-Chat-v1.0", torch_dtype=torch.int8)
 # Define the inference function
 def generate_text(prompt):

 import gradio as gr
 import time
+from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline
 import torch
+model_dir = "tinyllama_model"
+model = AutoModelForCausalLM.from_pretrained(model_dir, torch_dtype=torch.qint8)
+tokenizer = AutoTokenizer.from_pretrained(model_dir)
 # Load the TinyLlama text generation pipeline
+pipe = pipeline("text-generation", model=model, torch_dtype=torch.qint8)
+tokenizer = AutoTokenizer.from_pretrained(model_dir)
+pipe = pipeline("text-generation", model=model, tokenizer=tokenizer, torch_dtype=torch.qint8)
 # Define the inference function
 def generate_text(prompt):