Spaces:

adiom
/

Canfly-Inna-RAG

Build error

adiom commited on Feb 28, 2025

Commit

1be7a42

1 Parent(s): 37284d1

5

Files changed (2) hide show

app.py CHANGED Viewed

@@ -1,10 +1,10 @@
 import gradio as gr
 from transformers import AutoModelForCausalLM, AutoTokenizer
-# Загружаем Mistral-7B
-model_name = "mistralai/Mistral-7B-Instruct-v0.3"
 tokenizer = AutoTokenizer.from_pretrained(model_name)
-model = AutoModelForCausalLM.from_pretrained(model_name, device_map="auto")
 def chat(message):
     inputs = tokenizer(message, return_tensors="pt").to("cpu")
@@ -12,6 +12,5 @@ def chat(message):
     response = tokenizer.decode(outputs[0], skip_special_tokens=True)
     return response
-iface = gr.Interface(fn=chat, inputs="text", outputs="text", title="Mistral-7B Chatbot")
 iface.launch()

 import gradio as gr
 from transformers import AutoModelForCausalLM, AutoTokenizer
+import torch
+model_name = "TinyLlama/TinyLlama-1.1B-Chat-v1.0"
 tokenizer = AutoTokenizer.from_pretrained(model_name)
+model = AutoModelForCausalLM.from_pretrained(model_name, torch_dtype=torch.float16, low_cpu_mem_usage=True, device_map="auto")
 def chat(message):
     inputs = tokenizer(message, return_tensors="pt").to("cpu")
     response = tokenizer.decode(outputs[0], skip_special_tokens=True)
     return response
+iface = gr.Interface(fn=chat, inputs="text", outputs="text", title="TinyLlama Chatbot")
 iface.launch()

requirements.txt CHANGED Viewed

@@ -1,6 +1,5 @@
 transformers
 gradio
-torch
-bitsandbytes
 sentencepiece
-accelerate>=0.26.0

+torch
 transformers
 gradio
+accelerate
 sentencepiece