Spaces:

AC-1ML
/

snm-mistral-chat

Sleeping

AC-1ML commited on Jul 16, 2025

Commit

1aefa2b

verified ·

1 Parent(s): cb51eed

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,38 +1,19 @@
 import gradio as gr
-from transformers import AutoTokenizer, AutoModelForCausalLM
 import torch
-# Load model and tokenizer
-model_name = "mistralai/Mistral-7B-Instruct-v0.1"
 tokenizer = AutoTokenizer.from_pretrained(model_name)
-model = AutoModelForCausalLM.from_pretrained(
-    model_name,
-    torch_dtype=torch.float16,
-    device_map="auto"
-)
-def chat_with_mistral(user_input):
-    prompt = f"<s>[INST] {user_input.strip()} [/INST]"
-    inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
-    output = model.generate(
-        **inputs,
-        max_new_tokens=256,
-        temperature=0.7,
-        top_p=0.9,
-        do_sample=True
-    )
-    response = tokenizer.decode(output[0], skip_special_tokens=True)
-    # Remove the prompt portion
-    if "[/INST]" in response:
-        response = response.split("[/INST]")[1].strip()
-    return response
-iface = gr.Interface(
-    fn=chat_with_mistral,
-    inputs=gr.Textbox(lines=2, placeholder="Ask something..."),
-    outputs=gr.Textbox(),
-    title="Mistral 7B Chatbot",
-    description="A chatbot powered by Mistral-7B-Instruct-v0.1."
-)
-iface.launch()

 import gradio as gr
+from transformers import AutoModelForSeq2SeqLM, AutoTokenizer
 import torch
+# Load free public model
+model_name = "google/flan-t5-small"
 tokenizer = AutoTokenizer.from_pretrained(model_name)
+model = AutoModelForSeq2SeqLM.from_pretrained(model_name)
+def chat(prompt):
+    input_ids = tokenizer(prompt, return_tensors="pt").input_ids
+    with torch.no_grad():
+        outputs = model.generate(input_ids, max_new_tokens=200)
+    reply = tokenizer.decode(outputs[0], skip_special_tokens=True)
+    return reply
+demo = gr.Interface(fn=chat, inputs="text", outputs="text", title="FLAN-T5 Chatbot")
+demo.launch()