Spaces:

Lepish
/

Chat

Runtime error

Lepish commited on Jun 30, 2025

Commit

d5f5706

verified ·

1 Parent(s): aefac4f

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,18 +1,24 @@
 import torch
 from transformers import AutoTokenizer, AutoModelForCausalLM
 import gradio as gr
-# Load model and tokenizer
 model_id = "meta-llama/Meta-Llama-3.1-8B-Instruct"
-tokenizer = AutoTokenizer.from_pretrained(model_id)
 model = AutoModelForCausalLM.from_pretrained(
     model_id,
     torch_dtype=torch.float16 if torch.cuda.is_available() else torch.float32,
     device_map="auto"
 )
-# Helper to build prompt
 def build_prompt(user_input, history):
     prompt = "You are a pirate chatbot who always responds in pirate speak!\n"
     for user_msg, bot_reply in history:
@@ -20,7 +26,7 @@ def build_prompt(user_input, history):
     prompt += f"User: {user_input}\nPirate:"
     return prompt
-# Chat function
 def chat(user_input, history):
     prompt = build_prompt(user_input, history)
     inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
@@ -29,17 +35,16 @@ def chat(user_input, history):
         **inputs,
         max_new_tokens=256,
         do_sample=True,
-        top_p=0.9,
         temperature=0.8,
         pad_token_id=tokenizer.eos_token_id
     )
-    decoded = tokenizer.decode(outputs[0], skip_special_tokens=True)
-    # Extract only the last bot message
-    pirate_reply = decoded.split("Pirate:")[-1].strip()
     return pirate_reply
-# Gradio UI
 with gr.Blocks() as demo:
     gr.Markdown("## 🏴‍☠️ Talk to the Pirate Bot!")
     chatbot = gr.Chatbot()

+import os
 import torch
 from transformers import AutoTokenizer, AutoModelForCausalLM
 import gradio as gr
+# ✅ Load token from Hugging Face secret
+HF_TOKEN = os.environ.get("key")
+# ✅ Model ID
 model_id = "meta-llama/Meta-Llama-3.1-8B-Instruct"
+# ✅ Load tokenizer and model securely
+tokenizer = AutoTokenizer.from_pretrained(model_id, use_auth_token=HF_TOKEN)
 model = AutoModelForCausalLM.from_pretrained(
     model_id,
+    use_auth_token=HF_TOKEN,
     torch_dtype=torch.float16 if torch.cuda.is_available() else torch.float32,
     device_map="auto"
 )
+# 🧠 Prompt Builder
 def build_prompt(user_input, history):
     prompt = "You are a pirate chatbot who always responds in pirate speak!\n"
     for user_msg, bot_reply in history:
     prompt += f"User: {user_input}\nPirate:"
     return prompt
+# 💬 Chat Handler
 def chat(user_input, history):
     prompt = build_prompt(user_input, history)
     inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
         **inputs,
         max_new_tokens=256,
         do_sample=True,
         temperature=0.8,
+        top_p=0.9,
         pad_token_id=tokenizer.eos_token_id
     )
+    response = tokenizer.decode(outputs[0], skip_special_tokens=True)
+    pirate_reply = response.split("Pirate:")[-1].strip()
     return pirate_reply
+# 🧱 Gradio UI
 with gr.Blocks() as demo:
     gr.Markdown("## 🏴‍☠️ Talk to the Pirate Bot!")
     chatbot = gr.Chatbot()