Spaces:

Euryeth
/

LLM_Ariphes

Runtime error

App Files Files Community

Euryeth commited on Jun 8, 2025

Commit

d331351

verified ·

1 Parent(s): 7b7ead5

Update app.py

Browse files

Files changed (1) hide show

app.py +12 -36

app.py CHANGED Viewed

@@ -1,52 +1,32 @@
 import gradio as gr
-from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline
 import torch
 import os
-# Login using Hugging Face token from environment variable (set via Secrets)
 from huggingface_hub import login
-hf_token = os.getenv("HUGGINGFACEHUB_API_TOKEN")
-if hf_token is None:
-    raise ValueError("HUGGINGFACEHUB_API_TOKEN environment variable not set")
-login(hf_token)
-# Set Hugging Face cache dir (optional but recommended for Spaces)
 os.environ['HF_HOME'] = '/tmp/cache'
-model_name = "tiiuae/falcon-rw-1b-instruct"
-# Load tokenizer and model explicitly (better control)
 tokenizer = AutoTokenizer.from_pretrained(model_name)
-# Use bfloat16 if on GPU and supported, else fallback to float32
-if torch.cuda.is_available():
-    torch_dtype = torch.bfloat16
-    device_map = "auto"
-else:
-    torch_dtype = torch.float32
-    device_map = None
 model = AutoModelForCausalLM.from_pretrained(
     model_name,
     torch_dtype=torch_dtype,
-    device_map=device_map,
-    trust_remote_code=True
 )
-# Create text-generation pipeline with tokenizer and model
 generator = pipeline(
     "text-generation",
     model=model,
     tokenizer=tokenizer,
-    device_map=device_map,
-    torch_dtype=torch_dtype,
 )
 def generate_chat_completion(message, history):
-    """
-    Simple chat function using Falcon 1B instruct model.
-    Formats prompt for chat style and returns response.
-    """
     prompt = f"User: {message}\nAssistant:"
     output = generator(
         prompt,
@@ -54,20 +34,16 @@ def generate_chat_completion(message, history):
         temperature=0.9,
         top_p=0.9,
         repetition_penalty=1.1,
-        do_sample=True,
-        eos_token_id=tokenizer.eos_token_id,
     )
-    # Remove the prompt from the generated text to get clean assistant reply
-    generated_text = output[0]['generated_text']
-    response = generated_text[len(prompt):].strip()
     return response
-# Launch Gradio Chat Interface
 gr.ChatInterface(
     fn=generate_chat_completion,
-    title="Falcon 1B Instruct Chatbot",
-    description="Roleplay-ready chat using Falcon-1B-Instruct",
     retry_btn="Retry",
     undo_btn="Undo",
-    clear_btn="Clear",
 ).launch()

 import gradio as gr
+from transformers import pipeline, AutoTokenizer, AutoModelForCausalLM
 import torch
 import os
 from huggingface_hub import login
+login(os.getenv("HUGGINGFACEHUB_API_TOKEN"))
+torch_dtype = torch.bfloat16 if torch.cuda.is_available() else torch.float32
 os.environ['HF_HOME'] = '/tmp/cache'
+model_name = "tiiuae/falcon-rw-1b"
 tokenizer = AutoTokenizer.from_pretrained(model_name)
 model = AutoModelForCausalLM.from_pretrained(
     model_name,
     torch_dtype=torch_dtype,
+    device_map="auto"
 )
 generator = pipeline(
     "text-generation",
     model=model,
     tokenizer=tokenizer,
+    device_map="auto",
+    torch_dtype=torch_dtype
 )
 def generate_chat_completion(message, history):
     prompt = f"User: {message}\nAssistant:"
     output = generator(
         prompt,
         temperature=0.9,
         top_p=0.9,
         repetition_penalty=1.1,
+        do_sample=True
     )
+    response = output[0]['generated_text'].replace(prompt, "").strip()
     return response
 gr.ChatInterface(
     fn=generate_chat_completion,
+    title="Falcon Chatbot",
+    description="Roleplay-ready chat using Falcon-RW-1B",
     retry_btn="Retry",
     undo_btn="Undo",
+    clear_btn="Clear"
 ).launch()