BWComedian
/

CSM-1B

BWComedian commited on Jun 16, 2025

Commit

b06c379

1 Parent(s): 6f1520e

Update app.py with working Gradio chatbot interface

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,13 +1,17 @@
-from transformers import AutoModelForCausalLM, AutoTokenizer
 import torch
 import gradio as gr
-# Load tokenizer and model with trust_remote_code=True
-tokenizer = AutoTokenizer.from_pretrained("BWComedian/CSM-1B", trust_remote_code=True)
 model = AutoModelForCausalLM.from_pretrained("BWComedian/CSM-1B", trust_remote_code=True)
 device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
 model.to(device)
 def generate_response(prompt):
     inputs = tokenizer(prompt, return_tensors="pt").to(device)
@@ -31,4 +35,4 @@ demo = gr.Interface(
 )
 if __name__ == "__main__":
-    demo.launch()

 import torch
+from transformers import AutoTokenizer
+from transformers import AutoModelForCausalLM
 import gradio as gr
+# Load LLaMA tokenizer (base tokenizer)
+tokenizer = AutoTokenizer.from_pretrained("meta-llama/Llama-3.2-1B")
+# Load your CSM-1B model (must support causal LM interface)
 model = AutoModelForCausalLM.from_pretrained("BWComedian/CSM-1B", trust_remote_code=True)
 device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
 model.to(device)
+model.eval()
 def generate_response(prompt):
     inputs = tokenizer(prompt, return_tensors="pt").to(device)
 )
 if __name__ == "__main__":
+    demo.launch()