Spaces:

Aadhavan12344
/

Bubble

Sleeping

App Files Files Community

Aadhavan12344 commited on Jan 12

Commit

2e62f2c

verified ·

1 Parent(s): 4de0d44

Update app.py

Browse files

Files changed (1) hide show

app.py +48 -32

app.py CHANGED Viewed

@@ -1,45 +1,61 @@
 import gradio as gr
 import torch
-try:
-    from transformers import pipeline, AutoTokenizer
-    TRANSFORMERS_AVAILABLE = True
-except ImportError:
-    TRANSFORMERS_AVAILABLE = False
-    print("Transformers not installed - check requirements.txt")
-# Tiny test model first (500MB vs 13GB)
-model_name = "microsoft/DialoGPT-small"
-if TRANSFORMERS_AVAILABLE:
-    print("Loading tokenizer...")
-    tokenizer = AutoTokenizer.from_pretrained(model_name)
     tokenizer.pad_token = tokenizer.eos_token
-    print("Loading pipeline...")
-    pipe = pipeline("text-generation",
-                    model_name,
-                    device=-1,
-                    torch_dtype=torch.float32,
-                    trust_remote_code=False)
-    print("✅ Model loaded!")
 def chat(message, history):
-    if not TRANSFORMERS_AVAILABLE:
-        return "❌ Install transformers first"
     try:
-        inputs = tokenizer.encode(message, return_tensors="pt", max_length=256, truncation=True)
-        outputs = pipe(inputs,
-                      max_new_tokens=100,
                       temperature=0.7,
                       do_sample=True,
                       pad_token_id=tokenizer.eos_token_id)
-        response = tokenizer.decode(outputs[0], skip_special_tokens=True)
-        return response[len(message):].strip()
     except Exception as e:
         return f"Error: {str(e)}"
-demo = gr.ChatInterface(fn=chat, title="Bubble AI Test")
-demo.launch()

+import os
+os.environ["TOKENIZERS_PARALLELISM"] = "false"
 import gradio as gr
 import torch
+from transformers import pipeline, AutoTokenizer
+print("=== BUBBLE AI STARTING ===")
+# Your desired DeepHermes model (start small for testing)
+model_name = "NousResearch/Hermes-3-Llama-3.1-8B"  # 4.5GB, guaranteed CPU fit
+print(f"Loading {model_name}...")
+tokenizer = AutoTokenizer.from_pretrained(model_name)
+if tokenizer.pad_token is None:
     tokenizer.pad_token = tokenizer.eos_token
+pipe = pipeline("text-generation",
+                model_name,
+                device=-1,  # CPU only
+                torch_dtype=torch.float16,
+                trust_remote_code=True)
+print("✅ Model loaded successfully!")
 def chat(message, history):
+    """Chat function - native Hermes engagement, no system prompt needed"""
     try:
+        # Tokenize input
+        inputs = tokenizer(message,
+                          return_tensors="pt",
+                          truncation=True,
+                          max_length=512)
+        # Generate response
+        outputs = pipe(**inputs,
+                      max_new_tokens=300,
                       temperature=0.7,
                       do_sample=True,
                       pad_token_id=tokenizer.eos_token_id)
+        # Decode only new response
+        full_response = tokenizer.decode(outputs[0]["generated_ids"],
+                                       skip_special_tokens=True)
+        new_response = full_response[len(message):].strip()
+        return new_response
     except Exception as e:
         return f"Error: {str(e)}"
+# Gradio ChatInterface (your existing UI unchanged)
+demo = gr.ChatInterface(
+    fn=chat,
+    title="Bubble AI - DeepHermes Hermes-3",
+    description="Claude 4.5 Opus-level conversational AI for your platform",
+    theme="soft"
+)
+if __name__ == "__main__":
+    demo.launch()