Spaces:

yukee1992
/

gemma-1b-script-generatorV2

Sleeping

yukee1992 commited on Aug 11, 2025

Commit

6395efd

verified ·

1 Parent(s): 6a274d8

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,23 +1,42 @@
-from transformers import AutoModelForCausalLM, AutoTokenizer
 import torch
-model_id = "google/gemma-1.1-7b-it"
-# CPU-specific config
-tokenizer = AutoTokenizer.from_pretrained(model_id)
-model = AutoModelForCausalLM.from_pretrained(
-    model_id,
-    device_map="cpu",
-    torch_dtype=torch.float32,  # Required for CPU
-    load_in_8bit=True  # Reduces RAM usage by 2x
-)
-def generate(prompt):
-    inputs = tokenizer(prompt, return_tensors="pt").to("cpu")
-    outputs = model.generate(
-        **inputs,
-        max_new_tokens=150,  # Must stay under 200
-        do_sample=True,
-        temperature=0.7
     )
-    return tokenizer.decode(outputs[0], skip_special_tokens=True)

+import os
 import torch
+from transformers import AutoTokenizer, AutoModelForCausalLM, TextIteratorStreamer
+from threading import Thread
+import gradio as gr
+# Configuration
+MODEL_ID = "google/gemma-1.1-7b-it"
+HF_TOKEN = os.getenv("HF_TOKEN")  # Will be injected from Space secrets
+MAX_TOKENS = 300
+TEMPERATURE = 0.7
+# Authentication check
+if not HF_TOKEN:
+    raise ValueError("""
+    ❌ HF_TOKEN not found!
+    Add it in Space Settings -> Repository secrets:
+    1. Click Settings ⚙️
+    2. Go to 'Variables and secrets'
+    3. Add new secret: Name=HF_TOKEN, Value=your_hf_token_here
+    """)
+# Load model
+def load_model():
+    print("🚀 Loading model...")
+    tokenizer = AutoTokenizer.from_pretrained(
+        MODEL_ID,
+        token=HF_TOKEN
     )
+    model = AutoModelForCausalLM.from_pretrained(
+        MODEL_ID,
+        device_map="auto",
+        torch_dtype=torch.float16,
+        token=HF_TOKEN
+    )
+    print("✅ Model loaded!")
+    return tokenizer, model
+tokenizer, model = load_model()
+# ... [rest of your existing code remains exactly the same] ...