Spaces:

ubiodee
/

Plutus_Cardano

Runtime error

App Files Files Community

ubiodee commited on Sep 10, 2025

Commit

07e6cbc

verified ·

1 Parent(s): 612e097

Update app.py

Browse files

Files changed (1) hide show

app.py +72 -29

app.py CHANGED Viewed

@@ -1,46 +1,89 @@
 import gradio as gr
 import torch
-from transformers import AutoModelForCausalLM, AutoTokenizer
 # Load model & tokenizer
 MODEL_NAME = "ubiodee/Cardano_plutus"
-tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
-model = AutoModelForCausalLM.from_pretrained(MODEL_NAME)
-model.eval()
-if torch.cuda.is_available():
-    model.to("cuda")
-# Response function
-def generate_response(prompt):
-    inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
-    with torch.no_grad():
-        outputs = model.generate(
             **inputs,
-            max_new_tokens=250,
-            temperature=0.1,
-            top_p=0.1,
-            do_sample=True,
-            eos_token_id=tokenizer.eos_token_id,
-            pad_token_id=tokenizer.pad_token_id,
-        )
-    response = tokenizer.decode(outputs[0], skip_special_tokens=True)
-    # Remove the prompt from the output to return only the answer
-    if response.startswith(prompt):
-        response = response[len(prompt):].strip()
-    return response
 # Gradio UI
 demo = gr.Interface(
     fn=generate_response,
-    inputs=gr.Textbox(label="Enter your prompt", lines=4, placeholder="Ask about Plutus..."),
     outputs=gr.Textbox(label="Model Response"),
     title="Cardano Plutus AI Assistant",
-    description="Ask questions about Plutus smart contracts or Cardano blockchain."
 )
-demo.launch()

 import gradio as gr
 import torch
+import logging
+from transformers import AutoModelForCausalLM, AutoTokenizer, TextIteratorStreamer
+from threading import Thread
+# Set up logging
+logging.basicConfig(level=logging.INFO)
+logger = logging.getLogger(__name__)
 # Load model & tokenizer
 MODEL_NAME = "ubiodee/Cardano_plutus"
+try:
+    logger.info("Loading tokenizer...")
+    tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
+    logger.info("Loading model...")
+    model = AutoModelForCausalLM.from_pretrained(
+        MODEL_NAME,
+        device_map="auto",
+        torch_dtype=torch.float16,
+        low_cpu_mem_usage=True
+    )
+    model.eval()
+    logger.info("Model and tokenizer loaded successfully.")
+except Exception as e:
+    logger.error(f"Error loading model or tokenizer: {str(e)}")
+    raise
+# Prompt template to guide the model (simple, since no model card details)
+def format_prompt(user_prompt):
+    return f"User: {user_prompt}\nAssistant:"
+# Response function with proper streaming
+def generate_response(user_prompt):
+    try:
+        logger.info("Processing prompt...")
+        prompt = format_prompt(user_prompt)
+        inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
+        # Use streamer for token-by-token generation
+        streamer = TextIteratorStreamer(tokenizer, skip_prompt=True, skip_special_tokens=True)
+        generation_kwargs = {
             **inputs,
+            "streamer": streamer,
+            "max_new_tokens": 300,  # Increased slightly for completeness
+            "do_sample": True,      # Revert to sampling to avoid repetition
+            "temperature": 0.1,
+            "top_p": 0.1,
+            "eos_token_id": tokenizer.eos_token_id,
+            "pad_token_id": tokenizer.pad_token_id
+        }
+        # Run generation in a separate thread to avoid blocking
+        thread = Thread(target=model.generate, kwargs=generation_kwargs)
+        thread.start()
+        generated_text = ""
+        for new_text in streamer:
+            generated_text += new_text
+            yield generated_text.strip()
+        logger.info("Response generated successfully.")
+    except Exception as e:
+        logger.error(f"Error during generation: {str(e)}")
+        yield f"Error: {str(e)}"
 # Gradio UI
 demo = gr.Interface(
     fn=generate_response,
+    inputs=gr.Textbox(
+        label="Enter your prompt",
+        lines=4,
+        placeholder="Ask about Plutus or Cardano..."
+    ),
     outputs=gr.Textbox(label="Model Response"),
     title="Cardano Plutus AI Assistant",
+    description="Your Personalised Plutus Tutor. Optimized with sampling to avoid repetition.",
+    allow_flagging="never"
 )
+# Launch the app
+try:
+    logger.info("Launching Gradio interface...")
+    demo.launch()
+except Exception as e:
+    logger.error(f"Error launching Gradio: {str(e)}")
+    raise