Spaces:

Aditya1010
/

demo-benchmark

Runtime error

Aditya1010 commited on Aug 22, 2025

Commit

4abf3b4

verified ·

1 Parent(s): 2f263fc

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,21 +1,17 @@
 from transformers import pipeline
 import gradio as gr
-import os
-HF_TOKEN = os.environ.get("llama")
-# Load Gemma model
 pipe = pipeline(
     "text-generation",
     model="tiiuae/falcon-7b-instruct",
-    # use_auth_token=HF_TOKEN,   # required for gated models
     device_map="auto"
 )
 def chat_fn(prompt):
     result = pipe(prompt, max_new_tokens=200)
-    return result[0]["generated_text"]
-iface = gr.Interface(fn=chat_fn, inputs="text", outputs="text")
-iface.launch(share=True)

 from transformers import pipeline
 import gradio as gr
+# Load Falcon model (open, no token required)
 pipe = pipeline(
     "text-generation",
     model="tiiuae/falcon-7b-instruct",
     device_map="auto"
 )
 def chat_fn(prompt):
     result = pipe(prompt, max_new_tokens=200)
+    return {"response": result[0]["generated_text"]}  # JSON-friendly dict
+# Gradio now supports API mode via gr.Request
+app = gr.Interface(fn=chat_fn, inputs="text", outputs="text")  # keep text
+app.launch(server_name="0.0.0.0", server_port=7860)