Spaces:

fullstuckdev
/

Nvidia-llama

Sleeping

fullstuckdev commited on Nov 19, 2024

Commit

160e363

1 Parent(s): 6d40d22

first commit

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,7 +1,27 @@
 import gradio as gr
-def greet(name):
-    return "Hello " + name + "!!"
-demo = gr.Interface(fn=greet, inputs="text", outputs="text")
-demo.launch()

 import gradio as gr
+import os
+import requests
+API_URL = "https://api-inference.huggingface.co/models/nvidia/Llama-3.1-Nemotron-70B-Instruct-HF"
+headers = {"Authorization": f"Bearer {os.getenv('HUGGINGFACE_API_KEY')}"}
+async def generate_response(user_input):
+    payload = {
+        "model": "nvidia/Llama-3.1-Nemotron-70B-Instruct-HF",
+        "messages": [{"role": "user", "content": user_input}],
+        "max_tokens": 16384,
+        "max_completion_tokens": 16384
+    }
+    response = requests.post(API_URL, headers=headers, json=payload)
+    return response.json()[0]['generated_text']
+demo = gr.Interface(
+    fn=generate_response,
+    inputs=gr.Textbox(label="Your message"),
+    outputs=gr.Textbox(label="AI Response"),
+    title="AI Chat Interface",
+    description="Chat with Llama 3.1 Nemotron"
+)
+demo.launch()