Spaces:

Rajiv4Code
/

summary_AI_pragyan

Sleeping

App Files Files Community

Rajiv4Code commited on Jan 27

Commit

91014aa

verified ·

1 Parent(s): 7ddd5cc

Update app.py

Browse files

Files changed (1) hide show

app.py +21 -32

app.py CHANGED Viewed

@@ -2,7 +2,7 @@ import torch
 import gradio as gr
 from transformers import AutoTokenizer, AutoModelForCausalLM
-MODEL_NAME = "ibm-granite/granite-3.3-2b-instruct"
 # Load tokenizer and model
 tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
@@ -10,48 +10,37 @@ model = AutoModelForCausalLM.from_pretrained(
     MODEL_NAME,
     torch_dtype=torch.float16 if torch.cuda.is_available() else torch.float32,
 )
-model.to("cuda" if torch.cuda.is_available() else "cpu")
-model.eval()
-def chat(user_input, history):
-    messages = []
-    # Convert chat history to Granite chat format
-    for user, assistant in history:
-        messages.append({"role": "user", "content": user})
-        messages.append({"role": "assistant", "content": assistant})
-    messages.append({"role": "user", "content": user_input})
-    inputs = tokenizer.apply_chat_template(
-        messages,
-        add_generation_prompt=True,
-        tokenize=True,
-        return_dict=True,
-        return_tensors="pt",
-    ).to(model.device)
     with torch.no_grad():
         outputs = model.generate(
             **inputs,
-            max_new_tokens=100,
             do_sample=True,
-            temperature=0.7,
             top_p=0.9,
         )
-    response = tokenizer.decode(
-        outputs[0][inputs["input_ids"].shape[-1]:],
-        skip_special_tokens=True,
-    )
-    history.append((user_input, response))
-    return history, history
-gr.ChatInterface(
-    fn=chat,
-    title="IBM Granite 3.3 2B Instruct",
-    description="Chat with IBM Granite using Hugging Face Transformers",
-).launch()

 import gradio as gr
 from transformers import AutoTokenizer, AutoModelForCausalLM
+MODEL_NAME = "ibm-granite/granite-3.0-2b-base"
 # Load tokenizer and model
 tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
     MODEL_NAME,
     torch_dtype=torch.float16 if torch.cuda.is_available() else torch.float32,
 )
+device = "cuda" if torch.cuda.is_available() else "cpu"
+model.to(device)
+model.eval()
+def generate_text(prompt, max_new_tokens=100, temperature=0.7):
+    inputs = tokenizer(prompt, return_tensors="pt").to(device)
     with torch.no_grad():
         outputs = model.generate(
             **inputs,
+            max_new_tokens=max_new_tokens,
             do_sample=True,
+            temperature=temperature,
             top_p=0.9,
         )
+    return tokenizer.decode(outputs[0], skip_special_tokens=True)
+demo = gr.Interface(
+    fn=generate_text,
+    inputs=[
+        gr.Textbox(lines=5, label="Input Prompt"),
+        gr.Slider(10, 300, value=100, step=10, label="Max New Tokens"),
+        gr.Slider(0.1, 1.5, value=0.7, step=0.1, label="Temperature"),
+    ],
+    outputs=gr.Textbox(lines=10, label="Generated Output"),
+    title="IBM Granite 3.0 – 2B Base",
+    description="Text generation using IBM Granite 3.0 2B Base model",
+)
+demo.launch()