Spaces:

KB-Infinity-Tech
/

FineTuningModel

Sleeping

App Files Files Community

KB-Infinity-Tech commited on 23 days ago

Commit

433126f

verified ·

1 Parent(s): 1510136

Update app.py

Browse files

Files changed (1) hide show

app.py +37 -21

app.py CHANGED Viewed

@@ -1,37 +1,53 @@
-import os
 import gradio as gr
-from transformers import pipeline
-BASE_MODEL_ID = "google/flan-t5-small"
-FINETUNED_MODEL_ID = "kbsha/t5-samsum-mini"  # change to yours
-HF_TOKEN = os.getenv("HF_TOKEN")
-base_pipe = pipeline(
-    "text-generation",
-    model=BASE_MODEL_ID,
-    token=HF_TOKEN,
-)
-finetuned_pipe = pipeline(
-    "text-generation",
-    model=FINETUNED_MODEL_ID,
-    token=HF_TOKEN,
-)
 def summarize(text):
     prompt = "summarize: " + text
-    base = base_pipe(prompt, max_new_tokens=60)[0]["generated_text"]
-    fine = finetuned_pipe(prompt, max_new_tokens=60)[0]["generated_text"]
-    return base, fine
 iface = gr.Interface(
     fn=summarize,
-    inputs=gr.Textbox(lines=8),
-    outputs=[gr.Textbox(), gr.Textbox()],
-    title="T5 Summarizer",
 )
 if __name__ == "__main__":

 import gradio as gr
+from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
+import torch
+# -----------------------------
+# LOAD MODELS
+# -----------------------------
+BASE_MODEL = "google/flan-t5-small"
+FINETUNED_MODEL = "KB-Infinity-Tech/t5-samsum-mini"
+base_tokenizer = AutoTokenizer.from_pretrained(BASE_MODEL)
+base_model = AutoModelForSeq2SeqLM.from_pretrained(BASE_MODEL)
+fine_tokenizer = AutoTokenizer.from_pretrained(FINETUNED_MODEL)
+fine_model = AutoModelForSeq2SeqLM.from_pretrained(FINETUNED_MODEL)
+device = "cuda" if torch.cuda.is_available() else "cpu"
+base_model.to(device)
+fine_model.to(device)
+# -----------------------------
+# GENERATE FUNCTION
+# -----------------------------
 def summarize(text):
     prompt = "summarize: " + text
+    # Base model
+    inputs = base_tokenizer(prompt, return_tensors="pt", truncation=True).to(device)
+    outputs = base_model.generate(**inputs, max_new_tokens=60)
+    base_summary = base_tokenizer.decode(outputs[0], skip_special_tokens=True)
+    # Fine-tuned model
+    inputs2 = fine_tokenizer(prompt, return_tensors="pt", truncation=True).to(device)
+    outputs2 = fine_model.generate(**inputs2, max_new_tokens=60)
+    fine_summary = fine_tokenizer.decode(outputs2[0], skip_special_tokens=True)
+    return base_summary, fine_summary
+# -----------------------------
+# UI
+# -----------------------------
 iface = gr.Interface(
     fn=summarize,
+    inputs=gr.Textbox(lines=8, label="Dialogue"),
+    outputs=[
+        gr.Textbox(label="Base Model (FLAN-T5)"),
+        gr.Textbox(label="Fine-Tuned Model"),
+    ],
+    title="🧠 T5 Summarization Compare",
+    description="Compare base FLAN-T5 vs your fine-tuned SAMSum model",
 )
 if __name__ == "__main__":