Spaces:

aspendse
/

Text-summarizer

Sleeping

App Files Files Community

aspendse commited on Jul 15, 2025

Commit

a368bbc

verified ·

1 Parent(s): 01c48da

Update app.py

Browse files

Files changed (1) hide show

app.py +22 -71

app.py CHANGED Viewed

@@ -1,80 +1,31 @@
 import streamlit as st
 from transformers import pipeline
-from PyPDF2 import PdfReader
-import docx2txt
-from fpdf import FPDF
-from io import BytesIO
-from docx import Document
-# Load summarizer
-summarizer = pipeline("summarization", model="sshleifer/distilbart-cnn-12-6")
-# Helper: Extract text from PDF
-def extract_text_from_pdf(file):
-    pdf = PdfReader(file)
-    text = ""
-    for page in pdf.pages:
-        text += page.extract_text()
-    return text
-# Helper: Save summary to DOCX
-def generate_docx(text):
-    doc = Document()
-    doc.add_heading("Summary", 0)
-    doc.add_paragraph(text)
-    buffer = BytesIO()
-    doc.save(buffer)
-    buffer.seek(0)
-    return buffer
-# Helper: Save summary to PDF
-def generate_pdf(text):
-    pdf = FPDF()
-    pdf.add_page()
-    pdf.set_font("Arial", size=12)
-    for line in text.split("\n"):
-        pdf.multi_cell(0, 10, line)
-    buffer = BytesIO()
-    pdf.output(buffer)
-    buffer.seek(0)
-    return buffer
-# App UI
-st.set_page_config(page_title="Smart Text Summarizer", layout="centered")
-st.title("📄 Smart Text Summarizer")
-uploaded_file = st.file_uploader("Upload a PDF or Word file", type=["pdf", "docx"])
-if uploaded_file:
-    file_type = uploaded_file.name.split(".")[-1].lower()
-    # Extract text
-    if file_type == "pdf":
-        text = extract_text_from_pdf(uploaded_file)
-    elif file_type == "docx":
-        text = docx2txt.process(uploaded_file)
     else:
-        st.error("Unsupported file format.")
-        st.stop()
-    if not text:
-        st.error("No readable text found in the file.")
-        st.stop()
-    st.subheader("🔍 Extracted Text")
-    st.text_area("Preview", text[:1000] + "...", height=200)
-    # Summarize
-    if st.button("Summarize"):
         with st.spinner("Summarizing..."):
-            summary = summarizer(text, max_length=150, min_length=30, do_sample=False)[0]['summary_text']
-            st.success("Summary Generated ✅")
-            st.subheader("📝 Summary")
-            st.write(summary)
-            # Download options
-            docx_file = generate_docx(summary)
-            pdf_file = generate_pdf(summary)
-            st.download_button("📥 Download as DOCX", docx_file, file_name="summary.docx")
-            st.download_button("📥 Download as PDF", pdf_file, file_name="summary.pdf")

 import streamlit as st
 from transformers import pipeline
+# Load model (cached)
+@st.cache_resource
+def load_summarizer():
+    summarizer = pipeline("summarization", model="sshleifer/distilbart-cnn-12-6")
+    return summarizer
+summarizer = load_summarizer()
+# Streamlit UI
+st.set_page_config(page_title="Text Summarizer", layout="centered")
+st.title("📝 Text Summarizer")
+st.markdown("Enter a long piece of text, and this app will summarize it using a Hugging Face transformer model.")
+# Input box
+text_input = st.text_area("Enter your text here", height=300)
+# Button to summarize
+if st.button("Summarize"):
+    if not text_input.strip():
+        st.warning("⚠️ Please enter some text first.")
     else:
         with st.spinner("Summarizing..."):
+            try:
+                summary = summarizer(text_input, max_length=130, min_length=30, do_sample=False)
+                st.subheader("Summary:")
+                st.success(summary[0]['summary_text'])
+            except Exception as e:
+                st.error(f"❌ Error during summarization: {e}")