PDF_Summarizer_large_file

Sleeping

Manasa1 commited on Apr 12, 2025

Commit

4afb96f

verified ·

1 Parent(s): 833659f

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -4,15 +4,12 @@ import gradio as gr
 from dotenv import load_dotenv
 from groq import Groq
-# Load environment variables
 load_dotenv()
 GROQ_API_KEY = os.getenv("GROQ_API_KEY")
-print("Groq API Key:", GROQ_API_KEY)  # TEMP: Check if it's loaded
-# Instantiate Groq client
 client = Groq(api_key=GROQ_API_KEY)
-# Function to extract text from PDF
 def extract_text_from_pdf(pdf_file):
     text = ""
     with pdfplumber.open(pdf_file.name) as pdf:
@@ -22,7 +19,6 @@ def extract_text_from_pdf(pdf_file):
                 text += page_text
     return text
-# Split text into manageable chunks (by character count)
 def split_text_into_chunks(text, max_chars=2000):
     words = text.split()
     chunks = []
@@ -39,7 +35,6 @@ def split_text_into_chunks(text, max_chars=2000):
     return chunks
-# Summarize a single chunk using Groq
 def summarize_chunk(chunk):
     prompt = f"Summarize the following PDF section:\n\n{chunk}"
     try:
@@ -51,7 +46,6 @@ def summarize_chunk(chunk):
     except Exception as e:
         return f"Error during summarization: {e}"
-# Main summarization function
 def summarize_pdf(pdf_file):
     text = extract_text_from_pdf(pdf_file)
     if not text.strip():
@@ -67,7 +61,6 @@ def summarize_pdf(pdf_file):
     final_summary = "\n".join(summaries)
     return final_summary
-# Gradio interface
 iface = gr.Interface(
     fn=summarize_pdf,
     inputs=gr.File(label="Upload PDF", file_types=[".pdf"]),

 from dotenv import load_dotenv
 from groq import Groq
 load_dotenv()
 GROQ_API_KEY = os.getenv("GROQ_API_KEY")
+print("Groq API Key:", GROQ_API_KEY)
 client = Groq(api_key=GROQ_API_KEY)
 def extract_text_from_pdf(pdf_file):
     text = ""
     with pdfplumber.open(pdf_file.name) as pdf:
                 text += page_text
     return text
 def split_text_into_chunks(text, max_chars=2000):
     words = text.split()
     chunks = []
     return chunks
 def summarize_chunk(chunk):
     prompt = f"Summarize the following PDF section:\n\n{chunk}"
     try:
     except Exception as e:
         return f"Error during summarization: {e}"
 def summarize_pdf(pdf_file):
     text = extract_text_from_pdf(pdf_file)
     if not text.strip():
     final_summary = "\n".join(summaries)
     return final_summary
 iface = gr.Interface(
     fn=summarize_pdf,
     inputs=gr.File(label="Upload PDF", file_types=[".pdf"]),