Spaces:

SorrelC
/

KeywordExtraction-Explorer-Tool

Runtime error

App Files Files Community

SorrelC commited on Jul 15, 2025

Commit

3945fba

verified ·

1 Parent(s): 5744fd2

Update app.py

Browse files

Files changed (1) hide show

app.py +64 -32

app.py CHANGED Viewed

@@ -5,7 +5,7 @@ import re
 nltk.download('stopwords')
-# Models to offer
 AVAILABLE_MODELS = [
     "kw_pke_multipartiterank",
     "kw_pke_singlerank",
@@ -15,9 +15,8 @@ AVAILABLE_MODELS = [
     "kw_pke_positionrank"
 ]
 def extract_keywords_pke(text, model_choice, num_keywords):
-    extractor = None
     if model_choice == "kw_pke_multipartiterank":
         extractor = pke.unsupervised.MultipartiteRank()
     elif model_choice == "kw_pke_singlerank":
@@ -43,10 +42,9 @@ def extract_keywords_pke(text, model_choice, num_keywords):
     extractor.candidate_weighting()
     keywords = [kw for kw, score in extractor.get_n_best(n=num_keywords)]
     return keywords
 def highlight_keywords(text, keywords):
     if not keywords:
         return text
@@ -55,36 +53,79 @@ def highlight_keywords(text, keywords):
     for kw in sorted(keywords, key=lambda k: -len(k)):
         pattern = re.compile(re.escape(kw), re.IGNORECASE)
         highlighted = pattern.sub(
-            f'<mark style="background-color:#FFD54F; padding:2px 4px; border-radius:4px;">{kw}</mark>',
             highlighted
         )
     return highlighted
 def process_text(text, model_choice, num_keywords):
     if not text.strip():
         return "❌ Please enter text to analyse.", "", ""
     keywords = extract_keywords_pke(text, model_choice, num_keywords)
     highlighted_html = highlight_keywords(text, keywords)
-    summary = f"""
-    ## 📊 Keyword Extraction Summary
-    - **Model Used:** {model_choice}
-    - **Keywords Found:** {len(keywords)}
-    - **Displayed in Context Below**
     """
-    keyword_list_html = "<ul>" + "".join([f"<li>{kw}</li>" for kw in keywords]) + "</ul>"
-    return summary, highlighted_html, keyword_list_html
 def create_interface():
     with gr.Blocks(title="Keyword Explorer Tool") as demo:
-        gr.Markdown("# 🔑 Keyword Explorer Tool\n\nExtract and explore keywords using multiple extraction models.")
-        text_input = gr.Textbox(label="📝 Text to Analyse", placeholder="Paste your text here...", lines=8)
         with gr.Row():
             model_dropdown = gr.Dropdown(
@@ -92,7 +133,6 @@ def create_interface():
                 value=AVAILABLE_MODELS[0],
                 label="Select Keyword Extraction Model"
             )
             num_keywords_slider = gr.Slider(
                 minimum=5,
                 maximum=50,
@@ -103,20 +143,14 @@ def create_interface():
         analyse_btn = gr.Button("🚀 Extract Keywords")
-        with gr.Row():
-            summary_output = gr.Markdown(label="Summary")
-        with gr.Row():
-            highlighted_output = gr.HTML(label="Highlighted Text")
-        with gr.Row():
-            gr.Markdown("### 📋 Extracted Keywords List")
-            keyword_list_output = gr.HTML(label="Keywords List")
         analyse_btn.click(
             fn=process_text,
             inputs=[text_input, model_dropdown, num_keywords_slider],
-            outputs=[summary_output, highlighted_output, keyword_list_output]
         )
         gr.HTML("""
@@ -135,8 +169,6 @@ def create_interface():
     return demo
 if __name__ == "__main__":
     demo = create_interface()
-    demo.launch()

 nltk.download('stopwords')
+# Models list
 AVAILABLE_MODELS = [
     "kw_pke_multipartiterank",
     "kw_pke_singlerank",
     "kw_pke_positionrank"
 ]
+# Keyword extraction using PKE
 def extract_keywords_pke(text, model_choice, num_keywords):
     if model_choice == "kw_pke_multipartiterank":
         extractor = pke.unsupervised.MultipartiteRank()
     elif model_choice == "kw_pke_singlerank":
     extractor.candidate_weighting()
     keywords = [kw for kw, score in extractor.get_n_best(n=num_keywords)]
     return keywords
+# Highlight keywords in text with styled spans
 def highlight_keywords(text, keywords):
     if not keywords:
         return text
     for kw in sorted(keywords, key=lambda k: -len(k)):
         pattern = re.compile(re.escape(kw), re.IGNORECASE)
         highlighted = pattern.sub(
+            f'<span style="background-color: #4ECDC4; color: white; padding: 2px 5px; border-radius: 5px; font-weight: bold;">{kw}</span>',
             highlighted
         )
     return highlighted
+# Create keyword list as HTML table
+def create_keywords_table(keywords):
+    if not keywords:
+        return "<p>No keywords found.</p>"
+    table_html = """
+    <table style="width: 100%; border-collapse: collapse; border: 1px solid #ddd; font-size: 14px;">
+        <thead>
+            <tr style="background-color: #1976d2; color: white;">
+                <th style="padding: 8px; border: 1px solid #ddd; text-align: left;">Rank</th>
+                <th style="padding: 8px; border: 1px solid #ddd; text-align: left;">Keyword</th>
+            </tr>
+        </thead>
+        <tbody>
+    """
+    for idx, kw in enumerate(keywords, 1):
+        table_html += f"""
+        <tr>
+            <td style="padding: 8px; border: 1px solid #ddd;">{idx}</td>
+            <td style="padding: 8px; border: 1px solid #ddd; font-weight: bold;">{kw}</td>
+        </tr>
+        """
+    table_html += "</tbody></table>"
+    return table_html
+# Main processing function
 def process_text(text, model_choice, num_keywords):
     if not text.strip():
         return "❌ Please enter text to analyse.", "", ""
     keywords = extract_keywords_pke(text, model_choice, num_keywords)
     highlighted_html = highlight_keywords(text, keywords)
+    keywords_table_html = create_keywords_table(keywords)
+    summary_html = f"""
+    <div style="background-color: #f0f8ff; padding: 15px; border-radius: 8px; border: 1px solid #ddd; margin-bottom: 20px;">
+        <h3 style="margin-top: 0; color: #1976d2;">📊 Keyword Extraction Summary</h3>
+        <p><strong>Model Used:</strong> {model_choice}</p>
+        <p><strong>Total Keywords Found:</strong> {len(keywords)}</p>
+    </div>
     """
+    highlighted_section = f"""
+    <div style='padding: 15px; border: 2px solid #ddd; border-radius: 8px; background-color: #fafafa; margin: 10px 0;'>
+        <h4 style='margin: 0 0 15px 0; color: #333;'>📝 Text with Highlighted Keywords</h4>
+        <div style='line-height: 1.8; font-size: 16px; background-color: white; padding: 15px; border-radius: 5px;'>{highlighted_html}</div>
+    </div>
+    """
+    return summary_html, highlighted_section, keywords_table_html
+# Build the Gradio interface
 def create_interface():
     with gr.Blocks(title="Keyword Explorer Tool") as demo:
+        gr.Markdown("""
+        # 🔑 Keyword Explorer Tool
+        Discover the key concepts inside your text using established keyword extraction models.
+        **How to use:**
+        1. Paste your text in the input box.
+        2. Choose a keyword extraction model.
+        3. Set how many keywords you want to extract.
+        4. Click "Extract Keywords" to explore the results.
+        """)
+        text_input = gr.Textbox(label="📝 Text to Analyse", placeholder="Paste your text here...", lines=10)
         with gr.Row():
             model_dropdown = gr.Dropdown(
                 value=AVAILABLE_MODELS[0],
                 label="Select Keyword Extraction Model"
             )
             num_keywords_slider = gr.Slider(
                 minimum=5,
                 maximum=50,
         analyse_btn = gr.Button("🚀 Extract Keywords")
+        summary_output = gr.HTML(label="Summary")
+        highlighted_output = gr.HTML(label="Highlighted Text")
+        keywords_table_output = gr.HTML(label="Keywords List")
         analyse_btn.click(
             fn=process_text,
             inputs=[text_input, model_dropdown, num_keywords_slider],
+            outputs=[summary_output, highlighted_output, keywords_table_output]
         )
         gr.HTML("""
     return demo
 if __name__ == "__main__":
     demo = create_interface()
+    demo.launch()