Argument-Mining

Sleeping

App Files Files Community

oberbics commited on Sep 8, 2025

Commit

78595fd

verified ·

1 Parent(s): f81907c

Update app.py

Browse files

Files changed (1) hide show

app.py +55 -14

app.py CHANGED Viewed

@@ -24,6 +24,9 @@ logger = logging.getLogger(__name__)
 # Model configuration
 MODEL_ID = "oberbics/newspaper-argument-mining-V1"
 SYSTEM_PROMPT = """You are an expert at analyzing historical texts and you hate to summarize
 OUTPUT FORMAT - EXACTLY these 4 XML tags and NOTHING else:
@@ -79,7 +82,33 @@ model = AutoModelForCausalLM.from_pretrained(
 print("Model loaded successfully!")
 logger.info("Model loaded successfully")
-def log_interaction(input_text, temperature, output, processing_time, error=None):
     """Log each interaction to JSON file for analysis"""
     log_entry = {
         "timestamp": datetime.datetime.now().isoformat(),
@@ -90,7 +119,8 @@ def log_interaction(input_text, temperature, output, processing_time, error=None
         "processing_time_seconds": processing_time,
         "has_error": error is not None,
         "error_message": str(error) if error else None,
-        "output_preview": output[:200] if output else ""
     }
     # Save to JSON file
@@ -101,9 +131,9 @@ def log_interaction(input_text, temperature, output, processing_time, error=None
         logger.error(f"Failed to save interaction log: {e}")
 @spaces.GPU
-def extract_arguments(text, temperature=0.1):
     start_time = datetime.datetime.now()
-    logger.info(f"Processing request - Input length: {len(text) if text else 0}, Temperature: {temperature}")
     if not text or not text.strip():
         error_msg = "Please enter some text to analyze."
@@ -157,13 +187,16 @@ Extract arguments from historical text.
             if arg_start != -1:
                 response = response[arg_start:]
         processing_time = (datetime.datetime.now() - start_time).total_seconds()
-        logger.info(f"Processing completed in {processing_time:.2f} seconds - Output length: {len(response)}")
         # Log successful interaction
-        log_interaction(text, temperature, response, processing_time)
-        return response
     except Exception as e:
         processing_time = (datetime.datetime.now() - start_time).total_seconds()
@@ -186,8 +219,9 @@ def get_logs():
         for line in recent_logs:
             entry = json.loads(line)
             confidence_info = f", Confidence: {entry['confidence_score']:.3f}" if entry.get('confidence_score') else ""
             rejected_info = " [REJECTED]" if entry.get('rejected') else ""
-            summary = f"[{entry['timestamp']}] Input: {entry['input_length']} chars, Output: {entry['output_length']} chars, Time: {entry['processing_time_seconds']:.2f}s{confidence_info}{rejected_info}"
             if entry['has_error']:
                 summary += f" ERROR: {entry['error_message']}"
             log_summary.append(summary)
@@ -196,10 +230,10 @@ def get_logs():
     except Exception as e:
         return f"Error reading logs: {e}"
-# Gradio interface with logging viewer
 with gr.Blocks(title="Newspaper Argumentative Unit Extractor") as demo:
     gr.Markdown("# Newspaper Argumentative Unit Extractor")
-    gr.Markdown("Extract argumentative units from news sources")
     with gr.Tab("Extract Arguments"):
         with gr.Row():
@@ -216,6 +250,13 @@ with gr.Blocks(title="Newspaper Argumentative Unit Extractor") as demo:
                     step=0.01,
                     label="Temperature (lower = more consistent)"
                 )
                 extract_btn = gr.Button("Extract Arguments", variant="primary")
             with gr.Column():
@@ -226,16 +267,16 @@ with gr.Blocks(title="Newspaper Argumentative Unit Extractor") as demo:
         extract_btn.click(
             fn=extract_arguments,
-            inputs=[input_text, temperature],
             outputs=[output_text]
         )
         # Examples
         gr.Examples(
             examples=[
-                ["Reggio, January 8. Frequent shocks of earthquake were felt here dur ing the night, accompanied at times by loud subter ranean reports. A few buildings that had not been completely destroyed were further damaged. The work of reconstructing the railway is being pushed forward energetically. News has been received from Brancaleone, Catanzaro, and Palmi of earthquakes by which the inhabitants were alarmed last night", 0.1],
             ],
-            inputs=[input_text, temperature],
             outputs=[output_text],
             fn=extract_arguments
         )
@@ -251,4 +292,4 @@ with gr.Blocks(title="Newspaper Argumentative Unit Extractor") as demo:
         refresh_btn.click(fn=get_logs, outputs=[log_display])
 if __name__ == "__main__":
-    demo.launch()

 # Model configuration
 MODEL_ID = "oberbics/newspaper-argument-mining-V1"
+# Add minimum length threshold for arguments
+MIN_ARGUMENT_LENGTH = 50  # Adjust this value as needed
 SYSTEM_PROMPT = """You are an expert at analyzing historical texts and you hate to summarize
 OUTPUT FORMAT - EXACTLY these 4 XML tags and NOTHING else:
 print("Model loaded successfully!")
 logger.info("Model loaded successfully")
+def parse_and_filter_arguments(response, min_length=MIN_ARGUMENT_LENGTH):
+    """Parse XML response and filter out arguments that are too short"""
+    try:
+        # Extract argument text using regex
+        argument_match = re.search(r'<argument>(.*?)</argument>', response, re.DOTALL)
+        if argument_match:
+            argument_text = argument_match.group(1).strip()
+            # Check if argument is meaningful and long enough
+            if argument_text and argument_text != "NA" and len(argument_text) < min_length:
+                logger.info(f"Argument filtered out due to length: {len(argument_text)} chars (min: {min_length})")
+                # Replace with NA format
+                filtered_response = """<argument>NA</argument>
+<claim>NA</claim>
+<explanation>NA</explanation>
+<human_verification_needed>False</human_verification_needed>"""
+                return filtered_response, True  # True indicates it was filtered
+        return response, False  # False indicates no filtering
+    except Exception as e:
+        logger.error(f"Error parsing arguments: {e}")
+        return response, False
+def log_interaction(input_text, temperature, output, processing_time, error=None, filtered=False):
     """Log each interaction to JSON file for analysis"""
     log_entry = {
         "timestamp": datetime.datetime.now().isoformat(),
         "processing_time_seconds": processing_time,
         "has_error": error is not None,
         "error_message": str(error) if error else None,
+        "output_preview": output[:200] if output else "",
+        "filtered_for_length": filtered
     }
     # Save to JSON file
         logger.error(f"Failed to save interaction log: {e}")
 @spaces.GPU
+def extract_arguments(text, temperature=0.1, min_arg_length=MIN_ARGUMENT_LENGTH):
     start_time = datetime.datetime.now()
+    logger.info(f"Processing request - Input length: {len(text) if text else 0}, Temperature: {temperature}, Min argument length: {min_arg_length}")
     if not text or not text.strip():
         error_msg = "Please enter some text to analyze."
             if arg_start != -1:
                 response = response[arg_start:]
+        # Filter out short arguments
+        filtered_response, was_filtered = parse_and_filter_arguments(response, min_arg_length)
         processing_time = (datetime.datetime.now() - start_time).total_seconds()
+        logger.info(f"Processing completed in {processing_time:.2f} seconds - Output length: {len(filtered_response)} - Filtered: {was_filtered}")
         # Log successful interaction
+        log_interaction(text, temperature, filtered_response, processing_time, filtered=was_filtered)
+        return filtered_response
     except Exception as e:
         processing_time = (datetime.datetime.now() - start_time).total_seconds()
         for line in recent_logs:
             entry = json.loads(line)
             confidence_info = f", Confidence: {entry['confidence_score']:.3f}" if entry.get('confidence_score') else ""
+            filtered_info = " [FILTERED]" if entry.get('filtered_for_length') else ""
             rejected_info = " [REJECTED]" if entry.get('rejected') else ""
+            summary = f"[{entry['timestamp']}] Input: {entry['input_length']} chars, Output: {entry['output_length']} chars, Time: {entry['processing_time_seconds']:.2f}s{confidence_info}{filtered_info}{rejected_info}"
             if entry['has_error']:
                 summary += f" ERROR: {entry['error_message']}"
             log_summary.append(summary)
     except Exception as e:
         return f"Error reading logs: {e}"
+# Gradio interface with logging viewer and length control
 with gr.Blocks(title="Newspaper Argumentative Unit Extractor") as demo:
     gr.Markdown("# Newspaper Argumentative Unit Extractor")
+    gr.Markdown("Extract argumentative units from news sources (filters out arguments shorter than specified length)")
     with gr.Tab("Extract Arguments"):
         with gr.Row():
                     step=0.01,
                     label="Temperature (lower = more consistent)"
                 )
+                min_length = gr.Slider(
+                    minimum=10,
+                    maximum=200,
+                    value=MIN_ARGUMENT_LENGTH,
+                    step=5,
+                    label="Minimum Argument Length (characters)"
+                )
                 extract_btn = gr.Button("Extract Arguments", variant="primary")
             with gr.Column():
         extract_btn.click(
             fn=extract_arguments,
+            inputs=[input_text, temperature, min_length],
             outputs=[output_text]
         )
         # Examples
         gr.Examples(
             examples=[
+                ["Reggio, January 8. Frequent shocks of earthquake were felt here dur ing the night, accompanied at times by loud subter ranean reports. A few buildings that had not been completely destroyed were further damaged. The work of reconstructing the railway is being pushed forward energetically. News has been received from Brancaleone, Catanzaro, and Palmi of earthquakes by which the inhabitants were alarmed last night", 0.1, 50],
             ],
+            inputs=[input_text, temperature, min_length],
             outputs=[output_text],
             fn=extract_arguments
         )
         refresh_btn.click(fn=get_logs, outputs=[log_display])
 if __name__ == "__main__":
+    demo.launch()