Spaces:

Abhisesh7
/

Invoice-Fraud-Detection

Sleeping

App Files Files Community

Abhisesh7 commited on May 23, 2025

Commit

bf24caa

verified ·

1 Parent(s): 1cbe5ca

Update app.py

Browse files

Files changed (1) hide show

app.py +15 -5

app.py CHANGED Viewed

@@ -254,7 +254,6 @@ def extract_items(pdf_file, text):
         if platform_fee_start != -1:
             platform_fee_end = len(lines)
             for i in range(platform_fee_start, len(lines)):
-                locom = lines[i]
                 if "Total" in lines[i] and "Sr.No" not in lines[i]:
                     platform_fee_end = i + 1
                     break
@@ -490,8 +489,8 @@ def detect_anomalies(df, history_df):
     return df
-def calculate_fraud_score(amount, is_amount_anomaly, is_frequency_anomaly, is_vendor_pattern_anomaly, text_length, consistency_issues, invoice_date):
-    """Calculate fraud score based on amount, anomalies, text length, consistency issues, and invoice date."""
     score = 0.0
     reasoning = []
     today = datetime.now().date()
@@ -507,6 +506,10 @@ def calculate_fraud_score(amount, is_amount_anomaly, is_frequency_anomaly, is_ve
         score += 10
         reasoning.append("Invoice date is in the future.")
     if is_amount_anomaly == -1:
         score += 30
         reasoning.append("Amount flagged as an anomaly.")
@@ -537,6 +540,9 @@ def process_invoice(pdf_file):
     items = extract_items(pdf_file, text)
     text_length = len(text)
     history_df = fetch_vendor_history(vendor_name, invoice_number)
     consistency_issues = check_data_consistency(invoice_number, vendor_name, invoice_date, history_df)
@@ -559,7 +565,8 @@ def process_invoice(pdf_file):
         df["is_vendor_pattern_anomaly"].iloc[0],
         text_length,
         consistency_issues,
-        invoice_date
     )
     # Format items for Salesforce (only include item descriptions)
@@ -579,14 +586,16 @@ def process_invoice(pdf_file):
         items_str = "; ".join(item['description'] for item in items)  # Fallback to raw descriptions
         print(f"Fallback items_str: {items_str}")
-    # Format the invoice date as DD-MM-YYYY
     formatted_invoice_date = invoice_date.strftime("%d-%m-%Y")
     output = [
         "## Fraud Detection Summary",
         f"- **Invoice Number**: {invoice_number}",
         f"- **Vendor Name**: {vendor_name}",
         f"- **Invoice Date**: {formatted_invoice_date}",
         f"- **Invoice Amount**: ${total_amount:,.2f}" if '$' in text else f"- **Invoice Amount**: ₹{total_amount:,.2f}",
     ]
@@ -620,6 +629,7 @@ def process_invoice(pdf_file):
                 "Vendor_Name__c": vendor_name,
                 "Invoice_Amount__c": total_amount,
                 "Invoice_Date__c": str(invoice_date),
                 "Fraud_Score__c": fraud_score,
                 "Fraud_Reason__c": "; ".join(fraud_reasoning),
                 "Flagged__c": fraud_score > 50,

         if platform_fee_start != -1:
             platform_fee_end = len(lines)
             for i in range(platform_fee_start, len(lines)):
                 if "Total" in lines[i] and "Sr.No" not in lines[i]:
                     platform_fee_end = i + 1
                     break
     return df
+def calculate_fraud_score(amount, is_amount_anomaly, is_frequency_anomaly, is_vendor_pattern_anomaly, text_length, consistency_issues, invoice_date, due_date):
+    """Calculate fraud score based on amount, anomalies, text length, consistency issues, invoice date, and due date."""
     score = 0.0
     reasoning = []
     today = datetime.now().date()
         score += 10
         reasoning.append("Invoice date is in the future.")
+    if due_date < today and invoice_date < today:
+        score += 15
+        reasoning.append("Due date has passed, indicating potential payment delay.")
     if is_amount_anomaly == -1:
         score += 30
         reasoning.append("Amount flagged as an anomaly.")
     items = extract_items(pdf_file, text)
     text_length = len(text)
+    # Calculate Due Date (Invoice Date + 30 days)
+    due_date = invoice_date + timedelta(days=30)
     history_df = fetch_vendor_history(vendor_name, invoice_number)
     consistency_issues = check_data_consistency(invoice_number, vendor_name, invoice_date, history_df)
         df["is_vendor_pattern_anomaly"].iloc[0],
         text_length,
         consistency_issues,
+        invoice_date,
+        due_date
     )
     # Format items for Salesforce (only include item descriptions)
         items_str = "; ".join(item['description'] for item in items)  # Fallback to raw descriptions
         print(f"Fallback items_str: {items_str}")
+    # Format the invoice date and due date as DD-MM-YYYY
     formatted_invoice_date = invoice_date.strftime("%d-%m-%Y")
+    formatted_due_date = due_date.strftime("%d-%m-%Y")
     output = [
         "## Fraud Detection Summary",
         f"- **Invoice Number**: {invoice_number}",
         f"- **Vendor Name**: {vendor_name}",
         f"- **Invoice Date**: {formatted_invoice_date}",
+        f"- **Due Date**: {formatted_due_date}",
         f"- **Invoice Amount**: ${total_amount:,.2f}" if '$' in text else f"- **Invoice Amount**: ₹{total_amount:,.2f}",
     ]
                 "Vendor_Name__c": vendor_name,
                 "Invoice_Amount__c": total_amount,
                 "Invoice_Date__c": str(invoice_date),
+                "Due_Date__c": str(due_date),
                 "Fraud_Score__c": fraud_score,
                 "Fraud_Reason__c": "; ".join(fraud_reasoning),
                 "Flagged__c": fraud_score > 50,