Spaces:

SantanuBanerjee
/

TaxDirection

Sleeping

SantanuBanerjee commited on Aug 6, 2024

Commit

a13ad82

verified ·

1 Parent(s): a0667b8

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -458,17 +458,17 @@ def nlp_pipeline(original_df):
-    # Create cluster dataframes
-    budget_cluster_df, problem_cluster_df = create_cluster_dataframes(processed_df)
-    # # Generate project proposals
-    # location_clusters = dict(enumerate(processed_df['Location_Category_Words'].unique()))
-    # problem_clusters = dict(enumerate(processed_df['Problem_Category_Words'].unique()))
-    project_proposals = create_project_proposals(budget_cluster_df, problem_cluster_df, location_clusters, problem_clusters)
-    console_messages.append("NLP pipeline completed.")
-    return processed_df, budget_cluster_df, problem_cluster_df, project_proposals, location_clusters, problem_clusters
@@ -488,7 +488,8 @@ def process_excel(file):
     try:
         # Process the DataFrame
         console_messages.append("Processing the DataFrame...")
-        processed_df, budget_cluster_df, problem_cluster_df, project_proposals, location_clusters, problem_clusters = nlp_pipeline(df)
         output_filename = "OutPut_PPs.xlsx"
         with pd.ExcelWriter(output_filename) as writer:

+    return processed_df
+    # # Create cluster dataframes
+    # budget_cluster_df, problem_cluster_df = create_cluster_dataframes(processed_df)
+    # # # Generate project proposals
+    # # location_clusters = dict(enumerate(processed_df['Location_Category_Words'].unique()))
+    # # problem_clusters = dict(enumerate(processed_df['Problem_Category_Words'].unique()))
+    # project_proposals = create_project_proposals(budget_cluster_df, problem_cluster_df, location_clusters, problem_clusters)
+    # console_messages.append("NLP pipeline completed.")
+    # return processed_df, budget_cluster_df, problem_cluster_df, project_proposals, location_clusters, problem_clusters
     try:
         # Process the DataFrame
         console_messages.append("Processing the DataFrame...")
+        # processed_df, budget_cluster_df, problem_cluster_df, project_proposals, location_clusters, problem_clusters = nlp_pipeline(df)
+        processed_df = nlp_pipeline(df)
         output_filename = "OutPut_PPs.xlsx"
         with pd.ExcelWriter(output_filename) as writer: