Spaces:

Mattral
/

Excel-Match-Analysis

Sleeping

Mattral commited on Apr 26, 2024

Commit

6fd604e

verified ·

1 Parent(s): 6f3c1b1

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -61,7 +61,7 @@ def find_exact_match(df1, df2, column_name):
     matches = pd.merge(df1, df2, on=column_name, how='inner')
     return matches
-def find_similar_texts(df1, df2, column_name, threshold=0.3):
     # Find rows with similar texts in the specified column, including exact matches
     similar_texts = []
     exact_matches = []
@@ -92,7 +92,7 @@ def find_similar_texts(df1, df2, column_name, threshold=0.3):
                 if similarity_score >= threshold:
                     if similarity == 1:  # Exact match
                         exact_matches.append((i, j, row1[column_name], row2[column_name]))
-                    if  similarity >= threshold and similarity < 1:
                         similar_texts.append((i, j, row1[column_name], row2[column_name]))
     return similar_texts, exact_matches

     matches = pd.merge(df1, df2, on=column_name, how='inner')
     return matches
+def find_similar_texts(df1, df2, column_name, threshold=0.4):
     # Find rows with similar texts in the specified column, including exact matches
     similar_texts = []
     exact_matches = []
                 if similarity_score >= threshold:
                     if similarity == 1:  # Exact match
                         exact_matches.append((i, j, row1[column_name], row2[column_name]))
+                    if  similarity >= threshold and similarity < 1: #remove same
                         similar_texts.append((i, j, row1[column_name], row2[column_name]))
     return similar_texts, exact_matches