Spaces:

TFI
/

K-Means_Clustering_Algorithm

Sleeping

tanish78 commited on Jul 7, 2024

Commit

aa1c7d7

verified ·

1 Parent(s): 148df09

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -129,9 +129,12 @@ def preprocess_data(df):
     df['texts'] = df['texts'].apply(lambda x: x.strip())  # Remove leading and trailing whitespaces
     df = df[df['texts'] != '']
     return df
 def cluster_data(df, num_clusters=5):
     # Vectorize the text data
     vectorizer = TfidfVectorizer(stop_words='english')
     X = vectorizer.fit_transform(df['texts'])
@@ -147,6 +150,7 @@ def cluster_data(df, num_clusters=5):
     df['PCA1'] = principal_components[:, 0]
     df['PCA2'] = principal_components[:, 1]
     return df
 def visualize_clusters(df):

     df['texts'] = df['texts'].apply(lambda x: x.strip())  # Remove leading and trailing whitespaces
     df = df[df['texts'] != '']
+    print("Preprocessing completed.")
     return df
 def cluster_data(df, num_clusters=5):
+    print("Clustering data...")
     # Vectorize the text data
     vectorizer = TfidfVectorizer(stop_words='english')
     X = vectorizer.fit_transform(df['texts'])
     df['PCA1'] = principal_components[:, 0]
     df['PCA2'] = principal_components[:, 1]
+    print("Clustering completed.")
     return df
 def visualize_clusters(df):