Spaces:

VJyzCELERY
/

DescriptiveGameRecommender

Sleeping

VJyzCELERY commited on Jun 5, 2025

Commit

70cbebe

1 Parent(s): 21cbaed

Fixed some issue

Files changed (1) hide show

app.py CHANGED Viewed

@@ -529,22 +529,20 @@ df_liked = df_liked.drop_duplicates(subset=['steamid', 'app_id'])
                 code_cell("""
 vectorizer = TfidfVectorizer(max_df=0.7,min_df=3,stop_words=None,ngram_range=(1,2))
 review_app_id_encoder = LabelEncoder()""")
-                def get_data_split():
-                    train_df,df_temp = train_test_split(sampled,test_size=0.2,random_state=SEED,stratify=sampled['app_id'])
-                    test_df,val_df = train_test_split(df_temp,test_size=0.5,random_state=SEED,stratify=df_temp['app_id'])
-                    del df_temp
-                    gc.collect()
-                    p(f"""
-Training   : {train_df.shape}
-Testing    : {test_df.shape}
-Validation : {val_df.shape}
-""")
                 code_cell("""
 train_df,df_temp = train_test_split(sampled,test_size=0.2,random_state=SEED,stratify=sampled['app_id'])
 test_df,val_df = train_test_split(df_temp,test_size=0.5,random_state=SEED,stratify=df_temp['app_id'])
 """)
-                btn = gr.Button("View data split size :")
-                btn.click(fn=get_data_split())
                 code_cell("""
 X_train = vectorizer.fit_transform(train_df['cleaned_review'])
 y_train = review_app_id_encoder.fit_transform(train_df['app_id'])

                 code_cell("""
 vectorizer = TfidfVectorizer(max_df=0.7,min_df=3,stop_words=None,ngram_range=(1,2))
 review_app_id_encoder = LabelEncoder()""")
+                train_df,df_temp = train_test_split(sampled,test_size=0.2,random_state=SEED,stratify=sampled['app_id'])
+                test_df,val_df = train_test_split(df_temp,test_size=0.5,random_state=SEED,stratify=df_temp['app_id'])
+                del df_temp
+                gc.collect()
                 code_cell("""
 train_df,df_temp = train_test_split(sampled,test_size=0.2,random_state=SEED,stratify=sampled['app_id'])
 test_df,val_df = train_test_split(df_temp,test_size=0.5,random_state=SEED,stratify=df_temp['app_id'])
 """)
+                p(f"""
+Training   : {train_df.shape}
+Testing    : {test_df.shape}
+Validation : {val_df.shape}
+""")
                 code_cell("""
 X_train = vectorizer.fit_transform(train_df['cleaned_review'])
 y_train = review_app_id_encoder.fit_transform(train_df['app_id'])