Spaces:

Multichem-PD
/

DFS_Portfolio_Manager

Running

App Files Files Community

James McCool commited on 19 days ago

Commit

3111836

1 Parent(s): cf86397

funny issue where a name is matching another name without need

Browse files

Files changed (1) hide show

app.py +15 -9

app.py CHANGED Viewed

@@ -162,6 +162,8 @@ sport_position_lists = {
 showdown_position_lists = ['CPT', 'FLEX']
 player_wrong_names_mlb = ['Enrique Hernandez', 'Joseph Cantillo', 'Mike Soroka', 'Jakob Bauers', 'Temi Fágbénlé']
 player_right_names_mlb = ['Kike Hernandez', 'Joey Cantillo', 'Michael Soroka', 'Jake Bauers', 'Temi Fagbenle']
@@ -599,7 +601,7 @@ except:
     nhl_slate_name_lookup_fd = {}
 # Memory optimization helper functions
-def chunk_name_matching(portfolio_names, csv_names, chunk_size=1000):
     """Process name matching in chunks to reduce memory usage"""
     portfolio_match_dict = {}
     unmatched_names = []
@@ -607,11 +609,15 @@ def chunk_name_matching(portfolio_names, csv_names, chunk_size=1000):
     for i in range(0, len(portfolio_names), chunk_size):
         chunk = portfolio_names[i:i+chunk_size]
         for portfolio_name in chunk:
-            match = process.extractOne(
-                portfolio_name,
-                csv_names,
-                score_cutoff=90
-            )
             if match:
                 portfolio_match_dict[portfolio_name] = match[0]
                 if match[1] < 100:
@@ -1689,7 +1695,7 @@ if selected_tab == 'Data Load':
                 csv_names = st.session_state['csv_file']['Nickname'].tolist()
             projection_names = projections['player_names'].tolist()
-            portfolio_match_dict, unmatched_names = chunk_name_matching(portfolio_names, csv_names)
             player_columns = [col for col in st.session_state['portfolio'].columns
                             if col not in ['salary', 'median', 'Own']]
@@ -1697,7 +1703,7 @@ if selected_tab == 'Data Load':
             for col in player_columns:
                 st.session_state['portfolio'][col] = st.session_state['portfolio'][col].map(lambda x: portfolio_match_dict.get(x, x))
-            projections_match_dict, unmatched_proj_names = chunk_name_matching(projection_names, csv_names)
             projections['player_names'] = projections['player_names'].map(lambda x: projections_match_dict.get(x, x))
             st.session_state['projections_df'] = projections
@@ -1705,7 +1711,7 @@ if selected_tab == 'Data Load':
             projections_names = st.session_state['projections_df']['player_names'].tolist()
             portfolio_names = get_portfolio_names(st.session_state['portfolio'])
-            projections_match_dict2, unmatched_proj_names2 = chunk_name_matching(projection_names, portfolio_names)
             projections['player_names'] = projections['player_names'].map(lambda x: projections_match_dict2.get(x, x))
             st.session_state['projections_df'] = projections

 showdown_position_lists = ['CPT', 'FLEX']
+ignore_rename = ['Nikola Jokic']
 player_wrong_names_mlb = ['Enrique Hernandez', 'Joseph Cantillo', 'Mike Soroka', 'Jakob Bauers', 'Temi Fágbénlé']
 player_right_names_mlb = ['Kike Hernandez', 'Joey Cantillo', 'Michael Soroka', 'Jake Bauers', 'Temi Fagbenle']
     nhl_slate_name_lookup_fd = {}
 # Memory optimization helper functions
+def chunk_name_matching(portfolio_names, csv_names, ignore_rename, chunk_size=1000):
     """Process name matching in chunks to reduce memory usage"""
     portfolio_match_dict = {}
     unmatched_names = []
     for i in range(0, len(portfolio_names), chunk_size):
         chunk = portfolio_names[i:i+chunk_size]
         for portfolio_name in chunk:
+            if portfolio_name in ignore_rename:
+                portfolio_match_dict[portfolio_name] = portfolio_name
+                continue
+            else:
+                match = process.extractOne(
+                    portfolio_name,
+                    csv_names,
+                    score_cutoff=90
+                )
             if match:
                 portfolio_match_dict[portfolio_name] = match[0]
                 if match[1] < 100:
                 csv_names = st.session_state['csv_file']['Nickname'].tolist()
             projection_names = projections['player_names'].tolist()
+            portfolio_match_dict, unmatched_names = chunk_name_matching(portfolio_names, csv_names, ignore_rename)
             player_columns = [col for col in st.session_state['portfolio'].columns
                             if col not in ['salary', 'median', 'Own']]
             for col in player_columns:
                 st.session_state['portfolio'][col] = st.session_state['portfolio'][col].map(lambda x: portfolio_match_dict.get(x, x))
+            projections_match_dict, unmatched_proj_names = chunk_name_matching(projection_names, csv_names, ignore_rename)
             projections['player_names'] = projections['player_names'].map(lambda x: projections_match_dict.get(x, x))
             st.session_state['projections_df'] = projections
             projections_names = st.session_state['projections_df']['player_names'].tolist()
             portfolio_names = get_portfolio_names(st.session_state['portfolio'])
+            projections_match_dict2, unmatched_proj_names2 = chunk_name_matching(projection_names, portfolio_names, ignore_rename)
             projections['player_names'] = projections['player_names'].map(lambda x: projections_match_dict2.get(x, x))
             st.session_state['projections_df'] = projections