Spaces:

TJStatsApps
/

catch_probability

Paused

nesticot commited on Apr 1, 2025

Commit

3f6340f

verified ·

1 Parent(s): 6806b25

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -6,6 +6,7 @@ import os
 import json
 import streamlit as st
 import pandas as pd
 from st_aggrid import AgGrid, GridOptionsBuilder, GridUpdateMode
@@ -92,8 +93,8 @@ season = 2025
 level = 'mlb'
 # dataset = load_dataset('TJStatsApps/mlb_data', data_files=[f'{level}_pitch_data_{season}.csv' ])
 dataset = pl.read_parquet(f"hf://datasets/TJStatsApps/mlb_data/data/{level}_pitch_data_{season}.parquet")
-dataset_train = dataset['train']
-df = dataset_train.to_pandas().set_index(list(dataset_train.features.keys())[0]).reset_index(drop=True).drop_duplicates(subset=['play_id'],keep='last')
 df['batter_name_team'] = df['batter_name'] + ' - ' + df['batter_team']
 # Sample dictionary

 import json
 import streamlit as st
 import pandas as pd
+import polars as pl
 from st_aggrid import AgGrid, GridOptionsBuilder, GridUpdateMode
 level = 'mlb'
 # dataset = load_dataset('TJStatsApps/mlb_data', data_files=[f'{level}_pitch_data_{season}.csv' ])
 dataset = pl.read_parquet(f"hf://datasets/TJStatsApps/mlb_data/data/{level}_pitch_data_{season}.parquet")
+# dataset_train = dataset['train']
+df = dataset.to_pandas().set_index(list(dataset_train.features.keys())[0]).reset_index(drop=True).drop_duplicates(subset=['play_id'],keep='last')
 df['batter_name_team'] = df['batter_name'] + ' - ' + df['batter_team']
 # Sample dictionary