Spaces:

app2scale
/

dashboard

Runtime error

App Files Files Community

hkayabilisim commited on Apr 2, 2024

Commit

c97c52c

1 Parent(s): e00a48f

added model testing

Browse files

Files changed (3) hide show

agent/backend/utils.py +33 -4
agent/dashboard/__init__.py +2 -0
agent/dashboard/training.py +6 -2

agent/backend/utils.py CHANGED Viewed

@@ -2,6 +2,7 @@ import torch
 from tqdm import tqdm
 from torch.utils.data import Dataset, DataLoader
 from functools import partial
 from .data import ExplorationDataset
 from .models import Perceptron
@@ -11,7 +12,8 @@ from .loss import loss_mape
 def train(df, model_name, input_cols, output_cols, trn_ratio,
           batch_size_trn, batch_size_val, optimizer_name, learning_rate,
-          max_epoch, loss_name):
     if model_name == "Perceptron":
         model = Perceptron(in_features=len(input_cols), out_features=len(output_cols))
     if loss_name == "mape":
@@ -20,7 +22,8 @@ def train(df, model_name, input_cols, output_cols, trn_ratio,
     trn_size = int(len(ds)*trn_ratio)
     val_size = len(ds) - trn_size
-    ds_trn, ds_val = torch.utils.data.random_split(ds, [trn_size, val_size])
     dl_trn = DataLoader(ds_trn, batch_size=batch_size_trn, shuffle=True)
     dl_val = DataLoader(ds_val, batch_size=batch_size_val, shuffle=True)
@@ -40,6 +43,7 @@ def train(df, model_name, input_cols, output_cols, trn_ratio,
     print(f'Learning rate: {learning_rate}')
     print(f'Optimizer {optimizer_name}')
     print(f'Max epoch: {max_epoch}')
     x, y = ds[0]
     in_features = x.shape[0]
@@ -61,11 +65,36 @@ def train(df, model_name, input_cols, output_cols, trn_ratio,
         trn_loss = evaluate(model, dl_trn, loss_fn)
         val_loss = evaluate(model, dl_val, loss_fn)
         #epochbar.set_postfix(epoch=ep+1,loss=loss.item(),val_loss=val_loss)
-        yield ep, trn_loss, val_loss, None
     return ep, trn_loss, val_loss, model
-def predict(model, dataloader):
     with torch.no_grad():
         predictions = torch.empty(0, model.out_features)
         targets = torch.empty(predictions.shape)

 from tqdm import tqdm
 from torch.utils.data import Dataset, DataLoader
 from functools import partial
+import pandas as pd
 from .data import ExplorationDataset
 from .models import Perceptron
 def train(df, model_name, input_cols, output_cols, trn_ratio,
           batch_size_trn, batch_size_val, optimizer_name, learning_rate,
+          max_epoch, loss_name, seed):
+    torch.manual_seed(seed)
     if model_name == "Perceptron":
         model = Perceptron(in_features=len(input_cols), out_features=len(output_cols))
     if loss_name == "mape":
     trn_size = int(len(ds)*trn_ratio)
     val_size = len(ds) - trn_size
+    generator = torch.Generator().manual_seed(seed)
+    ds_trn, ds_val = torch.utils.data.random_split(ds, [trn_size, val_size], generator=generator)
     dl_trn = DataLoader(ds_trn, batch_size=batch_size_trn, shuffle=True)
     dl_val = DataLoader(ds_val, batch_size=batch_size_val, shuffle=True)
     print(f'Learning rate: {learning_rate}')
     print(f'Optimizer {optimizer_name}')
     print(f'Max epoch: {max_epoch}')
+    print(f'random seed',seed)
     x, y = ds[0]
     in_features = x.shape[0]
         trn_loss = evaluate(model, dl_trn, loss_fn)
         val_loss = evaluate(model, dl_val, loss_fn)
         #epochbar.set_postfix(epoch=ep+1,loss=loss.item(),val_loss=val_loss)
+        yield ep, trn_loss, val_loss, model
     return ep, trn_loss, val_loss, model
+def predict(model, df, input_cols, output_cols, trn_ratio,
+            batch_size_trn, batch_size_val, seed):
+    torch.manual_seed(seed)
+    ds = ExplorationDataset(df, input_cols=input_cols, output_cols=output_cols)
+    trn_size = int(len(ds)*trn_ratio)
+    val_size = len(ds) - trn_size
+    generator = torch.Generator().manual_seed(seed)
+    ds_trn, ds_val = torch.utils.data.random_split(ds, [trn_size, val_size], generator=generator)
+    dl_trn = DataLoader(ds_trn, batch_size=batch_size_trn, shuffle=True)
+    dl_val = DataLoader(ds_val, batch_size=batch_size_val, shuffle=True)
+    trn_pred, trn_target = predict_dataloader(model, dl_trn)
+    val_pred, val_target = predict_dataloader(model, dl_val)
+    results = {}
+    for col, col_name in enumerate(output_cols):
+        trn_df = pd.DataFrame(torch.cat([trn_pred[:,[col]], trn_target[:,[col]]],dim=1))
+        trn_df = trn_df.rename(columns={0:'prediction',1:'target'})
+        val_df = pd.DataFrame(torch.cat([val_pred[:,[col]], val_target[:,[col]]],dim=1))
+        val_df = val_df.rename(columns={0:'prediction',1:'target'})
+        results[col_name] = {'training': trn_df, 'validation': val_df}
+    return results
+def predict_dataloader(model, dataloader):
     with torch.no_grad():
         predictions = torch.empty(0, model.out_features)
         targets = torch.empty(predictions.shape)

agent/dashboard/__init__.py CHANGED Viewed

@@ -1,5 +1,7 @@
 import solara
 @solara.component
 def Page():
     with solara.VBox() as main:

 import solara
+route_order = ["data","training","testing"]
 @solara.component
 def Page():
     with solara.VBox() as main:

agent/dashboard/training.py CHANGED Viewed

@@ -21,6 +21,7 @@ local_state = solara.reactive(
         'loss_plot_data': solara.reactive({'epoch': [], 'trn_loss': [], 'val_loss': []}),
         'render_count': solara.reactive(0),
         'model': solara.reactive(None),
     }
     )
@@ -79,13 +80,14 @@ def ExecutePanel(df):
         optimizer_name = local_state.value['optimizer_name'].value
         max_epoch = local_state.value['max_epoch'].value
         loss_name = local_state.value['loss_name'].value
         epoch_list = []
         trn_loss_list = []
         val_loss_list = []
         for epoch, trn_loss, val_loss, model in train(dff, "Perceptron", input_cols, output_cols, trn_ratio,
               batch_size_trn, batch_size_val, optimizer_name, learning_rate,
-              max_epoch, loss_name):
             epoch_list.append(epoch)
             trn_loss_list.append(trn_loss)
             val_loss_list.append(val_loss)
@@ -94,7 +96,7 @@ def ExecutePanel(df):
                  'trn_loss': trn_loss_list,
                  'val_loss': val_loss_list})
             force_render()
-        local_state.value['model'].set(model)
     solara.Button(label='Train', on_click=trigger_training)
     LossPlot(local_state.value['loss_plot_data'].value, local_state.value['render_count'].value)
@@ -148,6 +150,8 @@ def ParameterSelection(df):
                                 value=local_state.value['learning_rate_log10'].value,
                                 min=-4, max=1, step=0.01,
                                 on_value=local_state.value['learning_rate_log10'].set)

         'loss_plot_data': solara.reactive({'epoch': [], 'trn_loss': [], 'val_loss': []}),
         'render_count': solara.reactive(0),
         'model': solara.reactive(None),
+        'seed': solara.reactive(42),
     }
     )
         optimizer_name = local_state.value['optimizer_name'].value
         max_epoch = local_state.value['max_epoch'].value
         loss_name = local_state.value['loss_name'].value
+        seed = local_state.value['seed'].value
         epoch_list = []
         trn_loss_list = []
         val_loss_list = []
         for epoch, trn_loss, val_loss, model in train(dff, "Perceptron", input_cols, output_cols, trn_ratio,
               batch_size_trn, batch_size_val, optimizer_name, learning_rate,
+              max_epoch, loss_name, seed):
             epoch_list.append(epoch)
             trn_loss_list.append(trn_loss)
             val_loss_list.append(val_loss)
                  'trn_loss': trn_loss_list,
                  'val_loss': val_loss_list})
             force_render()
+            local_state.value['model'].set(model)
     solara.Button(label='Train', on_click=trigger_training)
     LossPlot(local_state.value['loss_plot_data'].value, local_state.value['render_count'].value)
                                 value=local_state.value['learning_rate_log10'].value,
                                 min=-4, max=1, step=0.01,
                                 on_value=local_state.value['learning_rate_log10'].set)
+                solara.InputInt(label='random seed', value=local_state.value['seed'].value,
+                                on_value=local_state.value['seed'].set)