Spaces:

synthetic-data-universe
/

synth

Sleeping

App Files Files Community

edbeeching commited on Sep 16

Commit

7580ee9

1 Parent(s): 08390cd

fix slider

Browse files

Files changed (1) hide show

app.py +22 -4

app.py CHANGED Viewed

@@ -198,7 +198,7 @@ def validate_request(request: GenerationRequest, oauth_token: Optional[Union[gr.
     return request
-def load_dataset_info(dataset_name, dataset_token=None):
     """Load dataset information and return choices for dropdowns"""
     if not dataset_name.strip():
         return (
@@ -237,23 +237,41 @@ def load_dataset_info(dataset_name, dataset_token=None):
                     break
             if not default_column and column_choices:
                 default_column = column_choices[0]
         else:
             split_choices = []
             column_choices = []
             default_split = None
             default_column = None
         # Generate a suggested output dataset name
         dataset_base_name = dataset_name.split('/')[-1] if '/' in dataset_name else dataset_name
         suggested_output_name = f"{dataset_base_name}-synthetic"
         return (
             gr.update(choices=config_choices, value=default_config, interactive=True),  # config
             gr.update(choices=split_choices, value=default_split, interactive=True),  # split
             gr.update(choices=column_choices, value=default_column, interactive=True),  # prompt_column
             gr.update(value=suggested_output_name, interactive=True),  # output_dataset_name
-            gr.update(interactive=True),  # num_output_samples
-            f"✅ Dataset info loaded successfully! Found {len(config_choices)} config(s), {len(split_choices)} split(s), and {len(column_choices)} column(s)."
         )
     except Exception as e:
@@ -592,7 +610,7 @@ def main():
             # Wire up the Load Dataset Info button
             load_info_btn.click(
                 load_dataset_info,
-                inputs=[input_dataset_name],
                 outputs=[input_dataset_config, input_dataset_split, prompt_column, output_dataset_name, num_output_samples, load_info_status]
             )

     return request
+def load_dataset_info(dataset_name, dataset_token=None, oauth_token=None):
     """Load dataset information and return choices for dropdowns"""
     if not dataset_name.strip():
         return (
                     break
             if not default_column and column_choices:
                 default_column = column_choices[0]
+            # Get sample count for the default split
+            dataset_sample_count = config_info.splits[default_split].num_examples if default_split else 0
         else:
             split_choices = []
             column_choices = []
             default_split = None
             default_column = None
+            dataset_sample_count = 0
+        # Determine user limits
+        is_pro = verify_pro_status(oauth_token) if oauth_token else False
+        user_max_samples = MAX_SAMPLES_PRO if is_pro else MAX_SAMPLES_FREE
+        # Set slider maximum to the minimum of dataset samples and user limit
+        slider_max = min(dataset_sample_count, user_max_samples) if dataset_sample_count > 0 else user_max_samples
         # Generate a suggested output dataset name
         dataset_base_name = dataset_name.split('/')[-1] if '/' in dataset_name else dataset_name
         suggested_output_name = f"{dataset_base_name}-synthetic"
+        status_msg = f"✅ Dataset info loaded successfully! Found {len(config_choices)} config(s), {len(split_choices)} split(s), and {len(column_choices)} column(s)."
+        if dataset_sample_count > 0:
+            status_msg += f" Dataset has {dataset_sample_count:,} samples."
+            if dataset_sample_count > user_max_samples:
+                user_tier = "PRO/Enterprise" if is_pro else "free tier"
+                status_msg += f" Limited to {user_max_samples:,} samples for {user_tier} users."
         return (
             gr.update(choices=config_choices, value=default_config, interactive=True),  # config
             gr.update(choices=split_choices, value=default_split, interactive=True),  # split
             gr.update(choices=column_choices, value=default_column, interactive=True),  # prompt_column
             gr.update(value=suggested_output_name, interactive=True),  # output_dataset_name
+            gr.update(interactive=True, maximum=slider_max, value=0),  # num_output_samples
+            status_msg
         )
     except Exception as e:
             # Wire up the Load Dataset Info button
             load_info_btn.click(
                 load_dataset_info,
+                inputs=[input_dataset_name, gr.State(None), current_oauth_token],
                 outputs=[input_dataset_config, input_dataset_split, prompt_column, output_dataset_name, num_output_samples, load_info_status]
             )