Spaces:

BtB-ExpC
/

Exercises

Sleeping

App Files Files Community

BtB-ExpC commited on Feb 11, 2025

Commit

67528be

1 Parent(s): 6534556

okokok, changing buttons clicks after all

Browse files

Files changed (4) hide show

chains/diagnoser/runner.py +8 -8
chains/distractors/runner.py +1 -1
config/llm_config.py +3 -3
main.py +3 -11

chains/diagnoser/runner.py CHANGED Viewed

@@ -6,7 +6,7 @@ from app.helpers.exercise_standardizer import standardize_exercise
 from config.llm_config import llms
-async def run_diagnoser(user_query: str, model_choice_validate: str, exercise_format_validate: str, sampling_count_validate: str) -> tuple:
     """
     Diagnose exercise(s) in parallel using a configured DiagnoserChain.
@@ -18,15 +18,15 @@ async def run_diagnoser(user_query: str, model_choice_validate: str, exercise_fo
     Args:
         user_query (str): Raw exercise data submitted by the user.
-        model_choice_validate (str): The key/name of the chosen LLM for diagnosing.
-        exercise_format_validate (str): The desired format for standardizing the exercise.
-        sampling_count_validate (str): A string representing how many diagnoses to run concurrently (e.g., "3").
     Returns:
         tuple: A tuple of length 10, each containing a diagnosis result (or empty string if not enough samples).
     """
     # figure out how many times to run
-    num_samples = int("".join(filter(str.isdigit, sampling_count_validate)))
     # Fetch the DiagnoserChain configuration.
     config = chain_configs["diagnoser"]
@@ -34,7 +34,7 @@ async def run_diagnoser(user_query: str, model_choice_validate: str, exercise_fo
     # 1) Standardize the user query exactly once
     standardized_exercise = await standardize_exercise(
         user_query,
-        exercise_format_validate,
         config["template_standardize"],  # Only if you kept them in config
         config["llm_standardize"]
     )
@@ -42,7 +42,7 @@ async def run_diagnoser(user_query: str, model_choice_validate: str, exercise_fo
     # 2) Instantiate the DiagnoserChain using the user-selected LLM for diagnosing
     chain_instance = config["class"](
         templates_diagnose=config["templates_diagnose"],
-        llm_diagnose=llms.get(model_choice_validate, config["llm_diagnose"]),
         template_diagnose_scorecard=config["template_diagnose_scorecard"],
         llm_4o_mini=config["llm_4o_mini"],
         llm_4o=config["llm_4o"]
@@ -61,4 +61,4 @@ async def run_diagnoser(user_query: str, model_choice_validate: str, exercise_fo
     all_responses = list(responses) + [""] * (10 - len(responses))
     # Return a tuple of exactly 5 responses.
-    return tuple(all_responses)

 from config.llm_config import llms
+async def run_diagnoser(user_query: str, model_choice_diagnose: str, exercise_format_diagnose: str, sampling_count_diagnose: str) -> tuple:
     """
     Diagnose exercise(s) in parallel using a configured DiagnoserChain.
     Args:
         user_query (str): Raw exercise data submitted by the user.
+        model_choice_diagnose (str): The key/name of the chosen LLM for diagnosing.
+        exercise_format_diagnose (str): The desired format for standardizing the exercise.
+        sampling_count_diagnose (str): A string representing how many diagnoses to run concurrently (e.g., "3").
     Returns:
         tuple: A tuple of length 10, each containing a diagnosis result (or empty string if not enough samples).
     """
     # figure out how many times to run
+    num_samples = int("".join(filter(str.isdigit, sampling_count_diagnose)))
     # Fetch the DiagnoserChain configuration.
     config = chain_configs["diagnoser"]
     # 1) Standardize the user query exactly once
     standardized_exercise = await standardize_exercise(
         user_query,
+        exercise_format_diagnose,
         config["template_standardize"],  # Only if you kept them in config
         config["llm_standardize"]
     )
     # 2) Instantiate the DiagnoserChain using the user-selected LLM for diagnosing
     chain_instance = config["class"](
         templates_diagnose=config["templates_diagnose"],
+        llm_diagnose=llms.get(model_choice_diagnose, config["llm_diagnose"]),
         template_diagnose_scorecard=config["template_diagnose_scorecard"],
         llm_4o_mini=config["llm_4o_mini"],
         llm_4o=config["llm_4o"]
     all_responses = list(responses) + [""] * (10 - len(responses))
     # Return a tuple of exactly 5 responses.
+    return tuple(all_responses) + (standardized_exercise,)

chains/distractors/runner.py CHANGED Viewed

@@ -57,4 +57,4 @@ async def run_distractors(
     # 4) Pad up to 10 outputs to correspond to 10 response fields
     all_responses = list(results) + [""] * (10 - len(results))
-    return tuple(all_responses)

     # 4) Pad up to 10 outputs to correspond to 10 response fields
     all_responses = list(results) + [""] * (10 - len(results))
+    return tuple(all_responses) + (standardized_exercise)

config/llm_config.py CHANGED Viewed

@@ -45,9 +45,9 @@ llms = {
     # OpenAI reasoning models (no temperature)
     "o1": create_openai_reasoning_llm("o1-2024-12-17"),
-    "o3-mini (low-reasoning effort version)": create_openai_reasoning_llm("o3-mini", reasoning_effort="low"),
-    "o3-mini (medium-reasoning effort version)": create_openai_reasoning_llm("o3-mini", reasoning_effort="medium"),
-    "o3-mini (high-reasoning effort version)": create_openai_reasoning_llm("o3-mini", reasoning_effort="high"),
     # Anthropic models (Claude)
     "Claude 3.5 (zero temp)": create_anthropic_llm("claude-3-5-sonnet-latest", ZERO),

     # OpenAI reasoning models (no temperature)
     "o1": create_openai_reasoning_llm("o1-2024-12-17"),
+    "o3-mini (low reasoning_effort)": create_openai_reasoning_llm("o3-mini", reasoning_effort="low"),
+    "o3-mini (medium reasoning_effort)": create_openai_reasoning_llm("o3-mini", reasoning_effort="medium"),
+    "o3-mini (high reasoning_effort)": create_openai_reasoning_llm("o3-mini", reasoning_effort="high"),
     # Anthropic models (Claude)
     "Claude 3.5 (zero temp)": create_anthropic_llm("claude-3-5-sonnet-latest", ZERO),

main.py CHANGED Viewed

@@ -93,30 +93,22 @@ with gr.Blocks() as interface:
     diagnoser_button.click(
         fn=run_diagnoser,
         inputs=[diagnoser_input, model_choice_diagnose, exercise_format_diagnose, sampling_count_diagnose],
-        outputs=diagnoser_responses
     )
     distractors_button.click(
         fn=run_distractors,
         inputs=[
-            # 1) user_query
-            distractors_input,
-            # 2) model_choice_distractors_1
             model_choice_distractors_1,
-            # 3) model_choice_distractors_2
             model_choice_distractors_2,
-            # 4) model_choice_distractors_3
             model_choice_distractors_3,
-            # 5) exercise_format_distractors
             exercise_format_distractors,
-            # 6) sampling_count_distractors
             sampling_count_distractors,
-            # 7) intermediate_distractors_specification
             intermediate_distractors_specification,
-            # 8) final_distractors_specification
             final_distractors_specification,
         ],
-        outputs=distractors_responses
     )
 # Launch the app.

     diagnoser_button.click(
         fn=run_diagnoser,
         inputs=[diagnoser_input, model_choice_diagnose, exercise_format_diagnose, sampling_count_diagnose],
+        outputs=diagnoser_responses + [dummy_state]
     )
     distractors_button.click(
         fn=run_distractors,
         inputs=[
+            distractors_input,  # user query
             model_choice_distractors_1,
             model_choice_distractors_2,
             model_choice_distractors_3,
             exercise_format_distractors,
             sampling_count_distractors,
             intermediate_distractors_specification,
             final_distractors_specification,
         ],
+        outputs=distractors_responses + [dummy_state]
     )
 # Launch the app.