Spaces:

intelli-zen
/

OpenGeminiAPI

Paused

HoneyTian commited on Jun 20, 2025

Commit

601ac30

1 Parent(s): 01fa7b6

update

Files changed (2) hide show

examples/api_eval/eval_gemini_google.py CHANGED Viewed

@@ -16,6 +16,11 @@ from project_settings import environment, project_path
 def get_args():
     parser = argparse.ArgumentParser()
     parser.add_argument(
         "--google_application_credentials",
@@ -25,7 +30,8 @@ def get_args():
     parser.add_argument(
         "--model_name",
         # default="gemini-2.5-pro",
-        default="gemini-2.5-flash",
         type=str
     )
     parser.add_argument(
@@ -76,7 +82,7 @@ def main():
     with open(args.eval_data, "r", encoding="utf-8") as fin, open(args.eval_result, "a+", encoding="utf-8") as fout:
         for row in fin:
-            if total > 20:
                 break
             row = json.loads(row)
@@ -126,7 +132,7 @@ Your output is:
                 config=generate_content_config,
             )
             time_cost = time.time() - time_begin
-            print(time_cost)
             try:
                 prediction = response.candidates[0].content.parts[0].text
             except TypeError:
@@ -152,7 +158,7 @@ Your output is:
             row_ = json.dumps(row_, ensure_ascii=False)
             fout.write(f"{row_}\n")
-            # print(f"score: {score}")
     return

 def get_args():
+    """
+    python3 eval_gemini_google.py --model_name gemini-2.5-pro --eval_result eval_math_result_gemini-2.5-pro.jsonl
+    python3 eval_gemini_google.py --model_name gemini-2.5-flash --eval_result eval_math_result_gemini-2.5-flash.jsonl
+    :return:
+    """
     parser = argparse.ArgumentParser()
     parser.add_argument(
         "--google_application_credentials",
     parser.add_argument(
         "--model_name",
         # default="gemini-2.5-pro",
+        # default="gemini-2.5-flash",
+        default="gemini-2.5-flash-lite-preview-06-17",
         type=str
     )
     parser.add_argument(
     with open(args.eval_data, "r", encoding="utf-8") as fin, open(args.eval_result, "a+", encoding="utf-8") as fout:
         for row in fin:
+            if total > 1000:
                 break
             row = json.loads(row)
                 config=generate_content_config,
             )
             time_cost = time.time() - time_begin
+            # print(time_cost)
             try:
                 prediction = response.candidates[0].content.parts[0].text
             except TypeError:
             row_ = json.dumps(row_, ensure_ascii=False)
             fout.write(f"{row_}\n")
+            print(f"score: {score}")
     return

examples/api_eval/eval_openai.py CHANGED Viewed

@@ -16,6 +16,11 @@ from project_settings import environment, project_path
 def get_args():
     parser = argparse.ArgumentParser()
     parser.add_argument(
         "--api_key",

 def get_args():
+    """
+    python3 eval_openai.py --model_name gpt-4o --eval_result eval_math_result_gpt-4o.jsonl
+    python3 eval_openai.py --model_name gpt-4o-mini --eval_result eval_math_result_gpt-4o-mini.jsonl
+    :return:
+    """
     parser = argparse.ArgumentParser()
     parser.add_argument(
         "--api_key",