Add files using upload-large-folder tool

Browse files

This view is limited to 50 files because it contains too many changes. See raw diff

Files changed (50) hide show

.gitattributes +22 -0
eval_results/global_step_0/mmlu_stem/test_qwen-boxed_-1_seed0_t1.0_s0_e-1.jsonl +3 -0
eval_results/plots/eval_results_acc_keywords.png +3 -0
eval_results/plots/eval_results_acc_pass_acc.png +3 -0
eval_results/plots/eval_results_acc_tokens.png +3 -0
eval_results/plots/eval_results_avg_stop_tokens.png +3 -0
eval_results/plots/eval_results_box_ratio_and_token_length.png +3 -0
eval_results/plots/eval_results_clip_ratio.png +3 -0
eval_results/plots/eval_results_correct_tokens.png +3 -0
eval_results/plots/eval_results_repeat_ratio_and_token_length.png +3 -0
eval_results/plots/eval_results_tokens_keywords.png +3 -0
eval_results/plots/eval_results_wrong_tokens.png +3 -0
eval_results_avg4/global_step_40/amc23/test_qwen-boxed_-1_seed0_t1.0_s0_e-1.jsonl +0 -0
eval_results_avg4/global_step_50/aime24/test_qwen-boxed_-1_seed0_t1.0_s0_e-1.jsonl +0 -0
eval_results_avg4/global_step_50/aime25/test_qwen-boxed_-1_seed0_t1.0_s0_e-1.jsonl +0 -0
eval_results_avg4/global_step_50/amc23/test_qwen-boxed_-1_seed0_t1.0_s0_e-1.jsonl +0 -0
eval_results_avg4/global_step_50/amc23/test_qwen-boxed_-1_seed0_t1.0_s0_e-1_metrics.json +15 -0
eval_results_avg4/global_step_60/aime24/test_qwen-boxed_-1_seed0_t1.0_s0_e-1.jsonl +0 -0
eval_results_avg4/global_step_60/aime24/test_qwen-boxed_-1_seed0_t1.0_s0_e-1_metrics.json +15 -0
eval_results_avg4/global_step_60/aime25/test_qwen-boxed_-1_seed0_t1.0_s0_e-1.jsonl +0 -0
eval_results_avg4/global_step_60/aime25/test_qwen-boxed_-1_seed0_t1.0_s0_e-1_metrics.json +15 -0
eval_results_avg4/global_step_60/amc23/test_qwen-boxed_-1_seed0_t1.0_s0_e-1.jsonl +0 -0
eval_results_avg4/global_step_60/amc23/test_qwen-boxed_-1_seed0_t1.0_s0_e-1_metrics.json +15 -0
eval_results_avg4/global_step_70/aime24/test_qwen-boxed_-1_seed0_t1.0_s0_e-1.jsonl +0 -0
eval_results_avg4/global_step_70/aime24/test_qwen-boxed_-1_seed0_t1.0_s0_e-1_metrics.json +15 -0
eval_results_avg4/global_step_70/aime25/test_qwen-boxed_-1_seed0_t1.0_s0_e-1.jsonl +0 -0
eval_results_avg4/global_step_70/aime25/test_qwen-boxed_-1_seed0_t1.0_s0_e-1_metrics.json +15 -0
eval_results_avg4/global_step_70/amc23/test_qwen-boxed_-1_seed0_t1.0_s0_e-1.jsonl +0 -0
eval_results_avg4/global_step_70/amc23/test_qwen-boxed_-1_seed0_t1.0_s0_e-1_metrics.json +15 -0
eval_results_avg4/global_step_80/aime24/test_qwen-boxed_-1_seed0_t1.0_s0_e-1.jsonl +0 -0
eval_results_avg4/global_step_80/aime24/test_qwen-boxed_-1_seed0_t1.0_s0_e-1_metrics.json +15 -0
eval_results_avg4/global_step_80/aime25/test_qwen-boxed_-1_seed0_t1.0_s0_e-1.jsonl +0 -0
eval_results_avg4/global_step_80/aime25/test_qwen-boxed_-1_seed0_t1.0_s0_e-1_metrics.json +15 -0
eval_results_avg4/global_step_80/amc23/test_qwen-boxed_-1_seed0_t1.0_s0_e-1.jsonl +0 -0
eval_results_avg4/global_step_80/amc23/test_qwen-boxed_-1_seed0_t1.0_s0_e-1_metrics.json +15 -0
eval_results_avg4/global_step_90/aime24/test_qwen-boxed_-1_seed0_t1.0_s0_e-1.jsonl +0 -0
eval_results_avg4/global_step_90/aime24/test_qwen-boxed_-1_seed0_t1.0_s0_e-1_metrics.json +15 -0
eval_results_avg4/global_step_90/aime25/test_qwen-boxed_-1_seed0_t1.0_s0_e-1.jsonl +0 -0
eval_results_avg4/global_step_90/aime25/test_qwen-boxed_-1_seed0_t1.0_s0_e-1_metrics.json +15 -0
eval_results_avg4/global_step_90/amc23/test_qwen-boxed_-1_seed0_t1.0_s0_e-1.jsonl +0 -0
eval_results_avg4/global_step_90/amc23/test_qwen-boxed_-1_seed0_t1.0_s0_e-1_metrics.json +15 -0
eval_results_avg4/plots/eval_results_avg4_acc_keywords.png +3 -0
eval_results_avg4/plots/eval_results_avg4_acc_pass_acc.png +3 -0
eval_results_avg4/plots/eval_results_avg4_acc_tokens.png +3 -0
eval_results_avg4/plots/eval_results_avg4_avg_stop_tokens.png +3 -0
eval_results_avg4/plots/eval_results_avg4_box_ratio_and_token_length.png +3 -0
eval_results_avg4/plots/eval_results_avg4_clip_ratio.png +3 -0
eval_results_avg4/plots/eval_results_avg4_correct_tokens.png +3 -0
eval_results_avg4/plots/eval_results_avg4_tokens_keywords.png +3 -0
eval_results_merged/merged.csv +12 -0

.gitattributes CHANGED Viewed

@@ -33,3 +33,25 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+global_step_90/actor/huggingface/tokenizer.json filter=lfs diff=lfs merge=lfs -text
+global_step_70/actor/huggingface/tokenizer.json filter=lfs diff=lfs merge=lfs -text
+global_step_80/actor/huggingface/tokenizer.json filter=lfs diff=lfs merge=lfs -text
+eval_results/global_step_0/mmlu_stem/test_qwen-boxed_-1_seed0_t1.0_s0_e-1.jsonl filter=lfs diff=lfs merge=lfs -text
+eval_results/plots/eval_results_acc_pass_acc.png filter=lfs diff=lfs merge=lfs -text
+eval_results/plots/eval_results_acc_keywords.png filter=lfs diff=lfs merge=lfs -text
+eval_results/plots/eval_results_acc_tokens.png filter=lfs diff=lfs merge=lfs -text
+eval_results/plots/eval_results_avg_stop_tokens.png filter=lfs diff=lfs merge=lfs -text
+eval_results/plots/eval_results_box_ratio_and_token_length.png filter=lfs diff=lfs merge=lfs -text
+eval_results/plots/eval_results_clip_ratio.png filter=lfs diff=lfs merge=lfs -text
+eval_results/plots/eval_results_correct_tokens.png filter=lfs diff=lfs merge=lfs -text
+eval_results/plots/eval_results_repeat_ratio_and_token_length.png filter=lfs diff=lfs merge=lfs -text
+eval_results/plots/eval_results_tokens_keywords.png filter=lfs diff=lfs merge=lfs -text
+eval_results/plots/eval_results_wrong_tokens.png filter=lfs diff=lfs merge=lfs -text
+eval_results_avg4/plots/eval_results_avg4_acc_keywords.png filter=lfs diff=lfs merge=lfs -text
+eval_results_avg4/plots/eval_results_avg4_acc_pass_acc.png filter=lfs diff=lfs merge=lfs -text
+eval_results_avg4/plots/eval_results_avg4_acc_tokens.png filter=lfs diff=lfs merge=lfs -text
+eval_results_avg4/plots/eval_results_avg4_avg_stop_tokens.png filter=lfs diff=lfs merge=lfs -text
+eval_results_avg4/plots/eval_results_avg4_clip_ratio.png filter=lfs diff=lfs merge=lfs -text
+eval_results_avg4/plots/eval_results_avg4_box_ratio_and_token_length.png filter=lfs diff=lfs merge=lfs -text
+eval_results_avg4/plots/eval_results_avg4_correct_tokens.png filter=lfs diff=lfs merge=lfs -text
+eval_results_avg4/plots/eval_results_avg4_tokens_keywords.png filter=lfs diff=lfs merge=lfs -text

eval_results/global_step_0/mmlu_stem/test_qwen-boxed_-1_seed0_t1.0_s0_e-1.jsonl ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6a42fa1343b5e1c8505957614a09bf3ab4ed175d5ab2b1c05f2ab9dc1ba0db40
+size 12132789

eval_results/plots/eval_results_acc_keywords.png ADDED Viewed

Git LFS Details

SHA256: a1f50968ac4e74fdc31661e4a281d177a15a1b572b7def441bc4f631a39f378f
Pointer size: 131 Bytes
Size of remote file: 425 kB

eval_results/plots/eval_results_acc_pass_acc.png ADDED Viewed

Git LFS Details

SHA256: be9d66bb613fb652228b623de07c057a57d11d75f5ece6b91d1a90161e6e5d57
Pointer size: 131 Bytes
Size of remote file: 330 kB

eval_results/plots/eval_results_acc_tokens.png ADDED Viewed

Git LFS Details

SHA256: c2a9d5e4afbc5e39ebe06b94b0f23e5f5b1e7de6a39130261e2fc7f75251fdcf
Pointer size: 131 Bytes
Size of remote file: 416 kB

eval_results/plots/eval_results_avg_stop_tokens.png ADDED Viewed

Git LFS Details

SHA256: 0100f884f6457e59dfce30669b0a835df439a42462e8775edf2cd5953f522819
Pointer size: 131 Bytes
Size of remote file: 471 kB

eval_results/plots/eval_results_box_ratio_and_token_length.png ADDED Viewed

Git LFS Details

SHA256: accb3442879996e364a25c9d48c3453fd0d28d383f567c97dfcf8788f30d9b55
Pointer size: 131 Bytes
Size of remote file: 422 kB

eval_results/plots/eval_results_clip_ratio.png ADDED Viewed

Git LFS Details

SHA256: 35a790bcdce14dd0aaa8ecf96cd13b3a8cb77b977afbe9aa57fa6de2cf65843e
Pointer size: 131 Bytes
Size of remote file: 375 kB

eval_results/plots/eval_results_correct_tokens.png ADDED Viewed

Git LFS Details

SHA256: 121fc28908a40c1693aba086068b3616207c9d43bc3ec3ae341a11c731aff9c7
Pointer size: 131 Bytes
Size of remote file: 442 kB

eval_results/plots/eval_results_repeat_ratio_and_token_length.png ADDED Viewed

Git LFS Details

SHA256: ee3565ac5cdebfdc88a1e4b6f4fcc3033b13c3c7c1151036ff45763a42109bc7
Pointer size: 131 Bytes
Size of remote file: 438 kB

eval_results/plots/eval_results_tokens_keywords.png ADDED Viewed

Git LFS Details

SHA256: f980e298d690320b6d27a00fa38f6e1c1e3a5e87d57a8278dac818033406ff39
Pointer size: 131 Bytes
Size of remote file: 388 kB

eval_results/plots/eval_results_wrong_tokens.png ADDED Viewed