mzio/aprm-sft_genthinkact-ENtw_treasure_hunter-GEaprm_qwen3_ap-SE0-REfsc4-ap1-b019 Viewer • Updated Jan 23 • 3.2k • 11
mzio/aprm-sft_genthinkact-ENtw_treasure_hunter-GEaprm_qwen3_ap-SE0-REfsc4-ap1-b009 Viewer • Updated Jan 23 • 3.2k • 9
mzio/aprm-sft_genthinkact-ENtw_cooking_game-GEaprm_qwen3_ap-SE42-REfsc2-ap1-b0009 Viewer • Updated Jan 22 • 9.9k • 9
mzio/aprm_sft_thought_action_rollouts-ENtw_treasure_hunter-GEaprm_qwen3_ap-SE42-REfsc1-ap1_best-b0040 Viewer • Updated Jan 22 • 3.2k • 9
mzio/aprm-sft_genthinkact-ENtw_treasure_hunter-GEaprm_qwen3_ap-SE42-REfsc1-ap1-b0039 Viewer • Updated Jan 22 • 3.2k • 9
mzio/aprm-sft_genthinkact-ENtw_coin_collector-GEaprm_qwen3_ap-SE42-REfsc1-ap1-b0039 Viewer • Updated Jan 22 • 3.2k • 11
mzio/aprm-sft_genthinkact-ENtw_treasure_hunter-GEaprm_qwen3_ap-SE42-REfsc1-ap1-b0029 Viewer • Updated Jan 22 • 3.2k • 9
mzio/aprm-sft_genthinkact-ENtw_coin_collector-GEaprm_qwen3_ap-SE42-REfsc1-ap1-b0029 Viewer • Updated Jan 22 • 3.2k • 10
mzio/aprm-sft_genthinkact-ENtw_treasure_hunter-GEaprm_qwen3_ap-SE42-REfsc1-ap1-b0019 Viewer • Updated Jan 22 • 3.2k • 11
mzio/aprm-sft_genthinkact-ENtw_treasure_hunter-GEaprm_qwen3_ap-SE42-REfsc1-ap1-b0009 Viewer • Updated Jan 22 • 3.2k • 9
mzio/aprm-sft_genthinkact-ENtw_coin_collector-GEaprm_qwen3_ap-SE42-REfsc1-ap1-b0019 Viewer • Updated Jan 22 • 3.2k • 9
mzio/aprm-sft_genthinkact-ENtw_coin_collector-GEaprm_qwen3_ap_nobandit-SE42-RE2-ap1-b0019 Viewer • Updated Jan 22 • 3.2k • 9
mzio/aprm-sft_genthinkact-ENtw_coin_collector-GEaprm_qwen3_ap-SE42-REfsc1-ap1-b0009 Viewer • Updated Jan 22 • 3.2k • 8
mzio/aprm-sft_genthinkact-ENtw_treasure_hunter-GEaprm_qwen3_ap-SE42-RE2-ap1-b0009 Viewer • Updated Jan 22 • 3.2k • 9
mzio/aprm-sft_genthinkact-ENtw_coin_collector-GEaprm_qwen3_ap-SE42-RE1-ap1-b0029 Viewer • Updated Jan 22 • 3.2k • 9
mzio/aprm-sft_genthinkact-ENtw_treasure_hunter-GEaprm_qwen3_ap_nobandit-SE42-RE2-ap1-b0009 Viewer • Updated Jan 22 • 3.2k • 11
mzio/aprm-sft_genthinkact-ENtw_coin_collector-GEaprm_qwen3_ap_nobandit-SE42-RE2-ap1-b0009 Viewer • Updated Jan 22 • 3.2k • 9
mzio/aprm-sft_genthinkact-ENtw_coin_collector-GEaprm_qwen3_ap-SE42-RE1-ap1-b0019 Viewer • Updated Jan 22 • 3.2k • 9
mzio/aprm-sft_genthinkact-ENtw_coin_collector-GEaprm_qwen3_ap-SE42-RE1-ap1-b0009 Viewer • Updated Jan 22 • 3.2k • 9
mzio/aprm-sft_act_only-ENtextworld_coin_collector-GEaprm_qwen3_ap-SE42-RE1 Viewer • Updated Jan 21 • 400 • 9
mzio/aprm_sft_thought_action_rollouts-ENtextworld_treasure_hunter-GEaprm_qwen3_ap-SE42-RE1-ap1_0099 Viewer • Updated Jan 21 • 3.2k • 9
mzio/aprm-sft_genthinkact-ENtextworld_treasure_hunter-GEaprm_qwen3_ap-SE42-RE0-ap1-b0000 Viewer • Updated Jan 21 • 3.2k • 10
mzio/aprm_sft_thought_action_rollouts-ENhotpotqa_mc_gpt5_gen4s_GEaprm_qwen3_ap_SE42_RE4-ap1_best_0020 Viewer • Updated Jan 19 • 1.59k • 10
mzio/aprm_sft_thought_action_rollouts-ENhotpotqa_mc_gpt5_gen4s_GEaprm_qwen3_ap_SE42_RE4-ap1_0019 Viewer • Updated Jan 19 • 1.59k • 11