fix: revert eval_strategy back to evaluation_strategy (4.40.2 uses old name)

Browse files

Files changed (16) hide show

root_gainlora/gen_script_long_order3_t5_gainlora_inflora.sh +15 -15
root_gainlora/gen_script_long_order3_t5_inflora.sh +15 -15
root_gainlora/gen_script_long_order4_t5_gainlora_inflora.sh +15 -15
root_gainlora/gen_script_long_order4_t5_inflora.sh +15 -15
root_gainlora/gen_script_superni_order1_llama_gainlora_inflora.sh +15 -15
root_gainlora/gen_script_superni_order1_llama_gainlora_olora.sh +15 -15
root_gainlora/gen_script_superni_order1_llama_inflora.sh +15 -15
root_gainlora/gen_script_superni_order1_llama_olora.sh +15 -15
root_gainlora/gen_script_superni_order1_t5_gainlora_inflora.sh +15 -15
root_gainlora/gen_script_superni_order1_t5_inflora.sh +15 -15
root_gainlora/gen_script_superni_order2_llama_gainlora_inflora.sh +15 -15
root_gainlora/gen_script_superni_order2_llama_gainlora_olora.sh +15 -15
root_gainlora/gen_script_superni_order2_llama_inflora.sh +15 -15
root_gainlora/gen_script_superni_order2_llama_olora.sh +15 -15
root_gainlora/gen_script_superni_order2_t5_gainlora_inflora.sh +15 -15
root_gainlora/gen_script_superni_order2_t5_inflora.sh +15 -15

root_gainlora/gen_script_long_order3_t5_gainlora_inflora.sh CHANGED Viewed

@@ -37,7 +37,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -87,7 +87,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_amazon \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -137,7 +137,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_mnli \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -187,7 +187,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_cb \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -237,7 +237,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_copa \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -287,7 +287,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_qqp \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -337,7 +337,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_rte \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -387,7 +387,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_imdb \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -437,7 +437,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_sst2 \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -487,7 +487,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_dbpedia \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -537,7 +537,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_agnews \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -587,7 +587,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_yahoo \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -637,7 +637,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_multirc \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -687,7 +687,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_boolq \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -738,7 +738,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_wic \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \

    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_amazon \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_mnli \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_cb \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_copa \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_qqp \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_rte \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_imdb \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_sst2 \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_dbpedia \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_agnews \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_yahoo \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_multirc \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_boolq \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_wic \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \

root_gainlora/gen_script_long_order3_t5_inflora.sh CHANGED Viewed

@@ -38,7 +38,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -87,7 +87,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_amazon \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -136,7 +136,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_mnli \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -185,7 +185,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_cb \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -234,7 +234,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_copa \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -283,7 +283,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_qqp \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -332,7 +332,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_rte \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -381,7 +381,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_imdb \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -430,7 +430,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_sst2 \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -479,7 +479,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_dbpedia \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -528,7 +528,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_agnews \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -577,7 +577,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_yahoo \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -626,7 +626,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_multirc \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -675,7 +675,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_boolq \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -724,7 +724,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_wic \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \

    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_amazon \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_mnli \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_cb \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_copa \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_qqp \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_rte \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_imdb \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_sst2 \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_dbpedia \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_agnews \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_yahoo \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_multirc \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_boolq \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_wic \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \

root_gainlora/gen_script_long_order4_t5_gainlora_inflora.sh CHANGED Viewed

@@ -38,7 +38,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -89,7 +89,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_cb \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -140,7 +140,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_wic \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -191,7 +191,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_copa \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -242,7 +242,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_qqp \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -293,7 +293,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_boolq \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -344,7 +344,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_rte \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -395,7 +395,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_imdb \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -446,7 +446,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_yelp \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -497,7 +497,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_amazon \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -548,7 +548,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_sst2 \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -599,7 +599,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_dbpedia \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -650,7 +650,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_agnews \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -701,7 +701,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_multirc \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -752,7 +752,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_yahoo \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \

    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_cb \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_wic \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_copa \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_qqp \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_boolq \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_rte \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_imdb \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_yelp \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_amazon \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_sst2 \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_dbpedia \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_agnews \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_multirc \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_yahoo \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \

root_gainlora/gen_script_long_order4_t5_inflora.sh CHANGED Viewed

@@ -38,7 +38,7 @@ CUDA_VISIBLE_DEVICES=1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -87,7 +87,7 @@ CUDA_VISIBLE_DEVICES=1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_cb \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -136,7 +136,7 @@ CUDA_VISIBLE_DEVICES=1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_wic \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -185,7 +185,7 @@ CUDA_VISIBLE_DEVICES=1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_copa \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -234,7 +234,7 @@ CUDA_VISIBLE_DEVICES=1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_qqp \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -283,7 +283,7 @@ CUDA_VISIBLE_DEVICES=1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_boolq \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -332,7 +332,7 @@ CUDA_VISIBLE_DEVICES=1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_rte \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -381,7 +381,7 @@ CUDA_VISIBLE_DEVICES=1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_imdb \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -430,7 +430,7 @@ CUDA_VISIBLE_DEVICES=1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_yelp \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -479,7 +479,7 @@ CUDA_VISIBLE_DEVICES=1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_amazon \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -528,7 +528,7 @@ CUDA_VISIBLE_DEVICES=1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_sst2 \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -577,7 +577,7 @@ CUDA_VISIBLE_DEVICES=1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_dbpedia \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -626,7 +626,7 @@ CUDA_VISIBLE_DEVICES=1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_agnews \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -675,7 +675,7 @@ CUDA_VISIBLE_DEVICES=1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_multirc \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -724,7 +724,7 @@ CUDA_VISIBLE_DEVICES=1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_yahoo \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \

    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_cb \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_wic \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_copa \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_qqp \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_boolq \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_rte \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_imdb \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_yelp \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_amazon \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_sst2 \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_dbpedia \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_agnews \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_multirc \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_exact_match_for_yahoo \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \

root_gainlora/gen_script_superni_order1_llama_gainlora_inflora.sh CHANGED Viewed

@@ -41,7 +41,7 @@ deepspeed --include localhost:${1} --master_port 19500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --lora_r 4 \
@@ -97,7 +97,7 @@ deepspeed --include localhost:${1} --master_port 19500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task363_sst2_polarity_classification \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -154,7 +154,7 @@ deepspeed --include localhost:${1} --master_port 19500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1290_xsum_summarization \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -211,7 +211,7 @@ deepspeed --include localhost:${1} --master_port 19500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task181_outcome_extraction \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -268,7 +268,7 @@ deepspeed --include localhost:${1} --master_port 19500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task002_quoref_answer_generation \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -325,7 +325,7 @@ deepspeed --include localhost:${1} --master_port 19500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1510_evalution_relation_extraction \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -382,7 +382,7 @@ deepspeed --include localhost:${1} --master_port 19500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task639_multi_woz_user_utterance_generation \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -439,7 +439,7 @@ deepspeed --include localhost:${1} --master_port 19500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1729_personachat_generate_next \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -496,7 +496,7 @@ deepspeed --include localhost:${1} --master_port 19500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task073_commonsenseqa_answer_generation \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -553,7 +553,7 @@ deepspeed --include localhost:${1} --master_port 19500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1590_diplomacy_text_generation \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -610,7 +610,7 @@ deepspeed --include localhost:${1} --master_port 19500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task748_glucose_reverse_cause_event_detection \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -667,7 +667,7 @@ deepspeed --include localhost:${1} --master_port 19500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task511_reddit_tifu_long_text_summarization \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -724,7 +724,7 @@ deepspeed --include localhost:${1} --master_port 19500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task591_sciq_answer_generation \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -781,7 +781,7 @@ deepspeed --include localhost:${1} --master_port 19500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1687_sentiment140_classification \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -838,7 +838,7 @@ deepspeed --include localhost:${1} --master_port 19500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task875_emotion_classification \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \

    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --lora_r 4 \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task363_sst2_polarity_classification \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1290_xsum_summarization \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task181_outcome_extraction \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task002_quoref_answer_generation \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1510_evalution_relation_extraction \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task639_multi_woz_user_utterance_generation \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1729_personachat_generate_next \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task073_commonsenseqa_answer_generation \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1590_diplomacy_text_generation \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task748_glucose_reverse_cause_event_detection \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task511_reddit_tifu_long_text_summarization \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task591_sciq_answer_generation \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1687_sentiment140_classification \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task875_emotion_classification \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \

root_gainlora/gen_script_superni_order1_llama_gainlora_olora.sh CHANGED Viewed

@@ -41,7 +41,7 @@ deepspeed --include localhost:${1} --master_port 39500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --lora_r 4 \
@@ -98,7 +98,7 @@ deepspeed --include localhost:${1} --master_port 39500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task363_sst2_polarity_classification \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -156,7 +156,7 @@ deepspeed --include localhost:${1} --master_port 39500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1290_xsum_summarization \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -214,7 +214,7 @@ deepspeed --include localhost:${1} --master_port 39500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task181_outcome_extraction \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -272,7 +272,7 @@ deepspeed --include localhost:${1} --master_port 39500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task002_quoref_answer_generation \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -330,7 +330,7 @@ deepspeed --include localhost:${1} --master_port 39500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1510_evalution_relation_extraction \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -388,7 +388,7 @@ deepspeed --include localhost:${1} --master_port 39500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task639_multi_woz_user_utterance_generation \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -446,7 +446,7 @@ deepspeed --include localhost:${1} --master_port 39500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1729_personachat_generate_next \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -504,7 +504,7 @@ deepspeed --include localhost:${1} --master_port 39500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task073_commonsenseqa_answer_generation \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -562,7 +562,7 @@ deepspeed --include localhost:${1} --master_port 39500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1590_diplomacy_text_generation \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -620,7 +620,7 @@ deepspeed --include localhost:${1} --master_port 39500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task748_glucose_reverse_cause_event_detection \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -678,7 +678,7 @@ deepspeed --include localhost:${1} --master_port 39500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task511_reddit_tifu_long_text_summarization \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -736,7 +736,7 @@ deepspeed --include localhost:${1} --master_port 39500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task591_sciq_answer_generation \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -794,7 +794,7 @@ deepspeed --include localhost:${1} --master_port 39500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1687_sentiment140_classification \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -852,7 +852,7 @@ deepspeed --include localhost:${1} --master_port 39500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task875_emotion_classification \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \

    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --lora_r 4 \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task363_sst2_polarity_classification \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1290_xsum_summarization \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task181_outcome_extraction \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task002_quoref_answer_generation \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1510_evalution_relation_extraction \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task639_multi_woz_user_utterance_generation \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1729_personachat_generate_next \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task073_commonsenseqa_answer_generation \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1590_diplomacy_text_generation \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task748_glucose_reverse_cause_event_detection \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task511_reddit_tifu_long_text_summarization \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task591_sciq_answer_generation \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1687_sentiment140_classification \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task875_emotion_classification \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \

root_gainlora/gen_script_superni_order1_llama_inflora.sh CHANGED Viewed

@@ -41,7 +41,7 @@ deepspeed --include localhost:${1} --master_port 9500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --lora_r 4 \
@@ -97,7 +97,7 @@ deepspeed --include localhost:${1} --master_port 9500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task363_sst2_polarity_classification \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -154,7 +154,7 @@ deepspeed --include localhost:${1} --master_port 9500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1290_xsum_summarization \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -211,7 +211,7 @@ deepspeed --include localhost:${1} --master_port 9500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task181_outcome_extraction \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -268,7 +268,7 @@ deepspeed --include localhost:${1} --master_port 9500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task002_quoref_answer_generation \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -325,7 +325,7 @@ deepspeed --include localhost:${1} --master_port 9500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1510_evalution_relation_extraction \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -382,7 +382,7 @@ deepspeed --include localhost:${1} --master_port 9500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task639_multi_woz_user_utterance_generation \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -439,7 +439,7 @@ deepspeed --include localhost:${1} --master_port 9500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1729_personachat_generate_next \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -496,7 +496,7 @@ deepspeed --include localhost:${1} --master_port 9500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task073_commonsenseqa_answer_generation \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -553,7 +553,7 @@ deepspeed --include localhost:${1} --master_port 9500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1590_diplomacy_text_generation \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -610,7 +610,7 @@ deepspeed --include localhost:${1} --master_port 9500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task748_glucose_reverse_cause_event_detection \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -667,7 +667,7 @@ deepspeed --include localhost:${1} --master_port 9500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task511_reddit_tifu_long_text_summarization \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -724,7 +724,7 @@ deepspeed --include localhost:${1} --master_port 9500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task591_sciq_answer_generation \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -781,7 +781,7 @@ deepspeed --include localhost:${1} --master_port 9500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1687_sentiment140_classification \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -838,7 +838,7 @@ deepspeed --include localhost:${1} --master_port 9500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task875_emotion_classification \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \

    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --lora_r 4 \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task363_sst2_polarity_classification \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1290_xsum_summarization \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task181_outcome_extraction \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task002_quoref_answer_generation \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1510_evalution_relation_extraction \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task639_multi_woz_user_utterance_generation \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1729_personachat_generate_next \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task073_commonsenseqa_answer_generation \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1590_diplomacy_text_generation \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task748_glucose_reverse_cause_event_detection \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task511_reddit_tifu_long_text_summarization \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task591_sciq_answer_generation \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1687_sentiment140_classification \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task875_emotion_classification \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \

root_gainlora/gen_script_superni_order1_llama_olora.sh CHANGED Viewed

@@ -41,7 +41,7 @@ deepspeed --include localhost:${1} --master_port 29500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --lora_r 4 \
@@ -96,7 +96,7 @@ deepspeed --include localhost:${1} --master_port 29500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task363_sst2_polarity_classification \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -152,7 +152,7 @@ deepspeed --include localhost:${1} --master_port 29500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1290_xsum_summarization \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -208,7 +208,7 @@ deepspeed --include localhost:${1} --master_port 29500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task181_outcome_extraction \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -264,7 +264,7 @@ deepspeed --include localhost:${1} --master_port 29500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task002_quoref_answer_generation \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -320,7 +320,7 @@ deepspeed --include localhost:${1} --master_port 29500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1510_evalution_relation_extraction \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -376,7 +376,7 @@ deepspeed --include localhost:${1} --master_port 29500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task639_multi_woz_user_utterance_generation \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -432,7 +432,7 @@ deepspeed --include localhost:${1} --master_port 29500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1729_personachat_generate_next \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -488,7 +488,7 @@ deepspeed --include localhost:${1} --master_port 29500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task073_commonsenseqa_answer_generation \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -544,7 +544,7 @@ deepspeed --include localhost:${1} --master_port 29500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1590_diplomacy_text_generation \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -600,7 +600,7 @@ deepspeed --include localhost:${1} --master_port 29500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task748_glucose_reverse_cause_event_detection \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -656,7 +656,7 @@ deepspeed --include localhost:${1} --master_port 29500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task511_reddit_tifu_long_text_summarization \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -712,7 +712,7 @@ deepspeed --include localhost:${1} --master_port 29500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task591_sciq_answer_generation \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -768,7 +768,7 @@ deepspeed --include localhost:${1} --master_port 29500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1687_sentiment140_classification \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -824,7 +824,7 @@ deepspeed --include localhost:${1} --master_port 29500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task875_emotion_classification \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \

    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --lora_r 4 \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task363_sst2_polarity_classification \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1290_xsum_summarization \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task181_outcome_extraction \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task002_quoref_answer_generation \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1510_evalution_relation_extraction \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task639_multi_woz_user_utterance_generation \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1729_personachat_generate_next \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task073_commonsenseqa_answer_generation \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1590_diplomacy_text_generation \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task748_glucose_reverse_cause_event_detection \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task511_reddit_tifu_long_text_summarization \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task591_sciq_answer_generation \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1687_sentiment140_classification \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task875_emotion_classification \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \

root_gainlora/gen_script_superni_order1_t5_gainlora_inflora.sh CHANGED Viewed

@@ -38,7 +38,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --lora_r 4 \
@@ -87,7 +87,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task363_sst2_polarity_classification \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -136,7 +136,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1290_xsum_summarization \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -185,7 +185,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task181_outcome_extraction \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -234,7 +234,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task002_quoref_answer_generation \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -283,7 +283,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1510_evalution_relation_extraction \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -332,7 +332,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task639_multi_woz_user_utterance_generation \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -381,7 +381,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1729_personachat_generate_next \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -430,7 +430,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task073_commonsenseqa_answer_generation \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -479,7 +479,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1590_diplomacy_text_generation \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -528,7 +528,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task748_glucose_reverse_cause_event_detection \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -577,7 +577,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task511_reddit_tifu_long_text_summarization \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -626,7 +626,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task591_sciq_answer_generation \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -675,7 +675,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1687_sentiment140_classification \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -724,7 +724,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task875_emotion_classification \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \

    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --lora_r 4 \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task363_sst2_polarity_classification \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1290_xsum_summarization \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task181_outcome_extraction \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task002_quoref_answer_generation \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1510_evalution_relation_extraction \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task639_multi_woz_user_utterance_generation \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1729_personachat_generate_next \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task073_commonsenseqa_answer_generation \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1590_diplomacy_text_generation \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task748_glucose_reverse_cause_event_detection \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task511_reddit_tifu_long_text_summarization \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task591_sciq_answer_generation \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1687_sentiment140_classification \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task875_emotion_classification \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \

root_gainlora/gen_script_superni_order1_t5_inflora.sh CHANGED Viewed

@@ -38,7 +38,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --lora_r 4 \
@@ -84,7 +84,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task363_sst2_polarity_classification \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -131,7 +131,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1290_xsum_summarization \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -178,7 +178,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task181_outcome_extraction \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -225,7 +225,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task002_quoref_answer_generation \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -272,7 +272,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1510_evalution_relation_extraction \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -319,7 +319,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task639_multi_woz_user_utterance_generation \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -366,7 +366,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1729_personachat_generate_next \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -413,7 +413,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task073_commonsenseqa_answer_generation \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -460,7 +460,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1590_diplomacy_text_generation \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -507,7 +507,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task748_glucose_reverse_cause_event_detection \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -554,7 +554,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task511_reddit_tifu_long_text_summarization \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -601,7 +601,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task591_sciq_answer_generation \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -648,7 +648,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1687_sentiment140_classification \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -695,7 +695,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task875_emotion_classification \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \

    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --lora_r 4 \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task363_sst2_polarity_classification \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1290_xsum_summarization \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task181_outcome_extraction \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task002_quoref_answer_generation \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1510_evalution_relation_extraction \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task639_multi_woz_user_utterance_generation \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1729_personachat_generate_next \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task073_commonsenseqa_answer_generation \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1590_diplomacy_text_generation \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task748_glucose_reverse_cause_event_detection \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task511_reddit_tifu_long_text_summarization \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task591_sciq_answer_generation \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1687_sentiment140_classification \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task875_emotion_classification \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \

root_gainlora/gen_script_superni_order2_llama_gainlora_inflora.sh CHANGED Viewed

@@ -41,7 +41,7 @@ deepspeed --include localhost:${1} --master_port 19500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --lora_r 4 \
@@ -98,7 +98,7 @@ deepspeed --include localhost:${1} --master_port 19500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task073_commonsenseqa_answer_generation \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -156,7 +156,7 @@ deepspeed --include localhost:${1} --master_port 19500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1590_diplomacy_text_generation \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -214,7 +214,7 @@ deepspeed --include localhost:${1} --master_port 19500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task639_multi_woz_user_utterance_generation \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -272,7 +272,7 @@ deepspeed --include localhost:${1} --master_port 19500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1572_samsum_summary \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -330,7 +330,7 @@ deepspeed --include localhost:${1} --master_port 19500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1687_sentiment140_classification \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -388,7 +388,7 @@ deepspeed --include localhost:${1} --master_port 19500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task591_sciq_answer_generation \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -446,7 +446,7 @@ deepspeed --include localhost:${1} --master_port 19500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task363_sst2_polarity_classification \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -504,7 +504,7 @@ deepspeed --include localhost:${1} --master_port 19500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1510_evalution_relation_extraction \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -562,7 +562,7 @@ deepspeed --include localhost:${1} --master_port 19500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1729_personachat_generate_next \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -620,7 +620,7 @@ deepspeed --include localhost:${1} --master_port 19500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task181_outcome_extraction \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -678,7 +678,7 @@ deepspeed --include localhost:${1} --master_port 19500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task511_reddit_tifu_long_text_summarization \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -736,7 +736,7 @@ deepspeed --include localhost:${1} --master_port 19500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task002_quoref_answer_generation \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -794,7 +794,7 @@ deepspeed --include localhost:${1} --master_port 19500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1290_xsum_summarization \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -852,7 +852,7 @@ deepspeed --include localhost:${1} --master_port 19500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task875_emotion_classification \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \

    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --lora_r 4 \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task073_commonsenseqa_answer_generation \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1590_diplomacy_text_generation \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task639_multi_woz_user_utterance_generation \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1572_samsum_summary \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1687_sentiment140_classification \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task591_sciq_answer_generation \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task363_sst2_polarity_classification \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1510_evalution_relation_extraction \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1729_personachat_generate_next \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task181_outcome_extraction \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task511_reddit_tifu_long_text_summarization \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task002_quoref_answer_generation \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1290_xsum_summarization \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task875_emotion_classification \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \

root_gainlora/gen_script_superni_order2_llama_gainlora_olora.sh CHANGED Viewed

@@ -41,7 +41,7 @@ deepspeed --include localhost:${1} --master_port 39500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --lora_r 4 \
@@ -99,7 +99,7 @@ deepspeed --include localhost:${1} --master_port 39500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task073_commonsenseqa_answer_generation \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -158,7 +158,7 @@ deepspeed --include localhost:${1} --master_port 39500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1590_diplomacy_text_generation \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -217,7 +217,7 @@ deepspeed --include localhost:${1} --master_port 39500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task639_multi_woz_user_utterance_generation \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -276,7 +276,7 @@ deepspeed --include localhost:${1} --master_port 39500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1572_samsum_summary \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -335,7 +335,7 @@ deepspeed --include localhost:${1} --master_port 39500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1687_sentiment140_classification \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -394,7 +394,7 @@ deepspeed --include localhost:${1} --master_port 39500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task591_sciq_answer_generation \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -453,7 +453,7 @@ deepspeed --include localhost:${1} --master_port 39500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task363_sst2_polarity_classification \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -512,7 +512,7 @@ deepspeed --include localhost:${1} --master_port 39500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1510_evalution_relation_extraction \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -571,7 +571,7 @@ deepspeed --include localhost:${1} --master_port 39500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1729_personachat_generate_next \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -630,7 +630,7 @@ deepspeed --include localhost:${1} --master_port 39500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task181_outcome_extraction \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -689,7 +689,7 @@ deepspeed --include localhost:${1} --master_port 39500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task511_reddit_tifu_long_text_summarization \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -748,7 +748,7 @@ deepspeed --include localhost:${1} --master_port 39500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task002_quoref_answer_generation \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -807,7 +807,7 @@ deepspeed --include localhost:${1} --master_port 39500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1290_xsum_summarization \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -866,7 +866,7 @@ deepspeed --include localhost:${1} --master_port 39500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task875_emotion_classification \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \

    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --lora_r 4 \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task073_commonsenseqa_answer_generation \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1590_diplomacy_text_generation \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task639_multi_woz_user_utterance_generation \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1572_samsum_summary \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1687_sentiment140_classification \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task591_sciq_answer_generation \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task363_sst2_polarity_classification \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1510_evalution_relation_extraction \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1729_personachat_generate_next \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task181_outcome_extraction \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task511_reddit_tifu_long_text_summarization \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task002_quoref_answer_generation \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1290_xsum_summarization \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task875_emotion_classification \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \

root_gainlora/gen_script_superni_order2_llama_inflora.sh CHANGED Viewed

@@ -41,7 +41,7 @@ deepspeed --include localhost:${1} --master_port 9500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --lora_r 4 \
@@ -97,7 +97,7 @@ deepspeed --include localhost:${1} --master_port 9500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task073_commonsenseqa_answer_generation \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -154,7 +154,7 @@ deepspeed --include localhost:${1} --master_port 9500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1590_diplomacy_text_generation \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -211,7 +211,7 @@ deepspeed --include localhost:${1} --master_port 9500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task639_multi_woz_user_utterance_generation \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -268,7 +268,7 @@ deepspeed --include localhost:${1} --master_port 9500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1572_samsum_summary \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -325,7 +325,7 @@ deepspeed --include localhost:${1} --master_port 9500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1687_sentiment140_classification \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -382,7 +382,7 @@ deepspeed --include localhost:${1} --master_port 9500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task591_sciq_answer_generation \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -439,7 +439,7 @@ deepspeed --include localhost:${1} --master_port 9500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task363_sst2_polarity_classification \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -496,7 +496,7 @@ deepspeed --include localhost:${1} --master_port 9500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1510_evalution_relation_extraction \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -553,7 +553,7 @@ deepspeed --include localhost:${1} --master_port 9500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1729_personachat_generate_next \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -610,7 +610,7 @@ deepspeed --include localhost:${1} --master_port 9500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task181_outcome_extraction \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -667,7 +667,7 @@ deepspeed --include localhost:${1} --master_port 9500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task511_reddit_tifu_long_text_summarization \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -724,7 +724,7 @@ deepspeed --include localhost:${1} --master_port 9500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task002_quoref_answer_generation \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -781,7 +781,7 @@ deepspeed --include localhost:${1} --master_port 9500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1290_xsum_summarization \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -838,7 +838,7 @@ deepspeed --include localhost:${1} --master_port 9500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task875_emotion_classification \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \

    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --lora_r 4 \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task073_commonsenseqa_answer_generation \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1590_diplomacy_text_generation \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task639_multi_woz_user_utterance_generation \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1572_samsum_summary \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1687_sentiment140_classification \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task591_sciq_answer_generation \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task363_sst2_polarity_classification \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1510_evalution_relation_extraction \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1729_personachat_generate_next \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task181_outcome_extraction \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task511_reddit_tifu_long_text_summarization \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task002_quoref_answer_generation \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1290_xsum_summarization \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task875_emotion_classification \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \

root_gainlora/gen_script_superni_order2_llama_olora.sh CHANGED Viewed

@@ -41,7 +41,7 @@ deepspeed --include localhost:${1} --master_port 29500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --lora_r 4 \
@@ -96,7 +96,7 @@ deepspeed --include localhost:${1} --master_port 29500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task073_commonsenseqa_answer_generation \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -152,7 +152,7 @@ deepspeed --include localhost:${1} --master_port 29500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1590_diplomacy_text_generation \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -208,7 +208,7 @@ deepspeed --include localhost:${1} --master_port 29500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task639_multi_woz_user_utterance_generation \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -264,7 +264,7 @@ deepspeed --include localhost:${1} --master_port 29500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1572_samsum_summary \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -320,7 +320,7 @@ deepspeed --include localhost:${1} --master_port 29500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1687_sentiment140_classification \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -376,7 +376,7 @@ deepspeed --include localhost:${1} --master_port 29500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task591_sciq_answer_generation \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -432,7 +432,7 @@ deepspeed --include localhost:${1} --master_port 29500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task363_sst2_polarity_classification \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -488,7 +488,7 @@ deepspeed --include localhost:${1} --master_port 29500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1510_evalution_relation_extraction \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -544,7 +544,7 @@ deepspeed --include localhost:${1} --master_port 29500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1729_personachat_generate_next \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -600,7 +600,7 @@ deepspeed --include localhost:${1} --master_port 29500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task181_outcome_extraction \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -656,7 +656,7 @@ deepspeed --include localhost:${1} --master_port 29500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task511_reddit_tifu_long_text_summarization \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -712,7 +712,7 @@ deepspeed --include localhost:${1} --master_port 29500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task002_quoref_answer_generation \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -768,7 +768,7 @@ deepspeed --include localhost:${1} --master_port 29500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1290_xsum_summarization \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -824,7 +824,7 @@ deepspeed --include localhost:${1} --master_port 29500 src/run_llama.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task875_emotion_classification \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \

    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --lora_r 4 \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task073_commonsenseqa_answer_generation \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1590_diplomacy_text_generation \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task639_multi_woz_user_utterance_generation \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1572_samsum_summary \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1687_sentiment140_classification \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task591_sciq_answer_generation \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task363_sst2_polarity_classification \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1510_evalution_relation_extraction \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1729_personachat_generate_next \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task181_outcome_extraction \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task511_reddit_tifu_long_text_summarization \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task002_quoref_answer_generation \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1290_xsum_summarization \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task875_emotion_classification \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \

root_gainlora/gen_script_superni_order2_t5_gainlora_inflora.sh CHANGED Viewed

@@ -38,7 +38,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --lora_r 4 \
@@ -86,7 +86,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task073_commonsenseqa_answer_generation \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -135,7 +135,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1590_diplomacy_text_generation \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -184,7 +184,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task639_multi_woz_user_utterance_generation \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -233,7 +233,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1572_samsum_summary \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -282,7 +282,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1687_sentiment140_classification \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -331,7 +331,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task591_sciq_answer_generation \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -380,7 +380,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task363_sst2_polarity_classification \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -429,7 +429,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1510_evalution_relation_extraction \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -478,7 +478,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1729_personachat_generate_next \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -527,7 +527,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task181_outcome_extraction \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -576,7 +576,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task511_reddit_tifu_long_text_summarization \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -625,7 +625,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task002_quoref_answer_generation \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -674,7 +674,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1290_xsum_summarization \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -723,7 +723,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task875_emotion_classification \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \

    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --lora_r 4 \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task073_commonsenseqa_answer_generation \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1590_diplomacy_text_generation \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task639_multi_woz_user_utterance_generation \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1572_samsum_summary \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1687_sentiment140_classification \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task591_sciq_answer_generation \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task363_sst2_polarity_classification \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1510_evalution_relation_extraction \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1729_personachat_generate_next \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task181_outcome_extraction \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task511_reddit_tifu_long_text_summarization \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task002_quoref_answer_generation \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1290_xsum_summarization \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task875_emotion_classification \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \

root_gainlora/gen_script_superni_order2_t5_inflora.sh CHANGED Viewed

@@ -38,7 +38,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --lora_r 4 \
@@ -84,7 +84,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task073_commonsenseqa_answer_generation \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -131,7 +131,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1590_diplomacy_text_generation \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -178,7 +178,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task639_multi_woz_user_utterance_generation \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -225,7 +225,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1572_samsum_summary \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -272,7 +272,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1687_sentiment140_classification \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -319,7 +319,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task591_sciq_answer_generation \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -366,7 +366,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task363_sst2_polarity_classification \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -413,7 +413,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1510_evalution_relation_extraction \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -460,7 +460,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1729_personachat_generate_next \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -507,7 +507,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task181_outcome_extraction \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -554,7 +554,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task511_reddit_tifu_long_text_summarization \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -601,7 +601,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task002_quoref_answer_generation \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -648,7 +648,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1290_xsum_summarization \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
@@ -695,7 +695,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task875_emotion_classification \
-   --eval_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \

    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --lora_r 4 \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task073_commonsenseqa_answer_generation \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1590_diplomacy_text_generation \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task639_multi_woz_user_utterance_generation \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1572_samsum_summary \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1687_sentiment140_classification \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task591_sciq_answer_generation \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task363_sst2_polarity_classification \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1510_evalution_relation_extraction \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1729_personachat_generate_next \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task181_outcome_extraction \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task511_reddit_tifu_long_text_summarization \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task002_quoref_answer_generation \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task1290_xsum_summarization \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \
    --logging_strategy steps \
    --logging_steps 10 \
    --metric_for_best_model eval_rougeL_for_task875_emotion_classification \
+   --evaluation_strategy steps \
    --save_strategy steps \
    --save_total_limit 1 \
    --load_best_model_at_end \