natmin322 commited on Mar 12

Commit

8b246a8

1 Parent(s): e84f283

fix: preserve task_config_dir in T5_small scripts

- Only replace experiment names in output_dir and run_name
- Keep task_config_dir pointing to gen_script_long_order3_t5_configs (not _small)
- Fixes ValueError: config files not found

Files changed (21) hide show

gen_t5_small_scripts.py +19 -4
improve_gainlora/T5_small/gen_script_long_order3_t5_small_gainlora_inflora.sh +16 -16
improve_gainlora/T5_small/gen_script_long_order3_t5_small_inflora.sh +16 -16
improve_gainlora/T5_small/gen_script_long_order3_t5_small_specroute.sh +15 -15
improve_gainlora/T5_small/gen_script_long_order4_t5_small_gainlora_inflora.sh +16 -16
improve_gainlora/T5_small/gen_script_long_order4_t5_small_inflora.sh +16 -16
improve_gainlora/T5_small/gen_script_long_order4_t5_small_specroute.sh +15 -15
improve_gainlora/T5_small/gen_script_superni_order1_t5_small_gainlora_inflora.sh +16 -16
improve_gainlora/T5_small/gen_script_superni_order1_t5_small_inflora.sh +16 -16
improve_gainlora/T5_small/gen_script_superni_order1_t5_small_specroute.sh +15 -15
improve_gainlora/T5_small/gen_script_superni_order2_t5_small_gainlora_inflora.sh +16 -16
improve_gainlora/T5_small/gen_script_superni_order2_t5_small_inflora.sh +16 -16
improve_gainlora/T5_small/gen_script_superni_order2_t5_small_specroute.sh +15 -15
root_gainlora/T5_small/gen_script_long_order3_t5_small_gainlora_inflora.sh +16 -16
root_gainlora/T5_small/gen_script_long_order3_t5_small_inflora.sh +16 -16
root_gainlora/T5_small/gen_script_long_order4_t5_small_gainlora_inflora.sh +16 -16
root_gainlora/T5_small/gen_script_long_order4_t5_small_inflora.sh +16 -16
root_gainlora/T5_small/gen_script_superni_order1_t5_small_gainlora_inflora.sh +16 -16
root_gainlora/T5_small/gen_script_superni_order1_t5_small_inflora.sh +16 -16
root_gainlora/T5_small/gen_script_superni_order2_t5_small_gainlora_inflora.sh +16 -16
root_gainlora/T5_small/gen_script_superni_order2_t5_small_inflora.sh +16 -16

gen_t5_small_scripts.py CHANGED Viewed

@@ -44,13 +44,28 @@ SPECROUTE_SUPERNI_MODES = {
 def replace_experiment_names(content: str) -> str:
-    """Replace gen_script_X_t5_METHOD  →  gen_script_X_t5_small_METHOD."""
-    # Works in output_dir, run_name, checkpoint paths
-    return re.sub(
-        r'(gen_script_(?:long_order[34]|superni_order[12])_t5_)(?!small_)',
         r'\1small_',
         content,
     )
 def remove_gradient_checkpointing_flag(content: str) -> str:

 def replace_experiment_names(content: str) -> str:
+    """Replace gen_script_X_t5_METHOD  →  gen_script_X_t5_small_METHOD.
+    Only in:
+      - --output_dir paths (logs_and_outputs/...)
+      - --run_name values
+      - checkpoint loading paths (load_checkpoint_from, previous_lora_path, etc.)
+    NOT in --task_config_dir (configs/... stays unchanged)
+    """
+    # Replace in logs_and_outputs/ output directories
+    content = re.sub(
+        r'(logs_and_outputs/)(gen_script_(?:long_order[34]|superni_order[12])_t5_)(?!small_)',
+        r'\1\2small_',
+        content,
+    )
+    # Replace in --run_name
+    content = re.sub(
+        r'(--run_name gen_script_(?:long_order[34]|superni_order[12])_t5_)(?!small_)',
         r'\1small_',
         content,
     )
+    return content
 def remove_gradient_checkpointing_flag(content: str) -> str:

improve_gainlora/T5_small/gen_script_long_order3_t5_small_gainlora_inflora.sh CHANGED Viewed

@@ -17,7 +17,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --model_name_or_path $2 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/yelp \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_gainlora_inflora/outputs/1-yelp \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -67,7 +67,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/amazon \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_gainlora_inflora/outputs/2-amazon \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -117,7 +117,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/mnli \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_gainlora_inflora/outputs/3-mnli \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -167,7 +167,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/cb \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_gainlora_inflora/outputs/4-cb \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -217,7 +217,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/copa \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_gainlora_inflora/outputs/5-copa \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -267,7 +267,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/qqp \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_gainlora_inflora/outputs/6-qqp \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -317,7 +317,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/rte \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_gainlora_inflora/outputs/7-rte \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -367,7 +367,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/imdb \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_gainlora_inflora/outputs/8-imdb \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -417,7 +417,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/sst2 \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_gainlora_inflora/outputs/9-sst2 \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -467,7 +467,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/dbpedia \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_gainlora_inflora/outputs/10-dbpedia \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -517,7 +517,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/agnews \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_gainlora_inflora/outputs/11-agnews \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -567,7 +567,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/yahoo \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_gainlora_inflora/outputs/12-yahoo \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -617,7 +617,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/multirc \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_gainlora_inflora/outputs/13-multirc \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -667,7 +667,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/boolq \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_gainlora_inflora/outputs/14-boolq \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -718,7 +718,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/wic \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_gainlora_inflora/outputs/15-wic \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -757,7 +757,7 @@ rm -rf logs_and_outputs/gen_script_long_order3_t5_small_gainlora_inflora/outputs
 sleep 5
-CUDA_VISIBLE_DEVICES=$1 python score.py gen_script_long_order3_t5_small_gainlora_inflora gen_script_long_order3_t5_small_gainlora_inflora

    --model_name_or_path $2 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/yelp \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_gainlora_inflora/outputs/1-yelp \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/amazon \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_gainlora_inflora/outputs/2-amazon \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/mnli \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_gainlora_inflora/outputs/3-mnli \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/cb \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_gainlora_inflora/outputs/4-cb \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/copa \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_gainlora_inflora/outputs/5-copa \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/qqp \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_gainlora_inflora/outputs/6-qqp \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/rte \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_gainlora_inflora/outputs/7-rte \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/imdb \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_gainlora_inflora/outputs/8-imdb \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/sst2 \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_gainlora_inflora/outputs/9-sst2 \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/dbpedia \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_gainlora_inflora/outputs/10-dbpedia \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/agnews \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_gainlora_inflora/outputs/11-agnews \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/yahoo \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_gainlora_inflora/outputs/12-yahoo \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/multirc \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_gainlora_inflora/outputs/13-multirc \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/boolq \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_gainlora_inflora/outputs/14-boolq \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/wic \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_gainlora_inflora/outputs/15-wic \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
 sleep 5
+CUDA_VISIBLE_DEVICES=$1 python score.py gen_script_long_order3_t5_gainlora_inflora gen_script_long_order3_t5_gainlora_inflora

improve_gainlora/T5_small/gen_script_long_order3_t5_small_inflora.sh CHANGED Viewed

@@ -18,7 +18,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --model_name_or_path $2 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/yelp \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_inflora/outputs/1-yelp \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -67,7 +67,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/amazon \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_inflora/outputs/2-amazon \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -116,7 +116,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/mnli \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_inflora/outputs/3-mnli \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -165,7 +165,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/cb \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_inflora/outputs/4-cb \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -214,7 +214,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/copa \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_inflora/outputs/5-copa \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -263,7 +263,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/qqp \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_inflora/outputs/6-qqp \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -312,7 +312,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/rte \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_inflora/outputs/7-rte \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -361,7 +361,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/imdb \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_inflora/outputs/8-imdb \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -410,7 +410,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/sst2 \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_inflora/outputs/9-sst2 \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -459,7 +459,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/dbpedia \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_inflora/outputs/10-dbpedia \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -508,7 +508,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/agnews \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_inflora/outputs/11-agnews \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -557,7 +557,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/yahoo \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_inflora/outputs/12-yahoo \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -606,7 +606,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/multirc \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_inflora/outputs/13-multirc \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -655,7 +655,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/boolq \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_inflora/outputs/14-boolq \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -704,7 +704,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/wic \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_inflora/outputs/15-wic \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -741,4 +741,4 @@ rm -rf logs_and_outputs/gen_script_long_order3_t5_small_inflora/outputs/15-wic/c
 sleep 5
-CUDA_VISIBLE_DEVICES=$1 python score.py gen_script_long_order3_t5_small_inflora gen_script_long_order3_t5_small_inflora

    --model_name_or_path $2 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/yelp \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_inflora/outputs/1-yelp \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/amazon \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_inflora/outputs/2-amazon \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/mnli \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_inflora/outputs/3-mnli \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/cb \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_inflora/outputs/4-cb \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/copa \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_inflora/outputs/5-copa \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/qqp \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_inflora/outputs/6-qqp \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/rte \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_inflora/outputs/7-rte \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/imdb \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_inflora/outputs/8-imdb \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/sst2 \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_inflora/outputs/9-sst2 \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/dbpedia \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_inflora/outputs/10-dbpedia \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/agnews \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_inflora/outputs/11-agnews \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/yahoo \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_inflora/outputs/12-yahoo \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/multirc \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_inflora/outputs/13-multirc \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/boolq \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_inflora/outputs/14-boolq \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/wic \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_inflora/outputs/15-wic \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
 sleep 5
+CUDA_VISIBLE_DEVICES=$1 python score.py gen_script_long_order3_t5_inflora gen_script_long_order3_t5_inflora

improve_gainlora/T5_small/gen_script_long_order3_t5_small_specroute.sh CHANGED Viewed

@@ -67,7 +67,7 @@ CUDA_VISIBLE_DEVICES=$GPU_IDS python src/run_t5.py \
    --model_name_or_path $2 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/yelp \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/1-yelp \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
@@ -121,7 +121,7 @@ CUDA_VISIBLE_DEVICES=$GPU_IDS python src/run_t5.py \
    --previous_lora_path logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/1-yelp/saved_weights \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/amazon \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/2-amazon \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
@@ -174,7 +174,7 @@ CUDA_VISIBLE_DEVICES=$GPU_IDS python src/run_t5.py \
    --previous_lora_path logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/1-yelp/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/2-amazon/saved_weights \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/mnli \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/3-mnli \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
@@ -227,7 +227,7 @@ CUDA_VISIBLE_DEVICES=$GPU_IDS python src/run_t5.py \
    --previous_lora_path logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/1-yelp/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/2-amazon/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/3-mnli/saved_weights \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/cb \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/4-cb \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
@@ -280,7 +280,7 @@ CUDA_VISIBLE_DEVICES=$GPU_IDS python src/run_t5.py \
    --previous_lora_path logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/1-yelp/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/2-amazon/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/3-mnli/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/4-cb/saved_weights \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/copa \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/5-copa \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
@@ -333,7 +333,7 @@ CUDA_VISIBLE_DEVICES=$GPU_IDS python src/run_t5.py \
    --previous_lora_path logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/1-yelp/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/2-amazon/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/3-mnli/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/4-cb/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/5-copa/saved_weights \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/qqp \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/6-qqp \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
@@ -386,7 +386,7 @@ CUDA_VISIBLE_DEVICES=$GPU_IDS python src/run_t5.py \
    --previous_lora_path logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/1-yelp/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/2-amazon/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/3-mnli/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/4-cb/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/5-copa/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/6-qqp/saved_weights \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/rte \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/7-rte \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
@@ -439,7 +439,7 @@ CUDA_VISIBLE_DEVICES=$GPU_IDS python src/run_t5.py \
    --previous_lora_path logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/1-yelp/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/2-amazon/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/3-mnli/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/4-cb/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/5-copa/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/6-qqp/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/7-rte/saved_weights \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/imdb \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/8-imdb \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
@@ -492,7 +492,7 @@ CUDA_VISIBLE_DEVICES=$GPU_IDS python src/run_t5.py \
    --previous_lora_path logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/1-yelp/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/2-amazon/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/3-mnli/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/4-cb/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/5-copa/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/6-qqp/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/7-rte/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/8-imdb/saved_weights \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/sst2 \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/9-sst2 \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
@@ -545,7 +545,7 @@ CUDA_VISIBLE_DEVICES=$GPU_IDS python src/run_t5.py \
    --previous_lora_path logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/1-yelp/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/2-amazon/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/3-mnli/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/4-cb/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/5-copa/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/6-qqp/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/7-rte/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/8-imdb/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/9-sst2/saved_weights \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/dbpedia \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/10-dbpedia \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
@@ -598,7 +598,7 @@ CUDA_VISIBLE_DEVICES=$GPU_IDS python src/run_t5.py \
    --previous_lora_path logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/1-yelp/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/2-amazon/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/3-mnli/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/4-cb/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/5-copa/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/6-qqp/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/7-rte/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/8-imdb/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/9-sst2/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/10-dbpedia/saved_weights \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/agnews \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/11-agnews \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
@@ -651,7 +651,7 @@ CUDA_VISIBLE_DEVICES=$GPU_IDS python src/run_t5.py \
    --previous_lora_path logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/1-yelp/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/2-amazon/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/3-mnli/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/4-cb/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/5-copa/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/6-qqp/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/7-rte/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/8-imdb/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/9-sst2/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/10-dbpedia/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/11-agnews/saved_weights \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/yahoo \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/12-yahoo \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
@@ -704,7 +704,7 @@ CUDA_VISIBLE_DEVICES=$GPU_IDS python src/run_t5.py \
    --previous_lora_path logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/1-yelp/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/2-amazon/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/3-mnli/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/4-cb/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/5-copa/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/6-qqp/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/7-rte/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/8-imdb/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/9-sst2/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/10-dbpedia/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/11-agnews/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/12-yahoo/saved_weights \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/multirc \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/13-multirc \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
@@ -757,7 +757,7 @@ CUDA_VISIBLE_DEVICES=$GPU_IDS python src/run_t5.py \
    --previous_lora_path logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/1-yelp/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/2-amazon/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/3-mnli/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/4-cb/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/5-copa/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/6-qqp/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/7-rte/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/8-imdb/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/9-sst2/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/10-dbpedia/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/11-agnews/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/12-yahoo/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/13-multirc/saved_weights \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/boolq \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/14-boolq \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
@@ -810,7 +810,7 @@ CUDA_VISIBLE_DEVICES=$GPU_IDS python src/run_t5.py \
    --previous_lora_path logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/1-yelp/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/2-amazon/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/3-mnli/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/4-cb/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/5-copa/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/6-qqp/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/7-rte/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/8-imdb/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/9-sst2/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/10-dbpedia/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/11-agnews/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/12-yahoo/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/13-multirc/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/14-boolq/saved_weights \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/wic \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/15-wic \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \

    --model_name_or_path $2 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/yelp \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/1-yelp \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
    --previous_lora_path logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/1-yelp/saved_weights \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/amazon \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/2-amazon \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
    --previous_lora_path logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/1-yelp/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/2-amazon/saved_weights \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/mnli \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/3-mnli \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
    --previous_lora_path logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/1-yelp/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/2-amazon/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/3-mnli/saved_weights \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/cb \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/4-cb \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
    --previous_lora_path logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/1-yelp/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/2-amazon/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/3-mnli/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/4-cb/saved_weights \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/copa \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/5-copa \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
    --previous_lora_path logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/1-yelp/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/2-amazon/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/3-mnli/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/4-cb/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/5-copa/saved_weights \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/qqp \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/6-qqp \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
    --previous_lora_path logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/1-yelp/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/2-amazon/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/3-mnli/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/4-cb/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/5-copa/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/6-qqp/saved_weights \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/rte \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/7-rte \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
    --previous_lora_path logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/1-yelp/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/2-amazon/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/3-mnli/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/4-cb/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/5-copa/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/6-qqp/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/7-rte/saved_weights \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/imdb \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/8-imdb \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
    --previous_lora_path logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/1-yelp/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/2-amazon/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/3-mnli/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/4-cb/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/5-copa/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/6-qqp/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/7-rte/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/8-imdb/saved_weights \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/sst2 \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/9-sst2 \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
    --previous_lora_path logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/1-yelp/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/2-amazon/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/3-mnli/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/4-cb/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/5-copa/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/6-qqp/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/7-rte/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/8-imdb/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/9-sst2/saved_weights \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/dbpedia \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/10-dbpedia \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
    --previous_lora_path logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/1-yelp/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/2-amazon/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/3-mnli/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/4-cb/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/5-copa/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/6-qqp/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/7-rte/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/8-imdb/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/9-sst2/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/10-dbpedia/saved_weights \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/agnews \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/11-agnews \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
    --previous_lora_path logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/1-yelp/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/2-amazon/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/3-mnli/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/4-cb/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/5-copa/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/6-qqp/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/7-rte/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/8-imdb/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/9-sst2/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/10-dbpedia/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/11-agnews/saved_weights \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/yahoo \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/12-yahoo \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
    --previous_lora_path logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/1-yelp/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/2-amazon/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/3-mnli/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/4-cb/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/5-copa/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/6-qqp/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/7-rte/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/8-imdb/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/9-sst2/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/10-dbpedia/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/11-agnews/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/12-yahoo/saved_weights \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/multirc \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/13-multirc \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
    --previous_lora_path logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/1-yelp/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/2-amazon/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/3-mnli/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/4-cb/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/5-copa/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/6-qqp/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/7-rte/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/8-imdb/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/9-sst2/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/10-dbpedia/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/11-agnews/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/12-yahoo/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/13-multirc/saved_weights \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/boolq \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/14-boolq \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
    --previous_lora_path logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/1-yelp/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/2-amazon/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/3-mnli/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/4-cb/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/5-copa/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/6-qqp/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/7-rte/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/8-imdb/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/9-sst2/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/10-dbpedia/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/11-agnews/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/12-yahoo/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/13-multirc/saved_weights,logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/14-boolq/saved_weights \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/wic \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_specroute/outputs/15-wic \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \

improve_gainlora/T5_small/gen_script_long_order4_t5_small_gainlora_inflora.sh CHANGED Viewed

@@ -18,7 +18,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --model_name_or_path $2 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/mnli \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_gainlora_inflora/outputs/1-mnli \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -69,7 +69,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/cb \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_gainlora_inflora/outputs/2-cb \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -120,7 +120,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/wic \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_gainlora_inflora/outputs/3-wic \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -171,7 +171,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/copa \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_gainlora_inflora/outputs/4-copa \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -222,7 +222,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/qqp \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_gainlora_inflora/outputs/5-qqp \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -273,7 +273,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/boolq \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_gainlora_inflora/outputs/6-boolq \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -324,7 +324,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/rte \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_gainlora_inflora/outputs/7-rte \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -375,7 +375,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/imdb \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_gainlora_inflora/outputs/8-imdb \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -426,7 +426,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/yelp \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_gainlora_inflora/outputs/9-yelp \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -477,7 +477,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/amazon \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_gainlora_inflora/outputs/10-amazon \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -528,7 +528,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/sst2 \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_gainlora_inflora/outputs/11-sst2 \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -579,7 +579,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/dbpedia \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_gainlora_inflora/outputs/12-dbpedia \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -630,7 +630,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/agnews \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_gainlora_inflora/outputs/13-agnews \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -681,7 +681,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/multirc \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_gainlora_inflora/outputs/14-multirc \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -732,7 +732,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/yahoo \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_gainlora_inflora/outputs/15-yahoo \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -771,4 +771,4 @@ rm -rf logs_and_outputs/gen_script_long_order4_t5_small_gainlora_inflora/outputs
 sleep 5
-CUDA_VISIBLE_DEVICES=$1 python score.py gen_script_long_order4_t5_small_gainlora_inflora gen_script_long_order4_t5_small_gainlora_inflora

    --model_name_or_path $2 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/mnli \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_gainlora_inflora/outputs/1-mnli \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/cb \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_gainlora_inflora/outputs/2-cb \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/wic \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_gainlora_inflora/outputs/3-wic \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/copa \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_gainlora_inflora/outputs/4-copa \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/qqp \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_gainlora_inflora/outputs/5-qqp \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/boolq \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_gainlora_inflora/outputs/6-boolq \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/rte \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_gainlora_inflora/outputs/7-rte \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/imdb \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_gainlora_inflora/outputs/8-imdb \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/yelp \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_gainlora_inflora/outputs/9-yelp \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/amazon \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_gainlora_inflora/outputs/10-amazon \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/sst2 \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_gainlora_inflora/outputs/11-sst2 \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/dbpedia \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_gainlora_inflora/outputs/12-dbpedia \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/agnews \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_gainlora_inflora/outputs/13-agnews \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/multirc \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_gainlora_inflora/outputs/14-multirc \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/yahoo \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_gainlora_inflora/outputs/15-yahoo \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
 sleep 5
+CUDA_VISIBLE_DEVICES=$1 python score.py gen_script_long_order4_t5_gainlora_inflora gen_script_long_order4_t5_gainlora_inflora

improve_gainlora/T5_small/gen_script_long_order4_t5_small_inflora.sh CHANGED Viewed

@@ -18,7 +18,7 @@ CUDA_VISIBLE_DEVICES=1 python src/run_t5.py \
    --model_name_or_path $2 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/mnli \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_inflora/outputs/1-mnli \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -67,7 +67,7 @@ CUDA_VISIBLE_DEVICES=1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/cb \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_inflora/outputs/2-cb \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -116,7 +116,7 @@ CUDA_VISIBLE_DEVICES=1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/wic \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_inflora/outputs/3-wic \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -165,7 +165,7 @@ CUDA_VISIBLE_DEVICES=1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/copa \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_inflora/outputs/4-copa \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -214,7 +214,7 @@ CUDA_VISIBLE_DEVICES=1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/qqp \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_inflora/outputs/5-qqp \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -263,7 +263,7 @@ CUDA_VISIBLE_DEVICES=1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/boolq \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_inflora/outputs/6-boolq \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -312,7 +312,7 @@ CUDA_VISIBLE_DEVICES=1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/rte \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_inflora/outputs/7-rte \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -361,7 +361,7 @@ CUDA_VISIBLE_DEVICES=1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/imdb \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_inflora/outputs/8-imdb \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -410,7 +410,7 @@ CUDA_VISIBLE_DEVICES=1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/yelp \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_inflora/outputs/9-yelp \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -459,7 +459,7 @@ CUDA_VISIBLE_DEVICES=1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/amazon \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_inflora/outputs/10-amazon \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -508,7 +508,7 @@ CUDA_VISIBLE_DEVICES=1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/sst2 \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_inflora/outputs/11-sst2 \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -557,7 +557,7 @@ CUDA_VISIBLE_DEVICES=1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/dbpedia \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_inflora/outputs/12-dbpedia \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -606,7 +606,7 @@ CUDA_VISIBLE_DEVICES=1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/agnews \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_inflora/outputs/13-agnews \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -655,7 +655,7 @@ CUDA_VISIBLE_DEVICES=1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/multirc \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_inflora/outputs/14-multirc \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -704,7 +704,7 @@ CUDA_VISIBLE_DEVICES=1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/yahoo \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_inflora/outputs/15-yahoo \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -741,4 +741,4 @@ rm -rf logs_and_outputs/gen_script_long_order4_t5_small_inflora/outputs/15-yahoo
 sleep 5
-CUDA_VISIBLE_DEVICES=1 python score.py gen_script_long_order4_t5_small_inflora gen_script_long_order4_t5_small_inflora

    --model_name_or_path $2 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/mnli \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_inflora/outputs/1-mnli \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/cb \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_inflora/outputs/2-cb \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/wic \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_inflora/outputs/3-wic \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/copa \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_inflora/outputs/4-copa \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/qqp \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_inflora/outputs/5-qqp \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/boolq \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_inflora/outputs/6-boolq \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/rte \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_inflora/outputs/7-rte \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/imdb \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_inflora/outputs/8-imdb \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/yelp \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_inflora/outputs/9-yelp \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/amazon \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_inflora/outputs/10-amazon \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/sst2 \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_inflora/outputs/11-sst2 \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/dbpedia \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_inflora/outputs/12-dbpedia \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/agnews \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_inflora/outputs/13-agnews \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/multirc \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_inflora/outputs/14-multirc \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/yahoo \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_inflora/outputs/15-yahoo \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
 sleep 5
+CUDA_VISIBLE_DEVICES=1 python score.py gen_script_long_order4_t5_inflora gen_script_long_order4_t5_inflora

improve_gainlora/T5_small/gen_script_long_order4_t5_small_specroute.sh CHANGED Viewed

@@ -67,7 +67,7 @@ CUDA_VISIBLE_DEVICES=$GPU_IDS python src/run_t5.py \
    --model_name_or_path $2 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/mnli \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/1-mnli \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
@@ -121,7 +121,7 @@ CUDA_VISIBLE_DEVICES=$GPU_IDS python src/run_t5.py \
    --previous_lora_path logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/1-mnli/saved_weights \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/cb \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/2-cb \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
@@ -174,7 +174,7 @@ CUDA_VISIBLE_DEVICES=$GPU_IDS python src/run_t5.py \
    --previous_lora_path logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/1-mnli/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/2-cb/saved_weights \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/wic \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/3-wic \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
@@ -227,7 +227,7 @@ CUDA_VISIBLE_DEVICES=$GPU_IDS python src/run_t5.py \
    --previous_lora_path logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/1-mnli/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/2-cb/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/3-wic/saved_weights \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/copa \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/4-copa \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
@@ -280,7 +280,7 @@ CUDA_VISIBLE_DEVICES=$GPU_IDS python src/run_t5.py \
    --previous_lora_path logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/1-mnli/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/2-cb/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/3-wic/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/4-copa/saved_weights \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/qqp \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/5-qqp \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
@@ -333,7 +333,7 @@ CUDA_VISIBLE_DEVICES=$GPU_IDS python src/run_t5.py \
    --previous_lora_path logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/1-mnli/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/2-cb/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/3-wic/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/4-copa/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/5-qqp/saved_weights \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/boolq \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/6-boolq \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
@@ -386,7 +386,7 @@ CUDA_VISIBLE_DEVICES=$GPU_IDS python src/run_t5.py \
    --previous_lora_path logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/1-mnli/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/2-cb/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/3-wic/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/4-copa/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/5-qqp/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/6-boolq/saved_weights \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/rte \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/7-rte \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
@@ -439,7 +439,7 @@ CUDA_VISIBLE_DEVICES=$GPU_IDS python src/run_t5.py \
    --previous_lora_path logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/1-mnli/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/2-cb/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/3-wic/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/4-copa/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/5-qqp/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/6-boolq/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/7-rte/saved_weights \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/imdb \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/8-imdb \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
@@ -492,7 +492,7 @@ CUDA_VISIBLE_DEVICES=$GPU_IDS python src/run_t5.py \
    --previous_lora_path logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/1-mnli/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/2-cb/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/3-wic/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/4-copa/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/5-qqp/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/6-boolq/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/7-rte/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/8-imdb/saved_weights \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/yelp \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/9-yelp \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
@@ -545,7 +545,7 @@ CUDA_VISIBLE_DEVICES=$GPU_IDS python src/run_t5.py \
    --previous_lora_path logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/1-mnli/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/2-cb/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/3-wic/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/4-copa/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/5-qqp/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/6-boolq/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/7-rte/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/8-imdb/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/9-yelp/saved_weights \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/amazon \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/10-amazon \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
@@ -598,7 +598,7 @@ CUDA_VISIBLE_DEVICES=$GPU_IDS python src/run_t5.py \
    --previous_lora_path logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/1-mnli/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/2-cb/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/3-wic/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/4-copa/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/5-qqp/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/6-boolq/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/7-rte/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/8-imdb/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/9-yelp/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/10-amazon/saved_weights \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/sst2 \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/11-sst2 \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
@@ -651,7 +651,7 @@ CUDA_VISIBLE_DEVICES=$GPU_IDS python src/run_t5.py \
    --previous_lora_path logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/1-mnli/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/2-cb/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/3-wic/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/4-copa/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/5-qqp/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/6-boolq/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/7-rte/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/8-imdb/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/9-yelp/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/10-amazon/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/11-sst2/saved_weights \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/dbpedia \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/12-dbpedia \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
@@ -704,7 +704,7 @@ CUDA_VISIBLE_DEVICES=$GPU_IDS python src/run_t5.py \
    --previous_lora_path logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/1-mnli/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/2-cb/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/3-wic/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/4-copa/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/5-qqp/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/6-boolq/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/7-rte/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/8-imdb/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/9-yelp/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/10-amazon/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/11-sst2/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/12-dbpedia/saved_weights \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/agnews \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/13-agnews \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
@@ -757,7 +757,7 @@ CUDA_VISIBLE_DEVICES=$GPU_IDS python src/run_t5.py \
    --previous_lora_path logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/1-mnli/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/2-cb/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/3-wic/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/4-copa/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/5-qqp/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/6-boolq/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/7-rte/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/8-imdb/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/9-yelp/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/10-amazon/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/11-sst2/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/12-dbpedia/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/13-agnews/saved_weights \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/multirc \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/14-multirc \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
@@ -810,7 +810,7 @@ CUDA_VISIBLE_DEVICES=$GPU_IDS python src/run_t5.py \
    --previous_lora_path logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/1-mnli/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/2-cb/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/3-wic/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/4-copa/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/5-qqp/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/6-boolq/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/7-rte/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/8-imdb/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/9-yelp/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/10-amazon/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/11-sst2/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/12-dbpedia/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/13-agnews/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/14-multirc/saved_weights \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/yahoo \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/15-yahoo \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \

    --model_name_or_path $2 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/mnli \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/1-mnli \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
    --previous_lora_path logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/1-mnli/saved_weights \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/cb \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/2-cb \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
    --previous_lora_path logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/1-mnli/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/2-cb/saved_weights \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/wic \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/3-wic \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
    --previous_lora_path logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/1-mnli/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/2-cb/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/3-wic/saved_weights \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/copa \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/4-copa \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
    --previous_lora_path logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/1-mnli/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/2-cb/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/3-wic/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/4-copa/saved_weights \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/qqp \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/5-qqp \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
    --previous_lora_path logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/1-mnli/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/2-cb/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/3-wic/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/4-copa/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/5-qqp/saved_weights \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/boolq \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/6-boolq \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
    --previous_lora_path logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/1-mnli/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/2-cb/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/3-wic/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/4-copa/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/5-qqp/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/6-boolq/saved_weights \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/rte \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/7-rte \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
    --previous_lora_path logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/1-mnli/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/2-cb/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/3-wic/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/4-copa/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/5-qqp/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/6-boolq/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/7-rte/saved_weights \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/imdb \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/8-imdb \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
    --previous_lora_path logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/1-mnli/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/2-cb/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/3-wic/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/4-copa/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/5-qqp/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/6-boolq/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/7-rte/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/8-imdb/saved_weights \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/yelp \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/9-yelp \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
    --previous_lora_path logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/1-mnli/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/2-cb/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/3-wic/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/4-copa/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/5-qqp/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/6-boolq/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/7-rte/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/8-imdb/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/9-yelp/saved_weights \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/amazon \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/10-amazon \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
    --previous_lora_path logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/1-mnli/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/2-cb/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/3-wic/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/4-copa/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/5-qqp/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/6-boolq/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/7-rte/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/8-imdb/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/9-yelp/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/10-amazon/saved_weights \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/sst2 \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/11-sst2 \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
    --previous_lora_path logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/1-mnli/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/2-cb/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/3-wic/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/4-copa/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/5-qqp/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/6-boolq/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/7-rte/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/8-imdb/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/9-yelp/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/10-amazon/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/11-sst2/saved_weights \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/dbpedia \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/12-dbpedia \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
    --previous_lora_path logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/1-mnli/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/2-cb/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/3-wic/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/4-copa/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/5-qqp/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/6-boolq/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/7-rte/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/8-imdb/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/9-yelp/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/10-amazon/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/11-sst2/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/12-dbpedia/saved_weights \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/agnews \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/13-agnews \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
    --previous_lora_path logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/1-mnli/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/2-cb/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/3-wic/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/4-copa/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/5-qqp/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/6-boolq/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/7-rte/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/8-imdb/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/9-yelp/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/10-amazon/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/11-sst2/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/12-dbpedia/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/13-agnews/saved_weights \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/multirc \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/14-multirc \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
    --previous_lora_path logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/1-mnli/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/2-cb/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/3-wic/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/4-copa/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/5-qqp/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/6-boolq/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/7-rte/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/8-imdb/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/9-yelp/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/10-amazon/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/11-sst2/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/12-dbpedia/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/13-agnews/saved_weights,logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/14-multirc/saved_weights \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/yahoo \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_specroute/outputs/15-yahoo \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \

improve_gainlora/T5_small/gen_script_superni_order1_t5_small_gainlora_inflora.sh CHANGED Viewed

@@ -18,7 +18,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --model_name_or_path $2 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task1572_samsum_summary \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_gainlora_inflora/outputs/1-task1572_samsum_summary \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -67,7 +67,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task363_sst2_polarity_classification \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_gainlora_inflora/outputs/2-task363_sst2_polarity_classification \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -116,7 +116,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task1290_xsum_summarization \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_gainlora_inflora/outputs/3-task1290_xsum_summarization \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -165,7 +165,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task181_outcome_extraction \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_gainlora_inflora/outputs/4-task181_outcome_extraction \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -214,7 +214,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task002_quoref_answer_generation \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_gainlora_inflora/outputs/5-task002_quoref_answer_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -263,7 +263,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task1510_evalution_relation_extraction \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_gainlora_inflora/outputs/6-task1510_evalution_relation_extraction \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -312,7 +312,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task639_multi_woz_user_utterance_generation \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_gainlora_inflora/outputs/7-task639_multi_woz_user_utterance_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -361,7 +361,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task1729_personachat_generate_next \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_gainlora_inflora/outputs/8-task1729_personachat_generate_next \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -410,7 +410,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task073_commonsenseqa_answer_generation \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_gainlora_inflora/outputs/9-task073_commonsenseqa_answer_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -459,7 +459,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task1590_diplomacy_text_generation \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_gainlora_inflora/outputs/10-task1590_diplomacy_text_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -508,7 +508,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task748_glucose_reverse_cause_event_detection \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_gainlora_inflora/outputs/11-task748_glucose_reverse_cause_event_detection \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -557,7 +557,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task511_reddit_tifu_long_text_summarization \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_gainlora_inflora/outputs/12-task511_reddit_tifu_long_text_summarization \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -606,7 +606,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task591_sciq_answer_generation \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_gainlora_inflora/outputs/13-task591_sciq_answer_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -655,7 +655,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task1687_sentiment140_classification \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_gainlora_inflora/outputs/14-task1687_sentiment140_classification \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -704,7 +704,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task875_emotion_classification \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_gainlora_inflora/outputs/15-task875_emotion_classification \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -741,4 +741,4 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --threshold 0.995 \
    --transthreshold 0.995
-python score.py gen_script_superni_order1_t5_small_gainlora_inflora gen_script_superni_order1_t5_small_gainlora_inflora

    --model_name_or_path $2 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task1572_samsum_summary \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_gainlora_inflora/outputs/1-task1572_samsum_summary \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task363_sst2_polarity_classification \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_gainlora_inflora/outputs/2-task363_sst2_polarity_classification \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task1290_xsum_summarization \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_gainlora_inflora/outputs/3-task1290_xsum_summarization \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task181_outcome_extraction \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_gainlora_inflora/outputs/4-task181_outcome_extraction \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task002_quoref_answer_generation \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_gainlora_inflora/outputs/5-task002_quoref_answer_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task1510_evalution_relation_extraction \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_gainlora_inflora/outputs/6-task1510_evalution_relation_extraction \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task639_multi_woz_user_utterance_generation \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_gainlora_inflora/outputs/7-task639_multi_woz_user_utterance_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task1729_personachat_generate_next \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_gainlora_inflora/outputs/8-task1729_personachat_generate_next \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task073_commonsenseqa_answer_generation \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_gainlora_inflora/outputs/9-task073_commonsenseqa_answer_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task1590_diplomacy_text_generation \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_gainlora_inflora/outputs/10-task1590_diplomacy_text_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task748_glucose_reverse_cause_event_detection \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_gainlora_inflora/outputs/11-task748_glucose_reverse_cause_event_detection \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task511_reddit_tifu_long_text_summarization \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_gainlora_inflora/outputs/12-task511_reddit_tifu_long_text_summarization \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task591_sciq_answer_generation \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_gainlora_inflora/outputs/13-task591_sciq_answer_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task1687_sentiment140_classification \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_gainlora_inflora/outputs/14-task1687_sentiment140_classification \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task875_emotion_classification \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_gainlora_inflora/outputs/15-task875_emotion_classification \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --threshold 0.995 \
    --transthreshold 0.995
+python score.py gen_script_superni_order1_t5_gainlora_inflora gen_script_superni_order1_t5_gainlora_inflora

improve_gainlora/T5_small/gen_script_superni_order1_t5_small_inflora.sh CHANGED Viewed

@@ -18,7 +18,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --model_name_or_path $2 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task1572_samsum_summary \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_inflora/outputs/1-task1572_samsum_summary \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -64,7 +64,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task363_sst2_polarity_classification \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_inflora/outputs/2-task363_sst2_polarity_classification \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -111,7 +111,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task1290_xsum_summarization \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_inflora/outputs/3-task1290_xsum_summarization \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -158,7 +158,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task181_outcome_extraction \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_inflora/outputs/4-task181_outcome_extraction \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -205,7 +205,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task002_quoref_answer_generation \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_inflora/outputs/5-task002_quoref_answer_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -252,7 +252,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task1510_evalution_relation_extraction \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_inflora/outputs/6-task1510_evalution_relation_extraction \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -299,7 +299,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task639_multi_woz_user_utterance_generation \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_inflora/outputs/7-task639_multi_woz_user_utterance_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -346,7 +346,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task1729_personachat_generate_next \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_inflora/outputs/8-task1729_personachat_generate_next \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -393,7 +393,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task073_commonsenseqa_answer_generation \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_inflora/outputs/9-task073_commonsenseqa_answer_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -440,7 +440,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task1590_diplomacy_text_generation \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_inflora/outputs/10-task1590_diplomacy_text_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -487,7 +487,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task748_glucose_reverse_cause_event_detection \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_inflora/outputs/11-task748_glucose_reverse_cause_event_detection \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -534,7 +534,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task511_reddit_tifu_long_text_summarization \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_inflora/outputs/12-task511_reddit_tifu_long_text_summarization \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -581,7 +581,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task591_sciq_answer_generation \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_inflora/outputs/13-task591_sciq_answer_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -628,7 +628,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task1687_sentiment140_classification \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_inflora/outputs/14-task1687_sentiment140_classification \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -675,7 +675,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task875_emotion_classification \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_inflora/outputs/15-task875_emotion_classification \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -710,4 +710,4 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --model_name inflora \
    --threshold 0.995
-python score.py gen_script_superni_order1_t5_small_inflora gen_script_superni_order1_t5_small_inflora

    --model_name_or_path $2 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task1572_samsum_summary \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_inflora/outputs/1-task1572_samsum_summary \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task363_sst2_polarity_classification \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_inflora/outputs/2-task363_sst2_polarity_classification \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task1290_xsum_summarization \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_inflora/outputs/3-task1290_xsum_summarization \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task181_outcome_extraction \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_inflora/outputs/4-task181_outcome_extraction \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task002_quoref_answer_generation \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_inflora/outputs/5-task002_quoref_answer_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task1510_evalution_relation_extraction \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_inflora/outputs/6-task1510_evalution_relation_extraction \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task639_multi_woz_user_utterance_generation \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_inflora/outputs/7-task639_multi_woz_user_utterance_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task1729_personachat_generate_next \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_inflora/outputs/8-task1729_personachat_generate_next \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task073_commonsenseqa_answer_generation \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_inflora/outputs/9-task073_commonsenseqa_answer_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task1590_diplomacy_text_generation \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_inflora/outputs/10-task1590_diplomacy_text_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task748_glucose_reverse_cause_event_detection \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_inflora/outputs/11-task748_glucose_reverse_cause_event_detection \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task511_reddit_tifu_long_text_summarization \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_inflora/outputs/12-task511_reddit_tifu_long_text_summarization \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task591_sciq_answer_generation \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_inflora/outputs/13-task591_sciq_answer_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task1687_sentiment140_classification \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_inflora/outputs/14-task1687_sentiment140_classification \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task875_emotion_classification \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_inflora/outputs/15-task875_emotion_classification \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --model_name inflora \
    --threshold 0.995
+python score.py gen_script_superni_order1_t5_inflora gen_script_superni_order1_t5_inflora

improve_gainlora/T5_small/gen_script_superni_order1_t5_small_specroute.sh CHANGED Viewed

@@ -70,7 +70,7 @@ CUDA_VISIBLE_DEVICES=$GPU_IDS python src/run_t5.py \
    --model_name_or_path $2 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task1572_samsum_summary \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/1-task1572_samsum_summary \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
@@ -122,7 +122,7 @@ CUDA_VISIBLE_DEVICES=$GPU_IDS python src/run_t5.py \
    --previous_lora_path logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/1-task1572_samsum_summary/saved_weights \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task363_sst2_polarity_classification \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/2-task363_sst2_polarity_classification \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
@@ -173,7 +173,7 @@ CUDA_VISIBLE_DEVICES=$GPU_IDS python src/run_t5.py \
    --previous_lora_path logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/1-task1572_samsum_summary/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/2-task363_sst2_polarity_classification/saved_weights \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task1290_xsum_summarization \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/3-task1290_xsum_summarization \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
@@ -224,7 +224,7 @@ CUDA_VISIBLE_DEVICES=$GPU_IDS python src/run_t5.py \
    --previous_lora_path logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/1-task1572_samsum_summary/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/2-task363_sst2_polarity_classification/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/3-task1290_xsum_summarization/saved_weights \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task181_outcome_extraction \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/4-task181_outcome_extraction \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
@@ -275,7 +275,7 @@ CUDA_VISIBLE_DEVICES=$GPU_IDS python src/run_t5.py \
    --previous_lora_path logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/1-task1572_samsum_summary/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/2-task363_sst2_polarity_classification/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/3-task1290_xsum_summarization/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/4-task181_outcome_extraction/saved_weights \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task002_quoref_answer_generation \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/5-task002_quoref_answer_generation \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
@@ -326,7 +326,7 @@ CUDA_VISIBLE_DEVICES=$GPU_IDS python src/run_t5.py \
    --previous_lora_path logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/1-task1572_samsum_summary/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/2-task363_sst2_polarity_classification/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/3-task1290_xsum_summarization/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/4-task181_outcome_extraction/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/5-task002_quoref_answer_generation/saved_weights \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task1510_evalution_relation_extraction \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/6-task1510_evalution_relation_extraction \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
@@ -377,7 +377,7 @@ CUDA_VISIBLE_DEVICES=$GPU_IDS python src/run_t5.py \
    --previous_lora_path logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/1-task1572_samsum_summary/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/2-task363_sst2_polarity_classification/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/3-task1290_xsum_summarization/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/4-task181_outcome_extraction/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/5-task002_quoref_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/6-task1510_evalution_relation_extraction/saved_weights \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task639_multi_woz_user_utterance_generation \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/7-task639_multi_woz_user_utterance_generation \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
@@ -428,7 +428,7 @@ CUDA_VISIBLE_DEVICES=$GPU_IDS python src/run_t5.py \
    --previous_lora_path logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/1-task1572_samsum_summary/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/2-task363_sst2_polarity_classification/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/3-task1290_xsum_summarization/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/4-task181_outcome_extraction/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/5-task002_quoref_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/6-task1510_evalution_relation_extraction/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/7-task639_multi_woz_user_utterance_generation/saved_weights \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task1729_personachat_generate_next \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/8-task1729_personachat_generate_next \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
@@ -479,7 +479,7 @@ CUDA_VISIBLE_DEVICES=$GPU_IDS python src/run_t5.py \
    --previous_lora_path logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/1-task1572_samsum_summary/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/2-task363_sst2_polarity_classification/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/3-task1290_xsum_summarization/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/4-task181_outcome_extraction/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/5-task002_quoref_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/6-task1510_evalution_relation_extraction/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/7-task639_multi_woz_user_utterance_generation/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/8-task1729_personachat_generate_next/saved_weights \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task073_commonsenseqa_answer_generation \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/9-task073_commonsenseqa_answer_generation \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
@@ -530,7 +530,7 @@ CUDA_VISIBLE_DEVICES=$GPU_IDS python src/run_t5.py \
    --previous_lora_path logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/1-task1572_samsum_summary/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/2-task363_sst2_polarity_classification/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/3-task1290_xsum_summarization/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/4-task181_outcome_extraction/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/5-task002_quoref_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/6-task1510_evalution_relation_extraction/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/7-task639_multi_woz_user_utterance_generation/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/8-task1729_personachat_generate_next/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/9-task073_commonsenseqa_answer_generation/saved_weights \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task1590_diplomacy_text_generation \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/10-task1590_diplomacy_text_generation \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
@@ -581,7 +581,7 @@ CUDA_VISIBLE_DEVICES=$GPU_IDS python src/run_t5.py \
    --previous_lora_path logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/1-task1572_samsum_summary/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/2-task363_sst2_polarity_classification/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/3-task1290_xsum_summarization/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/4-task181_outcome_extraction/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/5-task002_quoref_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/6-task1510_evalution_relation_extraction/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/7-task639_multi_woz_user_utterance_generation/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/8-task1729_personachat_generate_next/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/9-task073_commonsenseqa_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/10-task1590_diplomacy_text_generation/saved_weights \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task748_glucose_reverse_cause_event_detection \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/11-task748_glucose_reverse_cause_event_detection \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
@@ -632,7 +632,7 @@ CUDA_VISIBLE_DEVICES=$GPU_IDS python src/run_t5.py \
    --previous_lora_path logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/1-task1572_samsum_summary/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/2-task363_sst2_polarity_classification/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/3-task1290_xsum_summarization/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/4-task181_outcome_extraction/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/5-task002_quoref_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/6-task1510_evalution_relation_extraction/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/7-task639_multi_woz_user_utterance_generation/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/8-task1729_personachat_generate_next/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/9-task073_commonsenseqa_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/10-task1590_diplomacy_text_generation/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/11-task748_glucose_reverse_cause_event_detection/saved_weights \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task511_reddit_tifu_long_text_summarization \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/12-task511_reddit_tifu_long_text_summarization \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
@@ -683,7 +683,7 @@ CUDA_VISIBLE_DEVICES=$GPU_IDS python src/run_t5.py \
    --previous_lora_path logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/1-task1572_samsum_summary/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/2-task363_sst2_polarity_classification/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/3-task1290_xsum_summarization/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/4-task181_outcome_extraction/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/5-task002_quoref_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/6-task1510_evalution_relation_extraction/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/7-task639_multi_woz_user_utterance_generation/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/8-task1729_personachat_generate_next/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/9-task073_commonsenseqa_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/10-task1590_diplomacy_text_generation/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/11-task748_glucose_reverse_cause_event_detection/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/12-task511_reddit_tifu_long_text_summarization/saved_weights \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task591_sciq_answer_generation \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/13-task591_sciq_answer_generation \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
@@ -734,7 +734,7 @@ CUDA_VISIBLE_DEVICES=$GPU_IDS python src/run_t5.py \
    --previous_lora_path logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/1-task1572_samsum_summary/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/2-task363_sst2_polarity_classification/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/3-task1290_xsum_summarization/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/4-task181_outcome_extraction/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/5-task002_quoref_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/6-task1510_evalution_relation_extraction/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/7-task639_multi_woz_user_utterance_generation/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/8-task1729_personachat_generate_next/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/9-task073_commonsenseqa_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/10-task1590_diplomacy_text_generation/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/11-task748_glucose_reverse_cause_event_detection/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/12-task511_reddit_tifu_long_text_summarization/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/13-task591_sciq_answer_generation/saved_weights \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task1687_sentiment140_classification \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/14-task1687_sentiment140_classification \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
@@ -785,7 +785,7 @@ CUDA_VISIBLE_DEVICES=$GPU_IDS python src/run_t5.py \
    --previous_lora_path logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/1-task1572_samsum_summary/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/2-task363_sst2_polarity_classification/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/3-task1290_xsum_summarization/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/4-task181_outcome_extraction/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/5-task002_quoref_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/6-task1510_evalution_relation_extraction/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/7-task639_multi_woz_user_utterance_generation/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/8-task1729_personachat_generate_next/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/9-task073_commonsenseqa_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/10-task1590_diplomacy_text_generation/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/11-task748_glucose_reverse_cause_event_detection/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/12-task511_reddit_tifu_long_text_summarization/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/13-task591_sciq_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/14-task1687_sentiment140_classification/saved_weights \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task875_emotion_classification \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/15-task875_emotion_classification \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \

    --model_name_or_path $2 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task1572_samsum_summary \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/1-task1572_samsum_summary \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
    --previous_lora_path logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/1-task1572_samsum_summary/saved_weights \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task363_sst2_polarity_classification \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/2-task363_sst2_polarity_classification \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
    --previous_lora_path logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/1-task1572_samsum_summary/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/2-task363_sst2_polarity_classification/saved_weights \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task1290_xsum_summarization \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/3-task1290_xsum_summarization \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
    --previous_lora_path logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/1-task1572_samsum_summary/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/2-task363_sst2_polarity_classification/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/3-task1290_xsum_summarization/saved_weights \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task181_outcome_extraction \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/4-task181_outcome_extraction \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
    --previous_lora_path logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/1-task1572_samsum_summary/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/2-task363_sst2_polarity_classification/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/3-task1290_xsum_summarization/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/4-task181_outcome_extraction/saved_weights \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task002_quoref_answer_generation \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/5-task002_quoref_answer_generation \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
    --previous_lora_path logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/1-task1572_samsum_summary/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/2-task363_sst2_polarity_classification/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/3-task1290_xsum_summarization/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/4-task181_outcome_extraction/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/5-task002_quoref_answer_generation/saved_weights \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task1510_evalution_relation_extraction \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/6-task1510_evalution_relation_extraction \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
    --previous_lora_path logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/1-task1572_samsum_summary/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/2-task363_sst2_polarity_classification/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/3-task1290_xsum_summarization/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/4-task181_outcome_extraction/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/5-task002_quoref_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/6-task1510_evalution_relation_extraction/saved_weights \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task639_multi_woz_user_utterance_generation \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/7-task639_multi_woz_user_utterance_generation \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
    --previous_lora_path logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/1-task1572_samsum_summary/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/2-task363_sst2_polarity_classification/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/3-task1290_xsum_summarization/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/4-task181_outcome_extraction/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/5-task002_quoref_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/6-task1510_evalution_relation_extraction/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/7-task639_multi_woz_user_utterance_generation/saved_weights \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task1729_personachat_generate_next \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/8-task1729_personachat_generate_next \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
    --previous_lora_path logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/1-task1572_samsum_summary/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/2-task363_sst2_polarity_classification/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/3-task1290_xsum_summarization/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/4-task181_outcome_extraction/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/5-task002_quoref_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/6-task1510_evalution_relation_extraction/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/7-task639_multi_woz_user_utterance_generation/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/8-task1729_personachat_generate_next/saved_weights \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task073_commonsenseqa_answer_generation \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/9-task073_commonsenseqa_answer_generation \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
    --previous_lora_path logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/1-task1572_samsum_summary/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/2-task363_sst2_polarity_classification/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/3-task1290_xsum_summarization/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/4-task181_outcome_extraction/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/5-task002_quoref_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/6-task1510_evalution_relation_extraction/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/7-task639_multi_woz_user_utterance_generation/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/8-task1729_personachat_generate_next/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/9-task073_commonsenseqa_answer_generation/saved_weights \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task1590_diplomacy_text_generation \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/10-task1590_diplomacy_text_generation \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
    --previous_lora_path logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/1-task1572_samsum_summary/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/2-task363_sst2_polarity_classification/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/3-task1290_xsum_summarization/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/4-task181_outcome_extraction/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/5-task002_quoref_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/6-task1510_evalution_relation_extraction/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/7-task639_multi_woz_user_utterance_generation/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/8-task1729_personachat_generate_next/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/9-task073_commonsenseqa_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/10-task1590_diplomacy_text_generation/saved_weights \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task748_glucose_reverse_cause_event_detection \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/11-task748_glucose_reverse_cause_event_detection \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
    --previous_lora_path logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/1-task1572_samsum_summary/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/2-task363_sst2_polarity_classification/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/3-task1290_xsum_summarization/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/4-task181_outcome_extraction/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/5-task002_quoref_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/6-task1510_evalution_relation_extraction/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/7-task639_multi_woz_user_utterance_generation/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/8-task1729_personachat_generate_next/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/9-task073_commonsenseqa_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/10-task1590_diplomacy_text_generation/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/11-task748_glucose_reverse_cause_event_detection/saved_weights \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task511_reddit_tifu_long_text_summarization \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/12-task511_reddit_tifu_long_text_summarization \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
    --previous_lora_path logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/1-task1572_samsum_summary/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/2-task363_sst2_polarity_classification/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/3-task1290_xsum_summarization/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/4-task181_outcome_extraction/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/5-task002_quoref_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/6-task1510_evalution_relation_extraction/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/7-task639_multi_woz_user_utterance_generation/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/8-task1729_personachat_generate_next/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/9-task073_commonsenseqa_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/10-task1590_diplomacy_text_generation/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/11-task748_glucose_reverse_cause_event_detection/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/12-task511_reddit_tifu_long_text_summarization/saved_weights \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task591_sciq_answer_generation \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/13-task591_sciq_answer_generation \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
    --previous_lora_path logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/1-task1572_samsum_summary/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/2-task363_sst2_polarity_classification/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/3-task1290_xsum_summarization/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/4-task181_outcome_extraction/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/5-task002_quoref_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/6-task1510_evalution_relation_extraction/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/7-task639_multi_woz_user_utterance_generation/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/8-task1729_personachat_generate_next/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/9-task073_commonsenseqa_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/10-task1590_diplomacy_text_generation/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/11-task748_glucose_reverse_cause_event_detection/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/12-task511_reddit_tifu_long_text_summarization/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/13-task591_sciq_answer_generation/saved_weights \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task1687_sentiment140_classification \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/14-task1687_sentiment140_classification \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
    --previous_lora_path logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/1-task1572_samsum_summary/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/2-task363_sst2_polarity_classification/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/3-task1290_xsum_summarization/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/4-task181_outcome_extraction/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/5-task002_quoref_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/6-task1510_evalution_relation_extraction/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/7-task639_multi_woz_user_utterance_generation/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/8-task1729_personachat_generate_next/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/9-task073_commonsenseqa_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/10-task1590_diplomacy_text_generation/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/11-task748_glucose_reverse_cause_event_detection/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/12-task511_reddit_tifu_long_text_summarization/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/13-task591_sciq_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/14-task1687_sentiment140_classification/saved_weights \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task875_emotion_classification \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_specroute/outputs/15-task875_emotion_classification \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \

improve_gainlora/T5_small/gen_script_superni_order2_t5_small_gainlora_inflora.sh CHANGED Viewed

@@ -18,7 +18,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --model_name_or_path $2 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task748_glucose_reverse_cause_event_detection \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_gainlora_inflora/outputs/1-task748_glucose_reverse_cause_event_detection \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -66,7 +66,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task073_commonsenseqa_answer_generation \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_gainlora_inflora/outputs/2-task073_commonsenseqa_answer_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -115,7 +115,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task1590_diplomacy_text_generation \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_gainlora_inflora/outputs/3-task1590_diplomacy_text_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -164,7 +164,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task639_multi_woz_user_utterance_generation \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_gainlora_inflora/outputs/4-task639_multi_woz_user_utterance_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -213,7 +213,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task1572_samsum_summary \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_gainlora_inflora/outputs/5-task1572_samsum_summary \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -262,7 +262,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task1687_sentiment140_classification \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_gainlora_inflora/outputs/6-task1687_sentiment140_classification \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -311,7 +311,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task591_sciq_answer_generation \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_gainlora_inflora/outputs/7-task591_sciq_answer_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -360,7 +360,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task363_sst2_polarity_classification \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_gainlora_inflora/outputs/8-task363_sst2_polarity_classification \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -409,7 +409,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task1510_evalution_relation_extraction \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_gainlora_inflora/outputs/9-task1510_evalution_relation_extraction \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -458,7 +458,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task1729_personachat_generate_next \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_gainlora_inflora/outputs/10-task1729_personachat_generate_next \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -507,7 +507,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task181_outcome_extraction \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_gainlora_inflora/outputs/11-task181_outcome_extraction \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -556,7 +556,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task511_reddit_tifu_long_text_summarization \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_gainlora_inflora/outputs/12-task511_reddit_tifu_long_text_summarization \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -605,7 +605,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task002_quoref_answer_generation \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_gainlora_inflora/outputs/13-task002_quoref_answer_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -654,7 +654,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task1290_xsum_summarization \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_gainlora_inflora/outputs/14-task1290_xsum_summarization \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -703,7 +703,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task875_emotion_classification \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_gainlora_inflora/outputs/15-task875_emotion_classification \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -740,4 +740,4 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --kl_ratio 0.5 \
    --attn_temperature 1
-python score.py gen_script_superni_order2_t5_small_gainlora_inflora gen_script_superni_order2_t5_small_gainlora_inflora

    --model_name_or_path $2 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task748_glucose_reverse_cause_event_detection \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_gainlora_inflora/outputs/1-task748_glucose_reverse_cause_event_detection \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task073_commonsenseqa_answer_generation \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_gainlora_inflora/outputs/2-task073_commonsenseqa_answer_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task1590_diplomacy_text_generation \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_gainlora_inflora/outputs/3-task1590_diplomacy_text_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task639_multi_woz_user_utterance_generation \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_gainlora_inflora/outputs/4-task639_multi_woz_user_utterance_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task1572_samsum_summary \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_gainlora_inflora/outputs/5-task1572_samsum_summary \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task1687_sentiment140_classification \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_gainlora_inflora/outputs/6-task1687_sentiment140_classification \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task591_sciq_answer_generation \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_gainlora_inflora/outputs/7-task591_sciq_answer_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task363_sst2_polarity_classification \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_gainlora_inflora/outputs/8-task363_sst2_polarity_classification \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task1510_evalution_relation_extraction \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_gainlora_inflora/outputs/9-task1510_evalution_relation_extraction \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task1729_personachat_generate_next \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_gainlora_inflora/outputs/10-task1729_personachat_generate_next \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task181_outcome_extraction \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_gainlora_inflora/outputs/11-task181_outcome_extraction \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task511_reddit_tifu_long_text_summarization \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_gainlora_inflora/outputs/12-task511_reddit_tifu_long_text_summarization \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task002_quoref_answer_generation \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_gainlora_inflora/outputs/13-task002_quoref_answer_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task1290_xsum_summarization \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_gainlora_inflora/outputs/14-task1290_xsum_summarization \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task875_emotion_classification \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_gainlora_inflora/outputs/15-task875_emotion_classification \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --kl_ratio 0.5 \
    --attn_temperature 1
+python score.py gen_script_superni_order2_t5_gainlora_inflora gen_script_superni_order2_t5_gainlora_inflora

improve_gainlora/T5_small/gen_script_superni_order2_t5_small_inflora.sh CHANGED Viewed

@@ -18,7 +18,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --model_name_or_path $2 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task748_glucose_reverse_cause_event_detection \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_inflora/outputs/1-task748_glucose_reverse_cause_event_detection \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -64,7 +64,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task073_commonsenseqa_answer_generation \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_inflora/outputs/2-task073_commonsenseqa_answer_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -111,7 +111,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task1590_diplomacy_text_generation \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_inflora/outputs/3-task1590_diplomacy_text_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -158,7 +158,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task639_multi_woz_user_utterance_generation \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_inflora/outputs/4-task639_multi_woz_user_utterance_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -205,7 +205,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task1572_samsum_summary \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_inflora/outputs/5-task1572_samsum_summary \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -252,7 +252,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task1687_sentiment140_classification \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_inflora/outputs/6-task1687_sentiment140_classification \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -299,7 +299,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task591_sciq_answer_generation \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_inflora/outputs/7-task591_sciq_answer_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -346,7 +346,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task363_sst2_polarity_classification \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_inflora/outputs/8-task363_sst2_polarity_classification \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -393,7 +393,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task1510_evalution_relation_extraction \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_inflora/outputs/9-task1510_evalution_relation_extraction \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -440,7 +440,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task1729_personachat_generate_next \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_inflora/outputs/10-task1729_personachat_generate_next \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -487,7 +487,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task181_outcome_extraction \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_inflora/outputs/11-task181_outcome_extraction \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -534,7 +534,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task511_reddit_tifu_long_text_summarization \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_inflora/outputs/12-task511_reddit_tifu_long_text_summarization \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -581,7 +581,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task002_quoref_answer_generation \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_inflora/outputs/13-task002_quoref_answer_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -628,7 +628,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task1290_xsum_summarization \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_inflora/outputs/14-task1290_xsum_summarization \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -675,7 +675,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task875_emotion_classification \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_inflora/outputs/15-task875_emotion_classification \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -710,4 +710,4 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --kl_ratio 0.5 \
    --attn_temperature 1
-python score.py gen_script_superni_order2_t5_small_inflora gen_script_superni_order2_t5_small_inflora

    --model_name_or_path $2 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task748_glucose_reverse_cause_event_detection \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_inflora/outputs/1-task748_glucose_reverse_cause_event_detection \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task073_commonsenseqa_answer_generation \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_inflora/outputs/2-task073_commonsenseqa_answer_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task1590_diplomacy_text_generation \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_inflora/outputs/3-task1590_diplomacy_text_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task639_multi_woz_user_utterance_generation \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_inflora/outputs/4-task639_multi_woz_user_utterance_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task1572_samsum_summary \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_inflora/outputs/5-task1572_samsum_summary \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task1687_sentiment140_classification \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_inflora/outputs/6-task1687_sentiment140_classification \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task591_sciq_answer_generation \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_inflora/outputs/7-task591_sciq_answer_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task363_sst2_polarity_classification \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_inflora/outputs/8-task363_sst2_polarity_classification \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task1510_evalution_relation_extraction \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_inflora/outputs/9-task1510_evalution_relation_extraction \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task1729_personachat_generate_next \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_inflora/outputs/10-task1729_personachat_generate_next \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task181_outcome_extraction \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_inflora/outputs/11-task181_outcome_extraction \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task511_reddit_tifu_long_text_summarization \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_inflora/outputs/12-task511_reddit_tifu_long_text_summarization \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task002_quoref_answer_generation \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_inflora/outputs/13-task002_quoref_answer_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task1290_xsum_summarization \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_inflora/outputs/14-task1290_xsum_summarization \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task875_emotion_classification \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_inflora/outputs/15-task875_emotion_classification \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --kl_ratio 0.5 \
    --attn_temperature 1
+python score.py gen_script_superni_order2_t5_inflora gen_script_superni_order2_t5_inflora

improve_gainlora/T5_small/gen_script_superni_order2_t5_small_specroute.sh CHANGED Viewed

@@ -68,7 +68,7 @@ CUDA_VISIBLE_DEVICES=$GPU_IDS python src/run_t5.py \
    --model_name_or_path $2 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task875_emotion_classification,task002_quoref_answer_generation,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1572_samsum_summary,task511_reddit_tifu_long_text_summarization,task1290_xsum_summarization,task639_multi_woz_user_utterance_generation,task1510_evalution_relation_extraction,task181_outcome_extraction,task1729_personachat_generate_next,task1590_diplomacy_text_generation \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task748_glucose_reverse_cause_event_detection \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/1-task748_glucose_reverse_cause_event_detection \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
@@ -119,7 +119,7 @@ CUDA_VISIBLE_DEVICES=$GPU_IDS python src/run_t5.py \
    --previous_lora_path logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/1-task748_glucose_reverse_cause_event_detection/saved_weights \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task875_emotion_classification,task002_quoref_answer_generation,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1572_samsum_summary,task511_reddit_tifu_long_text_summarization,task1290_xsum_summarization,task639_multi_woz_user_utterance_generation,task1510_evalution_relation_extraction,task181_outcome_extraction,task1729_personachat_generate_next,task1590_diplomacy_text_generation \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task073_commonsenseqa_answer_generation \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/2-task073_commonsenseqa_answer_generation \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
@@ -169,7 +169,7 @@ CUDA_VISIBLE_DEVICES=$GPU_IDS python src/run_t5.py \
    --previous_lora_path logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/1-task748_glucose_reverse_cause_event_detection/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/2-task073_commonsenseqa_answer_generation/saved_weights \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task875_emotion_classification,task002_quoref_answer_generation,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1572_samsum_summary,task511_reddit_tifu_long_text_summarization,task1290_xsum_summarization,task639_multi_woz_user_utterance_generation,task1510_evalution_relation_extraction,task181_outcome_extraction,task1729_personachat_generate_next,task1590_diplomacy_text_generation \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task875_emotion_classification \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/3-task875_emotion_classification \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
@@ -219,7 +219,7 @@ CUDA_VISIBLE_DEVICES=$GPU_IDS python src/run_t5.py \
    --previous_lora_path logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/1-task748_glucose_reverse_cause_event_detection/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/2-task073_commonsenseqa_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/3-task875_emotion_classification/saved_weights \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task875_emotion_classification,task002_quoref_answer_generation,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1572_samsum_summary,task511_reddit_tifu_long_text_summarization,task1290_xsum_summarization,task639_multi_woz_user_utterance_generation,task1510_evalution_relation_extraction,task181_outcome_extraction,task1729_personachat_generate_next,task1590_diplomacy_text_generation \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task002_quoref_answer_generation \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/4-task002_quoref_answer_generation \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
@@ -269,7 +269,7 @@ CUDA_VISIBLE_DEVICES=$GPU_IDS python src/run_t5.py \
    --previous_lora_path logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/1-task748_glucose_reverse_cause_event_detection/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/2-task073_commonsenseqa_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/3-task875_emotion_classification/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/4-task002_quoref_answer_generation/saved_weights \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task875_emotion_classification,task002_quoref_answer_generation,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1572_samsum_summary,task511_reddit_tifu_long_text_summarization,task1290_xsum_summarization,task639_multi_woz_user_utterance_generation,task1510_evalution_relation_extraction,task181_outcome_extraction,task1729_personachat_generate_next,task1590_diplomacy_text_generation \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task1687_sentiment140_classification \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/5-task1687_sentiment140_classification \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
@@ -319,7 +319,7 @@ CUDA_VISIBLE_DEVICES=$GPU_IDS python src/run_t5.py \
    --previous_lora_path logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/1-task748_glucose_reverse_cause_event_detection/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/2-task073_commonsenseqa_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/3-task875_emotion_classification/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/4-task002_quoref_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/5-task1687_sentiment140_classification/saved_weights \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task875_emotion_classification,task002_quoref_answer_generation,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1572_samsum_summary,task511_reddit_tifu_long_text_summarization,task1290_xsum_summarization,task639_multi_woz_user_utterance_generation,task1510_evalution_relation_extraction,task181_outcome_extraction,task1729_personachat_generate_next,task1590_diplomacy_text_generation \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task591_sciq_answer_generation \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/6-task591_sciq_answer_generation \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
@@ -369,7 +369,7 @@ CUDA_VISIBLE_DEVICES=$GPU_IDS python src/run_t5.py \
    --previous_lora_path logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/1-task748_glucose_reverse_cause_event_detection/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/2-task073_commonsenseqa_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/3-task875_emotion_classification/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/4-task002_quoref_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/5-task1687_sentiment140_classification/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/6-task591_sciq_answer_generation/saved_weights \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task875_emotion_classification,task002_quoref_answer_generation,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1572_samsum_summary,task511_reddit_tifu_long_text_summarization,task1290_xsum_summarization,task639_multi_woz_user_utterance_generation,task1510_evalution_relation_extraction,task181_outcome_extraction,task1729_personachat_generate_next,task1590_diplomacy_text_generation \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task363_sst2_polarity_classification \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/7-task363_sst2_polarity_classification \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
@@ -419,7 +419,7 @@ CUDA_VISIBLE_DEVICES=$GPU_IDS python src/run_t5.py \
    --previous_lora_path logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/1-task748_glucose_reverse_cause_event_detection/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/2-task073_commonsenseqa_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/3-task875_emotion_classification/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/4-task002_quoref_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/5-task1687_sentiment140_classification/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/6-task591_sciq_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/7-task363_sst2_polarity_classification/saved_weights \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task875_emotion_classification,task002_quoref_answer_generation,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1572_samsum_summary,task511_reddit_tifu_long_text_summarization,task1290_xsum_summarization,task639_multi_woz_user_utterance_generation,task1510_evalution_relation_extraction,task181_outcome_extraction,task1729_personachat_generate_next,task1590_diplomacy_text_generation \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task1572_samsum_summary \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/8-task1572_samsum_summary \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
@@ -469,7 +469,7 @@ CUDA_VISIBLE_DEVICES=$GPU_IDS python src/run_t5.py \
    --previous_lora_path logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/1-task748_glucose_reverse_cause_event_detection/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/2-task073_commonsenseqa_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/3-task875_emotion_classification/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/4-task002_quoref_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/5-task1687_sentiment140_classification/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/6-task591_sciq_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/7-task363_sst2_polarity_classification/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/8-task1572_samsum_summary/saved_weights \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task875_emotion_classification,task002_quoref_answer_generation,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1572_samsum_summary,task511_reddit_tifu_long_text_summarization,task1290_xsum_summarization,task639_multi_woz_user_utterance_generation,task1510_evalution_relation_extraction,task181_outcome_extraction,task1729_personachat_generate_next,task1590_diplomacy_text_generation \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task511_reddit_tifu_long_text_summarization \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/9-task511_reddit_tifu_long_text_summarization \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
@@ -519,7 +519,7 @@ CUDA_VISIBLE_DEVICES=$GPU_IDS python src/run_t5.py \
    --previous_lora_path logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/1-task748_glucose_reverse_cause_event_detection/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/2-task073_commonsenseqa_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/3-task875_emotion_classification/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/4-task002_quoref_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/5-task1687_sentiment140_classification/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/6-task591_sciq_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/7-task363_sst2_polarity_classification/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/8-task1572_samsum_summary/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/9-task511_reddit_tifu_long_text_summarization/saved_weights \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task875_emotion_classification,task002_quoref_answer_generation,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1572_samsum_summary,task511_reddit_tifu_long_text_summarization,task1290_xsum_summarization,task639_multi_woz_user_utterance_generation,task1510_evalution_relation_extraction,task181_outcome_extraction,task1729_personachat_generate_next,task1590_diplomacy_text_generation \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task1290_xsum_summarization \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/10-task1290_xsum_summarization \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
@@ -569,7 +569,7 @@ CUDA_VISIBLE_DEVICES=$GPU_IDS python src/run_t5.py \
    --previous_lora_path logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/1-task748_glucose_reverse_cause_event_detection/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/2-task073_commonsenseqa_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/3-task875_emotion_classification/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/4-task002_quoref_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/5-task1687_sentiment140_classification/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/6-task591_sciq_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/7-task363_sst2_polarity_classification/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/8-task1572_samsum_summary/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/9-task511_reddit_tifu_long_text_summarization/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/10-task1290_xsum_summarization/saved_weights \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task875_emotion_classification,task002_quoref_answer_generation,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1572_samsum_summary,task511_reddit_tifu_long_text_summarization,task1290_xsum_summarization,task639_multi_woz_user_utterance_generation,task1510_evalution_relation_extraction,task181_outcome_extraction,task1729_personachat_generate_next,task1590_diplomacy_text_generation \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task639_multi_woz_user_utterance_generation \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/11-task639_multi_woz_user_utterance_generation \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
@@ -619,7 +619,7 @@ CUDA_VISIBLE_DEVICES=$GPU_IDS python src/run_t5.py \
    --previous_lora_path logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/1-task748_glucose_reverse_cause_event_detection/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/2-task073_commonsenseqa_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/3-task875_emotion_classification/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/4-task002_quoref_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/5-task1687_sentiment140_classification/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/6-task591_sciq_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/7-task363_sst2_polarity_classification/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/8-task1572_samsum_summary/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/9-task511_reddit_tifu_long_text_summarization/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/10-task1290_xsum_summarization/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/11-task639_multi_woz_user_utterance_generation/saved_weights \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task875_emotion_classification,task002_quoref_answer_generation,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1572_samsum_summary,task511_reddit_tifu_long_text_summarization,task1290_xsum_summarization,task639_multi_woz_user_utterance_generation,task1510_evalution_relation_extraction,task181_outcome_extraction,task1729_personachat_generate_next,task1590_diplomacy_text_generation \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task1510_evalution_relation_extraction \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/12-task1510_evalution_relation_extraction \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
@@ -669,7 +669,7 @@ CUDA_VISIBLE_DEVICES=$GPU_IDS python src/run_t5.py \
    --previous_lora_path logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/1-task748_glucose_reverse_cause_event_detection/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/2-task073_commonsenseqa_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/3-task875_emotion_classification/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/4-task002_quoref_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/5-task1687_sentiment140_classification/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/6-task591_sciq_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/7-task363_sst2_polarity_classification/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/8-task1572_samsum_summary/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/9-task511_reddit_tifu_long_text_summarization/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/10-task1290_xsum_summarization/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/11-task639_multi_woz_user_utterance_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/12-task1510_evalution_relation_extraction/saved_weights \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task875_emotion_classification,task002_quoref_answer_generation,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1572_samsum_summary,task511_reddit_tifu_long_text_summarization,task1290_xsum_summarization,task639_multi_woz_user_utterance_generation,task1510_evalution_relation_extraction,task181_outcome_extraction,task1729_personachat_generate_next,task1590_diplomacy_text_generation \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task181_outcome_extraction \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/13-task181_outcome_extraction \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
@@ -719,7 +719,7 @@ CUDA_VISIBLE_DEVICES=$GPU_IDS python src/run_t5.py \
    --previous_lora_path logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/1-task748_glucose_reverse_cause_event_detection/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/2-task073_commonsenseqa_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/3-task875_emotion_classification/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/4-task002_quoref_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/5-task1687_sentiment140_classification/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/6-task591_sciq_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/7-task363_sst2_polarity_classification/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/8-task1572_samsum_summary/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/9-task511_reddit_tifu_long_text_summarization/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/10-task1290_xsum_summarization/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/11-task639_multi_woz_user_utterance_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/12-task1510_evalution_relation_extraction/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/13-task181_outcome_extraction/saved_weights \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task875_emotion_classification,task002_quoref_answer_generation,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1572_samsum_summary,task511_reddit_tifu_long_text_summarization,task1290_xsum_summarization,task639_multi_woz_user_utterance_generation,task1510_evalution_relation_extraction,task181_outcome_extraction,task1729_personachat_generate_next,task1590_diplomacy_text_generation \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task1729_personachat_generate_next \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/14-task1729_personachat_generate_next \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
@@ -769,7 +769,7 @@ CUDA_VISIBLE_DEVICES=$GPU_IDS python src/run_t5.py \
    --previous_lora_path logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/1-task748_glucose_reverse_cause_event_detection/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/2-task073_commonsenseqa_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/3-task875_emotion_classification/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/4-task002_quoref_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/5-task1687_sentiment140_classification/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/6-task591_sciq_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/7-task363_sst2_polarity_classification/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/8-task1572_samsum_summary/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/9-task511_reddit_tifu_long_text_summarization/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/10-task1290_xsum_summarization/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/11-task639_multi_woz_user_utterance_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/12-task1510_evalution_relation_extraction/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/13-task181_outcome_extraction/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/14-task1729_personachat_generate_next/saved_weights \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task875_emotion_classification,task002_quoref_answer_generation,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1572_samsum_summary,task511_reddit_tifu_long_text_summarization,task1290_xsum_summarization,task639_multi_woz_user_utterance_generation,task1510_evalution_relation_extraction,task181_outcome_extraction,task1729_personachat_generate_next,task1590_diplomacy_text_generation \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task1590_diplomacy_text_generation \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/15-task1590_diplomacy_text_generation \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \

    --model_name_or_path $2 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task875_emotion_classification,task002_quoref_answer_generation,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1572_samsum_summary,task511_reddit_tifu_long_text_summarization,task1290_xsum_summarization,task639_multi_woz_user_utterance_generation,task1510_evalution_relation_extraction,task181_outcome_extraction,task1729_personachat_generate_next,task1590_diplomacy_text_generation \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task748_glucose_reverse_cause_event_detection \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/1-task748_glucose_reverse_cause_event_detection \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
    --previous_lora_path logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/1-task748_glucose_reverse_cause_event_detection/saved_weights \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task875_emotion_classification,task002_quoref_answer_generation,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1572_samsum_summary,task511_reddit_tifu_long_text_summarization,task1290_xsum_summarization,task639_multi_woz_user_utterance_generation,task1510_evalution_relation_extraction,task181_outcome_extraction,task1729_personachat_generate_next,task1590_diplomacy_text_generation \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task073_commonsenseqa_answer_generation \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/2-task073_commonsenseqa_answer_generation \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
    --previous_lora_path logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/1-task748_glucose_reverse_cause_event_detection/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/2-task073_commonsenseqa_answer_generation/saved_weights \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task875_emotion_classification,task002_quoref_answer_generation,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1572_samsum_summary,task511_reddit_tifu_long_text_summarization,task1290_xsum_summarization,task639_multi_woz_user_utterance_generation,task1510_evalution_relation_extraction,task181_outcome_extraction,task1729_personachat_generate_next,task1590_diplomacy_text_generation \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task875_emotion_classification \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/3-task875_emotion_classification \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
    --previous_lora_path logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/1-task748_glucose_reverse_cause_event_detection/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/2-task073_commonsenseqa_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/3-task875_emotion_classification/saved_weights \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task875_emotion_classification,task002_quoref_answer_generation,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1572_samsum_summary,task511_reddit_tifu_long_text_summarization,task1290_xsum_summarization,task639_multi_woz_user_utterance_generation,task1510_evalution_relation_extraction,task181_outcome_extraction,task1729_personachat_generate_next,task1590_diplomacy_text_generation \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task002_quoref_answer_generation \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/4-task002_quoref_answer_generation \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
    --previous_lora_path logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/1-task748_glucose_reverse_cause_event_detection/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/2-task073_commonsenseqa_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/3-task875_emotion_classification/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/4-task002_quoref_answer_generation/saved_weights \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task875_emotion_classification,task002_quoref_answer_generation,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1572_samsum_summary,task511_reddit_tifu_long_text_summarization,task1290_xsum_summarization,task639_multi_woz_user_utterance_generation,task1510_evalution_relation_extraction,task181_outcome_extraction,task1729_personachat_generate_next,task1590_diplomacy_text_generation \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task1687_sentiment140_classification \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/5-task1687_sentiment140_classification \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
    --previous_lora_path logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/1-task748_glucose_reverse_cause_event_detection/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/2-task073_commonsenseqa_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/3-task875_emotion_classification/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/4-task002_quoref_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/5-task1687_sentiment140_classification/saved_weights \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task875_emotion_classification,task002_quoref_answer_generation,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1572_samsum_summary,task511_reddit_tifu_long_text_summarization,task1290_xsum_summarization,task639_multi_woz_user_utterance_generation,task1510_evalution_relation_extraction,task181_outcome_extraction,task1729_personachat_generate_next,task1590_diplomacy_text_generation \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task591_sciq_answer_generation \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/6-task591_sciq_answer_generation \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
    --previous_lora_path logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/1-task748_glucose_reverse_cause_event_detection/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/2-task073_commonsenseqa_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/3-task875_emotion_classification/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/4-task002_quoref_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/5-task1687_sentiment140_classification/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/6-task591_sciq_answer_generation/saved_weights \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task875_emotion_classification,task002_quoref_answer_generation,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1572_samsum_summary,task511_reddit_tifu_long_text_summarization,task1290_xsum_summarization,task639_multi_woz_user_utterance_generation,task1510_evalution_relation_extraction,task181_outcome_extraction,task1729_personachat_generate_next,task1590_diplomacy_text_generation \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task363_sst2_polarity_classification \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/7-task363_sst2_polarity_classification \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
    --previous_lora_path logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/1-task748_glucose_reverse_cause_event_detection/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/2-task073_commonsenseqa_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/3-task875_emotion_classification/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/4-task002_quoref_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/5-task1687_sentiment140_classification/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/6-task591_sciq_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/7-task363_sst2_polarity_classification/saved_weights \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task875_emotion_classification,task002_quoref_answer_generation,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1572_samsum_summary,task511_reddit_tifu_long_text_summarization,task1290_xsum_summarization,task639_multi_woz_user_utterance_generation,task1510_evalution_relation_extraction,task181_outcome_extraction,task1729_personachat_generate_next,task1590_diplomacy_text_generation \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task1572_samsum_summary \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/8-task1572_samsum_summary \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
    --previous_lora_path logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/1-task748_glucose_reverse_cause_event_detection/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/2-task073_commonsenseqa_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/3-task875_emotion_classification/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/4-task002_quoref_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/5-task1687_sentiment140_classification/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/6-task591_sciq_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/7-task363_sst2_polarity_classification/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/8-task1572_samsum_summary/saved_weights \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task875_emotion_classification,task002_quoref_answer_generation,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1572_samsum_summary,task511_reddit_tifu_long_text_summarization,task1290_xsum_summarization,task639_multi_woz_user_utterance_generation,task1510_evalution_relation_extraction,task181_outcome_extraction,task1729_personachat_generate_next,task1590_diplomacy_text_generation \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task511_reddit_tifu_long_text_summarization \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/9-task511_reddit_tifu_long_text_summarization \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
    --previous_lora_path logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/1-task748_glucose_reverse_cause_event_detection/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/2-task073_commonsenseqa_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/3-task875_emotion_classification/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/4-task002_quoref_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/5-task1687_sentiment140_classification/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/6-task591_sciq_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/7-task363_sst2_polarity_classification/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/8-task1572_samsum_summary/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/9-task511_reddit_tifu_long_text_summarization/saved_weights \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task875_emotion_classification,task002_quoref_answer_generation,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1572_samsum_summary,task511_reddit_tifu_long_text_summarization,task1290_xsum_summarization,task639_multi_woz_user_utterance_generation,task1510_evalution_relation_extraction,task181_outcome_extraction,task1729_personachat_generate_next,task1590_diplomacy_text_generation \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task1290_xsum_summarization \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/10-task1290_xsum_summarization \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
    --previous_lora_path logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/1-task748_glucose_reverse_cause_event_detection/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/2-task073_commonsenseqa_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/3-task875_emotion_classification/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/4-task002_quoref_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/5-task1687_sentiment140_classification/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/6-task591_sciq_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/7-task363_sst2_polarity_classification/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/8-task1572_samsum_summary/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/9-task511_reddit_tifu_long_text_summarization/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/10-task1290_xsum_summarization/saved_weights \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task875_emotion_classification,task002_quoref_answer_generation,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1572_samsum_summary,task511_reddit_tifu_long_text_summarization,task1290_xsum_summarization,task639_multi_woz_user_utterance_generation,task1510_evalution_relation_extraction,task181_outcome_extraction,task1729_personachat_generate_next,task1590_diplomacy_text_generation \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task639_multi_woz_user_utterance_generation \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/11-task639_multi_woz_user_utterance_generation \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
    --previous_lora_path logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/1-task748_glucose_reverse_cause_event_detection/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/2-task073_commonsenseqa_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/3-task875_emotion_classification/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/4-task002_quoref_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/5-task1687_sentiment140_classification/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/6-task591_sciq_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/7-task363_sst2_polarity_classification/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/8-task1572_samsum_summary/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/9-task511_reddit_tifu_long_text_summarization/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/10-task1290_xsum_summarization/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/11-task639_multi_woz_user_utterance_generation/saved_weights \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task875_emotion_classification,task002_quoref_answer_generation,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1572_samsum_summary,task511_reddit_tifu_long_text_summarization,task1290_xsum_summarization,task639_multi_woz_user_utterance_generation,task1510_evalution_relation_extraction,task181_outcome_extraction,task1729_personachat_generate_next,task1590_diplomacy_text_generation \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task1510_evalution_relation_extraction \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/12-task1510_evalution_relation_extraction \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
    --previous_lora_path logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/1-task748_glucose_reverse_cause_event_detection/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/2-task073_commonsenseqa_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/3-task875_emotion_classification/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/4-task002_quoref_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/5-task1687_sentiment140_classification/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/6-task591_sciq_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/7-task363_sst2_polarity_classification/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/8-task1572_samsum_summary/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/9-task511_reddit_tifu_long_text_summarization/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/10-task1290_xsum_summarization/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/11-task639_multi_woz_user_utterance_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/12-task1510_evalution_relation_extraction/saved_weights \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task875_emotion_classification,task002_quoref_answer_generation,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1572_samsum_summary,task511_reddit_tifu_long_text_summarization,task1290_xsum_summarization,task639_multi_woz_user_utterance_generation,task1510_evalution_relation_extraction,task181_outcome_extraction,task1729_personachat_generate_next,task1590_diplomacy_text_generation \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task181_outcome_extraction \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/13-task181_outcome_extraction \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
    --previous_lora_path logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/1-task748_glucose_reverse_cause_event_detection/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/2-task073_commonsenseqa_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/3-task875_emotion_classification/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/4-task002_quoref_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/5-task1687_sentiment140_classification/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/6-task591_sciq_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/7-task363_sst2_polarity_classification/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/8-task1572_samsum_summary/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/9-task511_reddit_tifu_long_text_summarization/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/10-task1290_xsum_summarization/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/11-task639_multi_woz_user_utterance_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/12-task1510_evalution_relation_extraction/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/13-task181_outcome_extraction/saved_weights \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task875_emotion_classification,task002_quoref_answer_generation,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1572_samsum_summary,task511_reddit_tifu_long_text_summarization,task1290_xsum_summarization,task639_multi_woz_user_utterance_generation,task1510_evalution_relation_extraction,task181_outcome_extraction,task1729_personachat_generate_next,task1590_diplomacy_text_generation \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task1729_personachat_generate_next \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/14-task1729_personachat_generate_next \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \
    --previous_lora_path logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/1-task748_glucose_reverse_cause_event_detection/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/2-task073_commonsenseqa_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/3-task875_emotion_classification/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/4-task002_quoref_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/5-task1687_sentiment140_classification/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/6-task591_sciq_answer_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/7-task363_sst2_polarity_classification/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/8-task1572_samsum_summary/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/9-task511_reddit_tifu_long_text_summarization/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/10-task1290_xsum_summarization/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/11-task639_multi_woz_user_utterance_generation/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/12-task1510_evalution_relation_extraction/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/13-task181_outcome_extraction/saved_weights,logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/14-task1729_personachat_generate_next/saved_weights \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task875_emotion_classification,task002_quoref_answer_generation,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1572_samsum_summary,task511_reddit_tifu_long_text_summarization,task1290_xsum_summarization,task639_multi_woz_user_utterance_generation,task1510_evalution_relation_extraction,task181_outcome_extraction,task1729_personachat_generate_next,task1590_diplomacy_text_generation \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task1590_diplomacy_text_generation \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_specroute/outputs/15-task1590_diplomacy_text_generation \
    --per_device_train_batch_size $BSZ \
    --per_device_eval_batch_size $EVAL_BSZ \

root_gainlora/T5_small/gen_script_long_order3_t5_small_gainlora_inflora.sh CHANGED Viewed

@@ -17,7 +17,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --model_name_or_path $2 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/yelp \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_gainlora_inflora/outputs/1-yelp \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -67,7 +67,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/amazon \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_gainlora_inflora/outputs/2-amazon \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -117,7 +117,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/mnli \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_gainlora_inflora/outputs/3-mnli \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -167,7 +167,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/cb \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_gainlora_inflora/outputs/4-cb \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -217,7 +217,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/copa \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_gainlora_inflora/outputs/5-copa \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -267,7 +267,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/qqp \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_gainlora_inflora/outputs/6-qqp \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -317,7 +317,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/rte \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_gainlora_inflora/outputs/7-rte \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -367,7 +367,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/imdb \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_gainlora_inflora/outputs/8-imdb \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -417,7 +417,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/sst2 \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_gainlora_inflora/outputs/9-sst2 \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -467,7 +467,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/dbpedia \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_gainlora_inflora/outputs/10-dbpedia \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -517,7 +517,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/agnews \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_gainlora_inflora/outputs/11-agnews \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -567,7 +567,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/yahoo \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_gainlora_inflora/outputs/12-yahoo \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -617,7 +617,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/multirc \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_gainlora_inflora/outputs/13-multirc \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -667,7 +667,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/boolq \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_gainlora_inflora/outputs/14-boolq \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -718,7 +718,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/wic \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_gainlora_inflora/outputs/15-wic \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -757,7 +757,7 @@ rm -rf logs_and_outputs/gen_script_long_order3_t5_small_gainlora_inflora/outputs
 sleep 5
-CUDA_VISIBLE_DEVICES=$1 python score.py gen_script_long_order3_t5_small_gainlora_inflora gen_script_long_order3_t5_small_gainlora_inflora

    --model_name_or_path $2 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/yelp \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_gainlora_inflora/outputs/1-yelp \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/amazon \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_gainlora_inflora/outputs/2-amazon \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/mnli \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_gainlora_inflora/outputs/3-mnli \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/cb \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_gainlora_inflora/outputs/4-cb \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/copa \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_gainlora_inflora/outputs/5-copa \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/qqp \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_gainlora_inflora/outputs/6-qqp \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/rte \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_gainlora_inflora/outputs/7-rte \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/imdb \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_gainlora_inflora/outputs/8-imdb \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/sst2 \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_gainlora_inflora/outputs/9-sst2 \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/dbpedia \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_gainlora_inflora/outputs/10-dbpedia \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/agnews \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_gainlora_inflora/outputs/11-agnews \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/yahoo \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_gainlora_inflora/outputs/12-yahoo \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/multirc \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_gainlora_inflora/outputs/13-multirc \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/boolq \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_gainlora_inflora/outputs/14-boolq \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/wic \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_gainlora_inflora/outputs/15-wic \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
 sleep 5
+CUDA_VISIBLE_DEVICES=$1 python score.py gen_script_long_order3_t5_gainlora_inflora gen_script_long_order3_t5_gainlora_inflora

root_gainlora/T5_small/gen_script_long_order3_t5_small_inflora.sh CHANGED Viewed

@@ -18,7 +18,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --model_name_or_path $2 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/yelp \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_inflora/outputs/1-yelp \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -67,7 +67,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/amazon \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_inflora/outputs/2-amazon \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -116,7 +116,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/mnli \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_inflora/outputs/3-mnli \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -165,7 +165,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/cb \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_inflora/outputs/4-cb \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -214,7 +214,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/copa \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_inflora/outputs/5-copa \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -263,7 +263,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/qqp \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_inflora/outputs/6-qqp \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -312,7 +312,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/rte \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_inflora/outputs/7-rte \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -361,7 +361,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/imdb \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_inflora/outputs/8-imdb \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -410,7 +410,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/sst2 \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_inflora/outputs/9-sst2 \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -459,7 +459,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/dbpedia \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_inflora/outputs/10-dbpedia \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -508,7 +508,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/agnews \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_inflora/outputs/11-agnews \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -557,7 +557,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/yahoo \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_inflora/outputs/12-yahoo \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -606,7 +606,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/multirc \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_inflora/outputs/13-multirc \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -655,7 +655,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/boolq \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_inflora/outputs/14-boolq \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -704,7 +704,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order3_t5_small_configs/wic \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_inflora/outputs/15-wic \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -741,4 +741,4 @@ rm -rf logs_and_outputs/gen_script_long_order3_t5_small_inflora/outputs/15-wic/c
 sleep 5
-CUDA_VISIBLE_DEVICES=$1 python score.py gen_script_long_order3_t5_small_inflora gen_script_long_order3_t5_small_inflora

    --model_name_or_path $2 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/yelp \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_inflora/outputs/1-yelp \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/amazon \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_inflora/outputs/2-amazon \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/mnli \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_inflora/outputs/3-mnli \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/cb \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_inflora/outputs/4-cb \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/copa \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_inflora/outputs/5-copa \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/qqp \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_inflora/outputs/6-qqp \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/rte \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_inflora/outputs/7-rte \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/imdb \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_inflora/outputs/8-imdb \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/sst2 \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_inflora/outputs/9-sst2 \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/dbpedia \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_inflora/outputs/10-dbpedia \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/agnews \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_inflora/outputs/11-agnews \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/yahoo \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_inflora/outputs/12-yahoo \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/multirc \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_inflora/outputs/13-multirc \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/boolq \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_inflora/outputs/14-boolq \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order yelp,amazon,mnli,cb,copa,qqp,rte,imdb,sst2,dbpedia,agnews,yahoo,multirc,boolq,wic \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order3_t5_configs/wic \
    --output_dir logs_and_outputs/gen_script_long_order3_t5_small_inflora/outputs/15-wic \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
 sleep 5
+CUDA_VISIBLE_DEVICES=$1 python score.py gen_script_long_order3_t5_inflora gen_script_long_order3_t5_inflora

root_gainlora/T5_small/gen_script_long_order4_t5_small_gainlora_inflora.sh CHANGED Viewed

@@ -18,7 +18,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --model_name_or_path $2 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/mnli \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_gainlora_inflora/outputs/1-mnli \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -69,7 +69,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/cb \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_gainlora_inflora/outputs/2-cb \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -120,7 +120,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/wic \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_gainlora_inflora/outputs/3-wic \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -171,7 +171,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/copa \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_gainlora_inflora/outputs/4-copa \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -222,7 +222,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/qqp \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_gainlora_inflora/outputs/5-qqp \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -273,7 +273,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/boolq \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_gainlora_inflora/outputs/6-boolq \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -324,7 +324,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/rte \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_gainlora_inflora/outputs/7-rte \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -375,7 +375,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/imdb \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_gainlora_inflora/outputs/8-imdb \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -426,7 +426,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/yelp \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_gainlora_inflora/outputs/9-yelp \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -477,7 +477,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/amazon \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_gainlora_inflora/outputs/10-amazon \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -528,7 +528,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/sst2 \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_gainlora_inflora/outputs/11-sst2 \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -579,7 +579,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/dbpedia \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_gainlora_inflora/outputs/12-dbpedia \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -630,7 +630,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/agnews \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_gainlora_inflora/outputs/13-agnews \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -681,7 +681,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/multirc \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_gainlora_inflora/outputs/14-multirc \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -732,7 +732,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/yahoo \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_gainlora_inflora/outputs/15-yahoo \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -771,4 +771,4 @@ rm -rf logs_and_outputs/gen_script_long_order4_t5_small_gainlora_inflora/outputs
 sleep 5
-CUDA_VISIBLE_DEVICES=$1 python score.py gen_script_long_order4_t5_small_gainlora_inflora gen_script_long_order4_t5_small_gainlora_inflora

    --model_name_or_path $2 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/mnli \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_gainlora_inflora/outputs/1-mnli \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/cb \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_gainlora_inflora/outputs/2-cb \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/wic \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_gainlora_inflora/outputs/3-wic \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/copa \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_gainlora_inflora/outputs/4-copa \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/qqp \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_gainlora_inflora/outputs/5-qqp \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/boolq \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_gainlora_inflora/outputs/6-boolq \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/rte \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_gainlora_inflora/outputs/7-rte \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/imdb \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_gainlora_inflora/outputs/8-imdb \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/yelp \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_gainlora_inflora/outputs/9-yelp \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/amazon \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_gainlora_inflora/outputs/10-amazon \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/sst2 \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_gainlora_inflora/outputs/11-sst2 \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/dbpedia \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_gainlora_inflora/outputs/12-dbpedia \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/agnews \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_gainlora_inflora/outputs/13-agnews \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/multirc \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_gainlora_inflora/outputs/14-multirc \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/yahoo \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_gainlora_inflora/outputs/15-yahoo \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
 sleep 5
+CUDA_VISIBLE_DEVICES=$1 python score.py gen_script_long_order4_t5_gainlora_inflora gen_script_long_order4_t5_gainlora_inflora

root_gainlora/T5_small/gen_script_long_order4_t5_small_inflora.sh CHANGED Viewed

@@ -18,7 +18,7 @@ CUDA_VISIBLE_DEVICES=1 python src/run_t5.py \
    --model_name_or_path $2 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/mnli \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_inflora/outputs/1-mnli \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -67,7 +67,7 @@ CUDA_VISIBLE_DEVICES=1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/cb \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_inflora/outputs/2-cb \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -116,7 +116,7 @@ CUDA_VISIBLE_DEVICES=1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/wic \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_inflora/outputs/3-wic \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -165,7 +165,7 @@ CUDA_VISIBLE_DEVICES=1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/copa \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_inflora/outputs/4-copa \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -214,7 +214,7 @@ CUDA_VISIBLE_DEVICES=1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/qqp \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_inflora/outputs/5-qqp \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -263,7 +263,7 @@ CUDA_VISIBLE_DEVICES=1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/boolq \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_inflora/outputs/6-boolq \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -312,7 +312,7 @@ CUDA_VISIBLE_DEVICES=1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/rte \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_inflora/outputs/7-rte \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -361,7 +361,7 @@ CUDA_VISIBLE_DEVICES=1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/imdb \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_inflora/outputs/8-imdb \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -410,7 +410,7 @@ CUDA_VISIBLE_DEVICES=1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/yelp \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_inflora/outputs/9-yelp \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -459,7 +459,7 @@ CUDA_VISIBLE_DEVICES=1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/amazon \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_inflora/outputs/10-amazon \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -508,7 +508,7 @@ CUDA_VISIBLE_DEVICES=1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/sst2 \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_inflora/outputs/11-sst2 \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -557,7 +557,7 @@ CUDA_VISIBLE_DEVICES=1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/dbpedia \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_inflora/outputs/12-dbpedia \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -606,7 +606,7 @@ CUDA_VISIBLE_DEVICES=1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/agnews \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_inflora/outputs/13-agnews \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -655,7 +655,7 @@ CUDA_VISIBLE_DEVICES=1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/multirc \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_inflora/outputs/14-multirc \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -704,7 +704,7 @@ CUDA_VISIBLE_DEVICES=1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
-   --task_config_dir configs/gen_script_long_order4_t5_small_configs/yahoo \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_inflora/outputs/15-yahoo \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
@@ -741,4 +741,4 @@ rm -rf logs_and_outputs/gen_script_long_order4_t5_small_inflora/outputs/15-yahoo
 sleep 5
-CUDA_VISIBLE_DEVICES=1 python score.py gen_script_long_order4_t5_small_inflora gen_script_long_order4_t5_small_inflora

    --model_name_or_path $2 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/mnli \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_inflora/outputs/1-mnli \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/cb \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_inflora/outputs/2-cb \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/wic \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_inflora/outputs/3-wic \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/copa \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_inflora/outputs/4-copa \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/qqp \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_inflora/outputs/5-qqp \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/boolq \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_inflora/outputs/6-boolq \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/rte \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_inflora/outputs/7-rte \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/imdb \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_inflora/outputs/8-imdb \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/yelp \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_inflora/outputs/9-yelp \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/amazon \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_inflora/outputs/10-amazon \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/sst2 \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_inflora/outputs/11-sst2 \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/dbpedia \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_inflora/outputs/12-dbpedia \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/agnews \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_inflora/outputs/13-agnews \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/multirc \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_inflora/outputs/14-multirc \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
    --data_dir CL_Benchmark \
    --task_order mnli,cb,wic,copa,qqp,boolq,rte,imdb,yelp,amazon,sst2,dbpedia,agnews,multirc,yahoo \
    --gen_data_dir generated_data/lora_gen_long_t5 \
+   --task_config_dir configs/gen_script_long_order4_t5_configs/yahoo \
    --output_dir logs_and_outputs/gen_script_long_order4_t5_small_inflora/outputs/15-yahoo \
    --per_device_train_batch_size 32 \
    --per_device_eval_batch_size 256 \
 sleep 5
+CUDA_VISIBLE_DEVICES=1 python score.py gen_script_long_order4_t5_inflora gen_script_long_order4_t5_inflora

root_gainlora/T5_small/gen_script_superni_order1_t5_small_gainlora_inflora.sh CHANGED Viewed

@@ -18,7 +18,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --model_name_or_path $2 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task1572_samsum_summary \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_gainlora_inflora/outputs/1-task1572_samsum_summary \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -67,7 +67,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task363_sst2_polarity_classification \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_gainlora_inflora/outputs/2-task363_sst2_polarity_classification \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -116,7 +116,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task1290_xsum_summarization \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_gainlora_inflora/outputs/3-task1290_xsum_summarization \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -165,7 +165,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task181_outcome_extraction \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_gainlora_inflora/outputs/4-task181_outcome_extraction \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -214,7 +214,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task002_quoref_answer_generation \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_gainlora_inflora/outputs/5-task002_quoref_answer_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -263,7 +263,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task1510_evalution_relation_extraction \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_gainlora_inflora/outputs/6-task1510_evalution_relation_extraction \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -312,7 +312,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task639_multi_woz_user_utterance_generation \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_gainlora_inflora/outputs/7-task639_multi_woz_user_utterance_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -361,7 +361,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task1729_personachat_generate_next \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_gainlora_inflora/outputs/8-task1729_personachat_generate_next \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -410,7 +410,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task073_commonsenseqa_answer_generation \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_gainlora_inflora/outputs/9-task073_commonsenseqa_answer_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -459,7 +459,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task1590_diplomacy_text_generation \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_gainlora_inflora/outputs/10-task1590_diplomacy_text_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -508,7 +508,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task748_glucose_reverse_cause_event_detection \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_gainlora_inflora/outputs/11-task748_glucose_reverse_cause_event_detection \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -557,7 +557,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task511_reddit_tifu_long_text_summarization \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_gainlora_inflora/outputs/12-task511_reddit_tifu_long_text_summarization \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -606,7 +606,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task591_sciq_answer_generation \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_gainlora_inflora/outputs/13-task591_sciq_answer_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -655,7 +655,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task1687_sentiment140_classification \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_gainlora_inflora/outputs/14-task1687_sentiment140_classification \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -704,7 +704,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task875_emotion_classification \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_gainlora_inflora/outputs/15-task875_emotion_classification \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -741,4 +741,4 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --threshold 0.995 \
    --transthreshold 0.995
-python score.py gen_script_superni_order1_t5_small_gainlora_inflora gen_script_superni_order1_t5_small_gainlora_inflora

    --model_name_or_path $2 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task1572_samsum_summary \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_gainlora_inflora/outputs/1-task1572_samsum_summary \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task363_sst2_polarity_classification \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_gainlora_inflora/outputs/2-task363_sst2_polarity_classification \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task1290_xsum_summarization \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_gainlora_inflora/outputs/3-task1290_xsum_summarization \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task181_outcome_extraction \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_gainlora_inflora/outputs/4-task181_outcome_extraction \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task002_quoref_answer_generation \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_gainlora_inflora/outputs/5-task002_quoref_answer_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task1510_evalution_relation_extraction \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_gainlora_inflora/outputs/6-task1510_evalution_relation_extraction \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task639_multi_woz_user_utterance_generation \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_gainlora_inflora/outputs/7-task639_multi_woz_user_utterance_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task1729_personachat_generate_next \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_gainlora_inflora/outputs/8-task1729_personachat_generate_next \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task073_commonsenseqa_answer_generation \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_gainlora_inflora/outputs/9-task073_commonsenseqa_answer_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task1590_diplomacy_text_generation \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_gainlora_inflora/outputs/10-task1590_diplomacy_text_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task748_glucose_reverse_cause_event_detection \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_gainlora_inflora/outputs/11-task748_glucose_reverse_cause_event_detection \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task511_reddit_tifu_long_text_summarization \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_gainlora_inflora/outputs/12-task511_reddit_tifu_long_text_summarization \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task591_sciq_answer_generation \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_gainlora_inflora/outputs/13-task591_sciq_answer_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task1687_sentiment140_classification \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_gainlora_inflora/outputs/14-task1687_sentiment140_classification \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task875_emotion_classification \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_gainlora_inflora/outputs/15-task875_emotion_classification \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --threshold 0.995 \
    --transthreshold 0.995
+python score.py gen_script_superni_order1_t5_gainlora_inflora gen_script_superni_order1_t5_gainlora_inflora

root_gainlora/T5_small/gen_script_superni_order1_t5_small_inflora.sh CHANGED Viewed

@@ -18,7 +18,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --model_name_or_path $2 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task1572_samsum_summary \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_inflora/outputs/1-task1572_samsum_summary \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -64,7 +64,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task363_sst2_polarity_classification \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_inflora/outputs/2-task363_sst2_polarity_classification \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -111,7 +111,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task1290_xsum_summarization \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_inflora/outputs/3-task1290_xsum_summarization \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -158,7 +158,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task181_outcome_extraction \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_inflora/outputs/4-task181_outcome_extraction \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -205,7 +205,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task002_quoref_answer_generation \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_inflora/outputs/5-task002_quoref_answer_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -252,7 +252,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task1510_evalution_relation_extraction \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_inflora/outputs/6-task1510_evalution_relation_extraction \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -299,7 +299,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task639_multi_woz_user_utterance_generation \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_inflora/outputs/7-task639_multi_woz_user_utterance_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -346,7 +346,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task1729_personachat_generate_next \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_inflora/outputs/8-task1729_personachat_generate_next \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -393,7 +393,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task073_commonsenseqa_answer_generation \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_inflora/outputs/9-task073_commonsenseqa_answer_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -440,7 +440,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task1590_diplomacy_text_generation \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_inflora/outputs/10-task1590_diplomacy_text_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -487,7 +487,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task748_glucose_reverse_cause_event_detection \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_inflora/outputs/11-task748_glucose_reverse_cause_event_detection \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -534,7 +534,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task511_reddit_tifu_long_text_summarization \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_inflora/outputs/12-task511_reddit_tifu_long_text_summarization \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -581,7 +581,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task591_sciq_answer_generation \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_inflora/outputs/13-task591_sciq_answer_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -628,7 +628,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task1687_sentiment140_classification \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_inflora/outputs/14-task1687_sentiment140_classification \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -675,7 +675,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order1_t5_small_configs/task875_emotion_classification \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_inflora/outputs/15-task875_emotion_classification \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -710,4 +710,4 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --model_name inflora \
    --threshold 0.995
-python score.py gen_script_superni_order1_t5_small_inflora gen_script_superni_order1_t5_small_inflora

    --model_name_or_path $2 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task1572_samsum_summary \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_inflora/outputs/1-task1572_samsum_summary \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task363_sst2_polarity_classification \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_inflora/outputs/2-task363_sst2_polarity_classification \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task1290_xsum_summarization \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_inflora/outputs/3-task1290_xsum_summarization \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task181_outcome_extraction \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_inflora/outputs/4-task181_outcome_extraction \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task002_quoref_answer_generation \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_inflora/outputs/5-task002_quoref_answer_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task1510_evalution_relation_extraction \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_inflora/outputs/6-task1510_evalution_relation_extraction \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task639_multi_woz_user_utterance_generation \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_inflora/outputs/7-task639_multi_woz_user_utterance_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task1729_personachat_generate_next \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_inflora/outputs/8-task1729_personachat_generate_next \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task073_commonsenseqa_answer_generation \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_inflora/outputs/9-task073_commonsenseqa_answer_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task1590_diplomacy_text_generation \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_inflora/outputs/10-task1590_diplomacy_text_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task748_glucose_reverse_cause_event_detection \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_inflora/outputs/11-task748_glucose_reverse_cause_event_detection \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task511_reddit_tifu_long_text_summarization \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_inflora/outputs/12-task511_reddit_tifu_long_text_summarization \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task591_sciq_answer_generation \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_inflora/outputs/13-task591_sciq_answer_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task1687_sentiment140_classification \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_inflora/outputs/14-task1687_sentiment140_classification \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task1572_samsum_summary,task363_sst2_polarity_classification,task1290_xsum_summarization,task181_outcome_extraction,task002_quoref_answer_generation,task1510_evalution_relation_extraction,task639_multi_woz_user_utterance_generation,task1729_personachat_generate_next,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task748_glucose_reverse_cause_event_detection,task511_reddit_tifu_long_text_summarization,task591_sciq_answer_generation,task1687_sentiment140_classification,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order1_t5_configs/task875_emotion_classification \
    --output_dir logs_and_outputs/gen_script_superni_order1_t5_small_inflora/outputs/15-task875_emotion_classification \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --model_name inflora \
    --threshold 0.995
+python score.py gen_script_superni_order1_t5_inflora gen_script_superni_order1_t5_inflora

root_gainlora/T5_small/gen_script_superni_order2_t5_small_gainlora_inflora.sh CHANGED Viewed

@@ -18,7 +18,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --model_name_or_path $2 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task748_glucose_reverse_cause_event_detection \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_gainlora_inflora/outputs/1-task748_glucose_reverse_cause_event_detection \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -66,7 +66,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task073_commonsenseqa_answer_generation \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_gainlora_inflora/outputs/2-task073_commonsenseqa_answer_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -115,7 +115,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task1590_diplomacy_text_generation \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_gainlora_inflora/outputs/3-task1590_diplomacy_text_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -164,7 +164,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task639_multi_woz_user_utterance_generation \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_gainlora_inflora/outputs/4-task639_multi_woz_user_utterance_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -213,7 +213,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task1572_samsum_summary \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_gainlora_inflora/outputs/5-task1572_samsum_summary \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -262,7 +262,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task1687_sentiment140_classification \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_gainlora_inflora/outputs/6-task1687_sentiment140_classification \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -311,7 +311,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task591_sciq_answer_generation \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_gainlora_inflora/outputs/7-task591_sciq_answer_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -360,7 +360,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task363_sst2_polarity_classification \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_gainlora_inflora/outputs/8-task363_sst2_polarity_classification \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -409,7 +409,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task1510_evalution_relation_extraction \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_gainlora_inflora/outputs/9-task1510_evalution_relation_extraction \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -458,7 +458,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task1729_personachat_generate_next \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_gainlora_inflora/outputs/10-task1729_personachat_generate_next \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -507,7 +507,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task181_outcome_extraction \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_gainlora_inflora/outputs/11-task181_outcome_extraction \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -556,7 +556,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task511_reddit_tifu_long_text_summarization \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_gainlora_inflora/outputs/12-task511_reddit_tifu_long_text_summarization \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -605,7 +605,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task002_quoref_answer_generation \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_gainlora_inflora/outputs/13-task002_quoref_answer_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -654,7 +654,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task1290_xsum_summarization \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_gainlora_inflora/outputs/14-task1290_xsum_summarization \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -703,7 +703,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task875_emotion_classification \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_gainlora_inflora/outputs/15-task875_emotion_classification \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -740,4 +740,4 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --kl_ratio 0.5 \
    --attn_temperature 1
-python score.py gen_script_superni_order2_t5_small_gainlora_inflora gen_script_superni_order2_t5_small_gainlora_inflora

    --model_name_or_path $2 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task748_glucose_reverse_cause_event_detection \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_gainlora_inflora/outputs/1-task748_glucose_reverse_cause_event_detection \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task073_commonsenseqa_answer_generation \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_gainlora_inflora/outputs/2-task073_commonsenseqa_answer_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task1590_diplomacy_text_generation \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_gainlora_inflora/outputs/3-task1590_diplomacy_text_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task639_multi_woz_user_utterance_generation \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_gainlora_inflora/outputs/4-task639_multi_woz_user_utterance_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task1572_samsum_summary \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_gainlora_inflora/outputs/5-task1572_samsum_summary \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task1687_sentiment140_classification \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_gainlora_inflora/outputs/6-task1687_sentiment140_classification \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task591_sciq_answer_generation \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_gainlora_inflora/outputs/7-task591_sciq_answer_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task363_sst2_polarity_classification \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_gainlora_inflora/outputs/8-task363_sst2_polarity_classification \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task1510_evalution_relation_extraction \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_gainlora_inflora/outputs/9-task1510_evalution_relation_extraction \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task1729_personachat_generate_next \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_gainlora_inflora/outputs/10-task1729_personachat_generate_next \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task181_outcome_extraction \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_gainlora_inflora/outputs/11-task181_outcome_extraction \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task511_reddit_tifu_long_text_summarization \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_gainlora_inflora/outputs/12-task511_reddit_tifu_long_text_summarization \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task002_quoref_answer_generation \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_gainlora_inflora/outputs/13-task002_quoref_answer_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task1290_xsum_summarization \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_gainlora_inflora/outputs/14-task1290_xsum_summarization \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task875_emotion_classification \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_gainlora_inflora/outputs/15-task875_emotion_classification \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --kl_ratio 0.5 \
    --attn_temperature 1
+python score.py gen_script_superni_order2_t5_gainlora_inflora gen_script_superni_order2_t5_gainlora_inflora

root_gainlora/T5_small/gen_script_superni_order2_t5_small_inflora.sh CHANGED Viewed

@@ -18,7 +18,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --model_name_or_path $2 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task748_glucose_reverse_cause_event_detection \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_inflora/outputs/1-task748_glucose_reverse_cause_event_detection \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -64,7 +64,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task073_commonsenseqa_answer_generation \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_inflora/outputs/2-task073_commonsenseqa_answer_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -111,7 +111,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task1590_diplomacy_text_generation \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_inflora/outputs/3-task1590_diplomacy_text_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -158,7 +158,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task639_multi_woz_user_utterance_generation \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_inflora/outputs/4-task639_multi_woz_user_utterance_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -205,7 +205,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task1572_samsum_summary \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_inflora/outputs/5-task1572_samsum_summary \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -252,7 +252,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task1687_sentiment140_classification \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_inflora/outputs/6-task1687_sentiment140_classification \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -299,7 +299,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task591_sciq_answer_generation \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_inflora/outputs/7-task591_sciq_answer_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -346,7 +346,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task363_sst2_polarity_classification \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_inflora/outputs/8-task363_sst2_polarity_classification \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -393,7 +393,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task1510_evalution_relation_extraction \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_inflora/outputs/9-task1510_evalution_relation_extraction \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -440,7 +440,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task1729_personachat_generate_next \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_inflora/outputs/10-task1729_personachat_generate_next \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -487,7 +487,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task181_outcome_extraction \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_inflora/outputs/11-task181_outcome_extraction \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -534,7 +534,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task511_reddit_tifu_long_text_summarization \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_inflora/outputs/12-task511_reddit_tifu_long_text_summarization \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -581,7 +581,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task002_quoref_answer_generation \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_inflora/outputs/13-task002_quoref_answer_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -628,7 +628,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task1290_xsum_summarization \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_inflora/outputs/14-task1290_xsum_summarization \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -675,7 +675,7 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
-   --task_config_dir configs/gen_script_superni_order2_t5_small_configs/task875_emotion_classification \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_inflora/outputs/15-task875_emotion_classification \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
@@ -710,4 +710,4 @@ CUDA_VISIBLE_DEVICES=$1 python src/run_t5.py \
    --kl_ratio 0.5 \
    --attn_temperature 1
-python score.py gen_script_superni_order2_t5_small_inflora gen_script_superni_order2_t5_small_inflora

    --model_name_or_path $2 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task748_glucose_reverse_cause_event_detection \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_inflora/outputs/1-task748_glucose_reverse_cause_event_detection \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task073_commonsenseqa_answer_generation \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_inflora/outputs/2-task073_commonsenseqa_answer_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task1590_diplomacy_text_generation \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_inflora/outputs/3-task1590_diplomacy_text_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task639_multi_woz_user_utterance_generation \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_inflora/outputs/4-task639_multi_woz_user_utterance_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task1572_samsum_summary \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_inflora/outputs/5-task1572_samsum_summary \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task1687_sentiment140_classification \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_inflora/outputs/6-task1687_sentiment140_classification \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task591_sciq_answer_generation \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_inflora/outputs/7-task591_sciq_answer_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task363_sst2_polarity_classification \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_inflora/outputs/8-task363_sst2_polarity_classification \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task1510_evalution_relation_extraction \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_inflora/outputs/9-task1510_evalution_relation_extraction \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task1729_personachat_generate_next \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_inflora/outputs/10-task1729_personachat_generate_next \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task181_outcome_extraction \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_inflora/outputs/11-task181_outcome_extraction \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task511_reddit_tifu_long_text_summarization \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_inflora/outputs/12-task511_reddit_tifu_long_text_summarization \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task002_quoref_answer_generation \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_inflora/outputs/13-task002_quoref_answer_generation \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task1290_xsum_summarization \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_inflora/outputs/14-task1290_xsum_summarization \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --data_dir CL_Benchmark \
    --task_order task748_glucose_reverse_cause_event_detection,task073_commonsenseqa_answer_generation,task1590_diplomacy_text_generation,task639_multi_woz_user_utterance_generation,task1572_samsum_summary,task1687_sentiment140_classification,task591_sciq_answer_generation,task363_sst2_polarity_classification,task1510_evalution_relation_extraction,task1729_personachat_generate_next,task181_outcome_extraction,task511_reddit_tifu_long_text_summarization,task002_quoref_answer_generation,task1290_xsum_summarization,task875_emotion_classification \
    --gen_data_dir generated_data/lora_gen_superni_t5 \
+   --task_config_dir configs/gen_script_superni_order2_t5_configs/task875_emotion_classification \
    --output_dir logs_and_outputs/gen_script_superni_order2_t5_small_inflora/outputs/15-task875_emotion_classification \
    --per_device_train_batch_size 16 \
    --per_device_eval_batch_size 8 \
    --kl_ratio 0.5 \
    --attn_temperature 1
+python score.py gen_script_superni_order2_t5_inflora gen_script_superni_order2_t5_inflora