jdorairaj commited on Jun 1, 2024

Commit

e5e4df0

1 Parent(s): 4311c72

la runs

Browse files

This view is limited to 50 files because it contains too many changes. See raw diff

Files changed (50) hide show

outputs/args_la.json +3 -0
outputs/cola/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/logfile_la_{args.laplace_sub}.log +852 -0
outputs/cola/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_0/all_results_la_kron_all_homo_mc_corr_1000.json +3 -0
outputs/cola/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_0/eval_res_la_kron_all_homo_mc_corr_1000.json +3 -0
outputs/cola/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_0/gpu_stats_la.json +3 -0
outputs/cola/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_1999/all_results_la_kron_all_homo_mc_corr_1000.json +3 -0
outputs/cola/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_1999/eval_res_la_kron_all_homo_mc_corr_1000.json +3 -0
outputs/cola/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_1999/gpu_stats_la.json +3 -0
outputs/cola/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_3999/all_results_la_kron_all_homo_mc_corr_1000.json +3 -0
outputs/cola/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_3999/eval_res_la_kron_all_homo_mc_corr_1000.json +3 -0
outputs/cola/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_3999/gpu_stats_la.json +3 -0
outputs/cola/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_5999/all_results_la_kron_all_homo_mc_corr_1000.json +3 -0
outputs/cola/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_5999/eval_res_la_kron_all_homo_mc_corr_1000.json +3 -0
outputs/cola/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_5999/gpu_stats_la.json +3 -0
outputs/cola/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_7999/all_results_la_kron_all_homo_mc_corr_1000.json +3 -0
outputs/cola/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_7999/eval_res_la_kron_all_homo_mc_corr_1000.json +3 -0
outputs/cola/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_7999/gpu_stats_la.json +3 -0
outputs/cola/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_9999/all_results_la_kron_all_homo_mc_corr_1000.json +3 -0
outputs/cola/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_9999/eval_res_la_kron_all_homo_mc_corr_1000.json +3 -0
outputs/cola/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_9999/gpu_stats_la.json +3 -0
outputs/mrpc/bert-base-uncased_adapterstrain_val_0.0001_42_8_10000/logfile_la_{args.laplace_sub}.log +7 -0
outputs/mrpc/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/logfile_la_{args.laplace_sub}.log +0 -0
outputs/mrpc/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_0/all_results_la_kron_all_homo_mc_corr_1000.json +3 -0
outputs/mrpc/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_0/eval_res_la_kron_all_homo_mc_corr_1000.json +3 -0
outputs/mrpc/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_0/gpu_stats_la.json +3 -0
outputs/mrpc/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_1999/all_results_la_kron_all_homo_mc_corr_1000.json +3 -0
outputs/mrpc/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_1999/eval_res_la_kron_all_homo_mc_corr_1000.json +3 -0
outputs/mrpc/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_1999/gpu_stats_la.json +3 -0
outputs/mrpc/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_3999/all_results_la_kron_all_homo_mc_corr_1000.json +3 -0
outputs/mrpc/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_3999/eval_res_la_kron_all_homo_mc_corr_1000.json +3 -0
outputs/mrpc/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_3999/gpu_stats_la.json +3 -0
outputs/mrpc/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_5999/all_results_la_kron_all_homo_mc_corr_1000.json +3 -0
outputs/mrpc/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_5999/eval_res_la_kron_all_homo_mc_corr_1000.json +3 -0
outputs/mrpc/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_5999/gpu_stats_la.json +3 -0
outputs/mrpc/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_7999/all_results_la_kron_all_homo_mc_corr_1000.json +3 -0
outputs/mrpc/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_7999/eval_res_la_kron_all_homo_mc_corr_1000.json +3 -0
outputs/mrpc/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_7999/gpu_stats_la.json +3 -0
outputs/mrpc/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_9999/all_results_la_kron_all_homo_mc_corr_1000.json +3 -0
outputs/mrpc/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_9999/eval_res_la_kron_all_homo_mc_corr_1000.json +3 -0
outputs/mrpc/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_9999/gpu_stats_la.json +3 -0
outputs/mrpc/bert-base-uncased_adapterstrain_val_5e-05_42_8_10000/logfile_la_{args.laplace_sub}.log +10 -0
outputs/mrpc/roberta-base_adapterstrain_val_0.0001_65_8_10000/logfile_la_{args.laplace_sub}.log +0 -0
outputs/mrpc/roberta-base_adapterstrain_val_0.0001_65_8_10000/step_0/all_results_la_kron_all_homo_mc_corr_1000.json +3 -0
outputs/mrpc/roberta-base_adapterstrain_val_0.0001_65_8_10000/step_0/eval_res_la_kron_all_homo_mc_corr_1000.json +3 -0
outputs/mrpc/roberta-base_adapterstrain_val_0.0001_65_8_10000/step_0/gpu_stats_la.json +3 -0
outputs/mrpc/roberta-base_adapterstrain_val_0.0001_65_8_10000/step_1999/all_results_la_kron_all_homo_mc_corr_1000.json +3 -0
outputs/mrpc/roberta-base_adapterstrain_val_0.0001_65_8_10000/step_1999/eval_res_la_kron_all_homo_mc_corr_1000.json +3 -0
outputs/mrpc/roberta-base_adapterstrain_val_0.0001_65_8_10000/step_1999/gpu_stats_la.json +3 -0
outputs/mrpc/roberta-base_adapterstrain_val_0.0001_65_8_10000/step_3999/all_results_la_kron_all_homo_mc_corr_1000.json +3 -0
outputs/mrpc/roberta-base_adapterstrain_val_0.0001_65_8_10000/step_3999/eval_res_la_kron_all_homo_mc_corr_1000.json +3 -0

outputs/args_la.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:dec833e18809abcd83d6a58fc8f1515a28191bebcbc44bd7610cc314e5b24a53
+size 1109

outputs/cola/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/logfile_la_{args.laplace_sub}.log ADDED Viewed

	@@ -0,0 +1,852 @@

+06/01/2024 11:55:49 - INFO - __main__ -  Number of labels detected = 2
+06/01/2024 11:55:49 - INFO - __main__ - ***** Starting script *****
+06/01/2024 11:55:50 - INFO - adapters.heads.model_mixin - Adding head 'default' with config {'head_type': 'masked_lm', 'vocab_size': 30522, 'embedding_size': 768, 'layers': 2, 'activation_function': 'gelu', 'layer_norm': True, 'bias': True, 'shift_labels': False, 'label2id': None}.
+06/01/2024 11:55:51 - INFO - adapters.loading - Loading module configuration from ./outputs/cola/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_0/adapter_config.json
+06/01/2024 11:55:51 - INFO - adapters.configuration.model_adapters_config - Adding adapter 'cola'.
+06/01/2024 11:55:51 - INFO - adapters.loading - Loading module weights from ./outputs/cola/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_0/pytorch_adapter.bin
+06/01/2024 11:55:51 - INFO - adapters.loading - Loading module configuration from ./outputs/cola/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_0/head_config.json
+06/01/2024 11:55:51 - INFO - adapters.heads.model_mixin - Adding head 'cola' with config {'head_type': 'classification', 'num_labels': 2, 'layers': 2, 'activation_function': 'tanh', 'label2id': {'LABEL_0': 0, 'LABEL_1': 1}, 'use_pooler': False, 'bias': True, 'dropout_prob': None}.
+06/01/2024 11:55:51 - INFO - adapters.loading - Loading module weights from ./outputs/cola/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_0/pytorch_model_head.bin
+06/01/2024 11:55:51 - INFO - __main__ - Adapter Name = cola
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.0.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.0.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.0.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.0.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.0.output.adapters.cola.adapter_down.0.weight
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.0.output.adapters.cola.adapter_down.0.bias
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.0.output.adapters.cola.adapter_up.weight
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.0.output.adapters.cola.adapter_up.bias
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.1.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.1.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.1.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.1.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.1.output.adapters.cola.adapter_down.0.weight
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.1.output.adapters.cola.adapter_down.0.bias
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.1.output.adapters.cola.adapter_up.weight
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.1.output.adapters.cola.adapter_up.bias
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.2.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.2.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.2.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.2.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.2.output.adapters.cola.adapter_down.0.weight
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.2.output.adapters.cola.adapter_down.0.bias
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.2.output.adapters.cola.adapter_up.weight
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.2.output.adapters.cola.adapter_up.bias
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.3.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.3.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.3.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.3.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.3.output.adapters.cola.adapter_down.0.weight
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.3.output.adapters.cola.adapter_down.0.bias
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.3.output.adapters.cola.adapter_up.weight
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.3.output.adapters.cola.adapter_up.bias
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.4.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.4.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.4.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.4.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.4.output.adapters.cola.adapter_down.0.weight
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.4.output.adapters.cola.adapter_down.0.bias
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.4.output.adapters.cola.adapter_up.weight
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.4.output.adapters.cola.adapter_up.bias
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.5.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.5.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.5.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.5.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.5.output.adapters.cola.adapter_down.0.weight
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.5.output.adapters.cola.adapter_down.0.bias
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.5.output.adapters.cola.adapter_up.weight
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.5.output.adapters.cola.adapter_up.bias
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.6.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.6.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.6.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.6.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.6.output.adapters.cola.adapter_down.0.weight
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.6.output.adapters.cola.adapter_down.0.bias
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.6.output.adapters.cola.adapter_up.weight
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.6.output.adapters.cola.adapter_up.bias
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.7.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.7.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.7.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.7.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.7.output.adapters.cola.adapter_down.0.weight
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.7.output.adapters.cola.adapter_down.0.bias
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.7.output.adapters.cola.adapter_up.weight
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.7.output.adapters.cola.adapter_up.bias
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.8.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.8.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.8.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.8.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.8.output.adapters.cola.adapter_down.0.weight
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.8.output.adapters.cola.adapter_down.0.bias
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.8.output.adapters.cola.adapter_up.weight
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.8.output.adapters.cola.adapter_up.bias
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.9.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.9.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.9.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.9.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.9.output.adapters.cola.adapter_down.0.weight
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.9.output.adapters.cola.adapter_down.0.bias
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.9.output.adapters.cola.adapter_up.weight
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.9.output.adapters.cola.adapter_up.bias
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.10.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.10.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.10.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.10.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.10.output.adapters.cola.adapter_down.0.weight
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.10.output.adapters.cola.adapter_down.0.bias
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.10.output.adapters.cola.adapter_up.weight
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.10.output.adapters.cola.adapter_up.bias
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.11.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.11.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.11.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.11.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.11.output.adapters.cola.adapter_down.0.weight
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.11.output.adapters.cola.adapter_down.0.bias
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.11.output.adapters.cola.adapter_up.weight
+06/01/2024 11:55:51 - INFO - __main__ - bert.encoder.layer.11.output.adapters.cola.adapter_up.bias
+06/01/2024 11:55:51 - INFO - __main__ - heads.cola.1.weight
+06/01/2024 11:55:51 - INFO - __main__ - heads.cola.1.bias
+06/01/2024 11:55:51 - INFO - __main__ - heads.cola.4.weight
+06/01/2024 11:55:51 - INFO - __main__ - heads.cola.4.bias
+06/01/2024 11:55:54 - INFO - __main__ - Sample 3397 of the training set: {'input_ids': [101, 9901, 13303, 2044, 1996, 12383, 1012, 102], 'token_type_ids': [0, 0, 0, 0, 0, 0, 0, 0], 'attention_mask': [1, 1, 1, 1, 1, 1, 1, 1], 'labels': 1}.
+06/01/2024 11:55:54 - INFO - __main__ - Sample 2366 of the training set: {'input_ids': [101, 1996, 3586, 3631, 10647, 1005, 1055, 12277, 1012, 102], 'token_type_ids': [0, 0, 0, 0, 0, 0, 0, 0, 0, 0], 'attention_mask': [1, 1, 1, 1, 1, 1, 1, 1, 1, 1], 'labels': 1}.
+06/01/2024 11:55:54 - INFO - __main__ - Sample 2356 of the training set: {'input_ids': [101, 2057, 19379, 26860, 2094, 4981, 2083, 1996, 4624, 1012, 102], 'token_type_ids': [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0], 'attention_mask': [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1], 'labels': 0}.
+06/01/2024 12:00:43 - INFO - __main__ - f_mu shape : torch.Size([1043, 2])
+06/01/2024 12:00:43 - INFO - __main__ - f_var shape :  torch.Size([1043, 2, 2])
+06/01/2024 12:00:43 - INFO - __main__ - tensor([[ 0.0578, -0.1273],
+        [ 0.0141, -0.0255],
+        [ 0.0414, -0.0381],
+        ...,
+        [-0.0166, -0.0405],
+        [ 0.0134, -0.0715],
+        [-0.0382,  0.0213]], device='cuda:0')
+06/01/2024 12:00:43 - INFO - __main__ - tensor([[[12.9645, 12.7884],
+         [12.7884, 12.9717]],
+        [[11.9546, 11.6422],
+         [11.6422, 12.0088]],
+        [[12.1316, 11.8974],
+         [11.8974, 12.1370]],
+        ...,
+        [[13.6458, 13.3185],
+         [13.3185, 13.6473]],
+        [[11.7474, 11.5666],
+         [11.5666, 11.7562]],
+        [[12.1346, 11.8893],
+         [11.8893, 12.1221]]], device='cuda:0')
+06/01/2024 12:00:43 - INFO - __main__ - ***** Completed training *****
+06/01/2024 12:00:48 - INFO - __main__ -  Number of labels detected = 2
+06/01/2024 12:00:48 - INFO - __main__ - ***** Starting script *****
+06/01/2024 12:00:49 - INFO - adapters.heads.model_mixin - Adding head 'default' with config {'head_type': 'masked_lm', 'vocab_size': 30522, 'embedding_size': 768, 'layers': 2, 'activation_function': 'gelu', 'layer_norm': True, 'bias': True, 'shift_labels': False, 'label2id': None}.
+06/01/2024 12:00:50 - INFO - adapters.loading - Loading module configuration from ./outputs/cola/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_1999/adapter_config.json
+06/01/2024 12:00:50 - INFO - adapters.configuration.model_adapters_config - Adding adapter 'cola'.
+06/01/2024 12:00:50 - INFO - adapters.loading - Loading module weights from ./outputs/cola/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_1999/pytorch_adapter.bin
+06/01/2024 12:00:50 - INFO - adapters.loading - Loading module configuration from ./outputs/cola/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_1999/head_config.json
+06/01/2024 12:00:50 - INFO - adapters.heads.model_mixin - Adding head 'cola' with config {'head_type': 'classification', 'num_labels': 2, 'layers': 2, 'activation_function': 'tanh', 'label2id': {'LABEL_0': 0, 'LABEL_1': 1}, 'use_pooler': False, 'bias': True, 'dropout_prob': None}.
+06/01/2024 12:00:50 - INFO - adapters.loading - Loading module weights from ./outputs/cola/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_1999/pytorch_model_head.bin
+06/01/2024 12:00:50 - INFO - __main__ - Adapter Name = cola
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.0.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.0.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.0.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.0.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.0.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.0.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.0.output.adapters.cola.adapter_up.weight
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.0.output.adapters.cola.adapter_up.bias
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.1.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.1.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.1.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.1.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.1.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.1.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.1.output.adapters.cola.adapter_up.weight
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.1.output.adapters.cola.adapter_up.bias
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.2.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.2.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.2.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.2.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.2.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.2.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.2.output.adapters.cola.adapter_up.weight
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.2.output.adapters.cola.adapter_up.bias
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.3.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.3.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.3.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.3.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.3.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.3.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.3.output.adapters.cola.adapter_up.weight
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.3.output.adapters.cola.adapter_up.bias
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.4.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.4.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.4.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.4.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.4.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.4.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.4.output.adapters.cola.adapter_up.weight
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.4.output.adapters.cola.adapter_up.bias
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.5.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.5.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.5.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.5.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.5.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.5.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.5.output.adapters.cola.adapter_up.weight
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.5.output.adapters.cola.adapter_up.bias
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.6.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.6.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.6.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.6.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.6.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.6.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.6.output.adapters.cola.adapter_up.weight
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.6.output.adapters.cola.adapter_up.bias
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.7.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.7.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.7.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.7.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.7.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.7.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.7.output.adapters.cola.adapter_up.weight
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.7.output.adapters.cola.adapter_up.bias
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.8.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.8.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.8.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.8.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.8.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.8.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.8.output.adapters.cola.adapter_up.weight
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.8.output.adapters.cola.adapter_up.bias
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.9.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.9.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.9.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.9.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.9.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.9.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.9.output.adapters.cola.adapter_up.weight
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.9.output.adapters.cola.adapter_up.bias
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.10.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.10.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.10.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.10.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.10.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.10.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.10.output.adapters.cola.adapter_up.weight
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.10.output.adapters.cola.adapter_up.bias
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.11.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.11.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.11.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.11.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.11.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.11.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.11.output.adapters.cola.adapter_up.weight
+06/01/2024 12:00:50 - INFO - __main__ - bert.encoder.layer.11.output.adapters.cola.adapter_up.bias
+06/01/2024 12:00:50 - INFO - __main__ - heads.cola.1.weight
+06/01/2024 12:00:50 - INFO - __main__ - heads.cola.1.bias
+06/01/2024 12:00:50 - INFO - __main__ - heads.cola.4.weight
+06/01/2024 12:00:50 - INFO - __main__ - heads.cola.4.bias
+06/01/2024 12:00:54 - INFO - __main__ - Sample 3397 of the training set: {'input_ids': [101, 9901, 13303, 2044, 1996, 12383, 1012, 102], 'token_type_ids': [0, 0, 0, 0, 0, 0, 0, 0], 'attention_mask': [1, 1, 1, 1, 1, 1, 1, 1], 'labels': 1}.
+06/01/2024 12:00:54 - INFO - __main__ - Sample 2366 of the training set: {'input_ids': [101, 1996, 3586, 3631, 10647, 1005, 1055, 12277, 1012, 102], 'token_type_ids': [0, 0, 0, 0, 0, 0, 0, 0, 0, 0], 'attention_mask': [1, 1, 1, 1, 1, 1, 1, 1, 1, 1], 'labels': 1}.
+06/01/2024 12:00:54 - INFO - __main__ - Sample 2356 of the training set: {'input_ids': [101, 2057, 19379, 26860, 2094, 4981, 2083, 1996, 4624, 1012, 102], 'token_type_ids': [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0], 'attention_mask': [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1], 'labels': 0}.
+06/01/2024 12:05:44 - INFO - __main__ - f_mu shape : torch.Size([1043, 2])
+06/01/2024 12:05:44 - INFO - __main__ - f_var shape :  torch.Size([1043, 2, 2])
+06/01/2024 12:05:44 - INFO - __main__ - tensor([[-1.5606e+00,  1.6427e+00],
+        [-1.0038e+00,  1.0276e+00],
+        [-1.1142e+00,  1.1758e+00],
+        ...,
+        [-2.2176e+00,  2.2876e+00],
+        [ 1.7365e-03, -1.2060e-01],
+        [ 4.5788e-02, -1.5021e-01]], device='cuda:0')
+06/01/2024 12:05:44 - INFO - __main__ - tensor([[[4.1708, 1.7396],
+         [1.7396, 4.4299]],
+        [[2.7875, 1.4555],
+         [1.4555, 2.9777]],
+        [[3.2805, 1.2788],
+         [1.2788, 3.6008]],
+        ...,
+        [[4.2817, 3.0575],
+         [3.0575, 4.4446]],
+        [[2.9753, 0.4526],
+         [0.4526, 3.1586]],
+        [[2.8956, 0.2997],
+         [0.2997, 3.0948]]], device='cuda:0')
+06/01/2024 12:05:44 - INFO - __main__ - ***** Completed training *****
+06/01/2024 12:05:49 - INFO - __main__ -  Number of labels detected = 2
+06/01/2024 12:05:49 - INFO - __main__ - ***** Starting script *****
+06/01/2024 12:05:50 - INFO - adapters.heads.model_mixin - Adding head 'default' with config {'head_type': 'masked_lm', 'vocab_size': 30522, 'embedding_size': 768, 'layers': 2, 'activation_function': 'gelu', 'layer_norm': True, 'bias': True, 'shift_labels': False, 'label2id': None}.
+06/01/2024 12:05:51 - INFO - adapters.loading - Loading module configuration from ./outputs/cola/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_3999/adapter_config.json
+06/01/2024 12:05:51 - INFO - adapters.configuration.model_adapters_config - Adding adapter 'cola'.
+06/01/2024 12:05:51 - INFO - adapters.loading - Loading module weights from ./outputs/cola/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_3999/pytorch_adapter.bin
+06/01/2024 12:05:51 - INFO - adapters.loading - Loading module configuration from ./outputs/cola/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_3999/head_config.json
+06/01/2024 12:05:51 - INFO - adapters.heads.model_mixin - Adding head 'cola' with config {'head_type': 'classification', 'num_labels': 2, 'layers': 2, 'activation_function': 'tanh', 'label2id': {'LABEL_0': 0, 'LABEL_1': 1}, 'use_pooler': False, 'bias': True, 'dropout_prob': None}.
+06/01/2024 12:05:51 - INFO - adapters.loading - Loading module weights from ./outputs/cola/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_3999/pytorch_model_head.bin
+06/01/2024 12:05:51 - INFO - __main__ - Adapter Name = cola
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.0.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.0.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.0.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.0.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.0.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.0.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.0.output.adapters.cola.adapter_up.weight
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.0.output.adapters.cola.adapter_up.bias
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.1.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.1.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.1.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.1.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.1.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.1.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.1.output.adapters.cola.adapter_up.weight
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.1.output.adapters.cola.adapter_up.bias
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.2.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.2.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.2.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.2.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.2.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.2.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.2.output.adapters.cola.adapter_up.weight
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.2.output.adapters.cola.adapter_up.bias
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.3.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.3.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.3.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.3.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.3.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.3.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.3.output.adapters.cola.adapter_up.weight
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.3.output.adapters.cola.adapter_up.bias
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.4.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.4.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.4.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.4.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.4.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.4.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.4.output.adapters.cola.adapter_up.weight
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.4.output.adapters.cola.adapter_up.bias
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.5.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.5.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.5.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.5.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.5.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.5.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.5.output.adapters.cola.adapter_up.weight
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.5.output.adapters.cola.adapter_up.bias
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.6.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.6.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.6.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.6.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.6.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.6.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.6.output.adapters.cola.adapter_up.weight
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.6.output.adapters.cola.adapter_up.bias
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.7.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.7.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.7.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.7.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.7.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.7.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.7.output.adapters.cola.adapter_up.weight
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.7.output.adapters.cola.adapter_up.bias
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.8.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.8.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.8.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.8.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.8.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.8.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.8.output.adapters.cola.adapter_up.weight
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.8.output.adapters.cola.adapter_up.bias
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.9.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.9.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.9.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.9.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.9.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.9.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.9.output.adapters.cola.adapter_up.weight
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.9.output.adapters.cola.adapter_up.bias
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.10.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.10.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.10.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.10.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.10.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.10.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.10.output.adapters.cola.adapter_up.weight
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.10.output.adapters.cola.adapter_up.bias
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.11.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.11.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.11.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.11.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.11.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.11.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.11.output.adapters.cola.adapter_up.weight
+06/01/2024 12:05:51 - INFO - __main__ - bert.encoder.layer.11.output.adapters.cola.adapter_up.bias
+06/01/2024 12:05:51 - INFO - __main__ - heads.cola.1.weight
+06/01/2024 12:05:51 - INFO - __main__ - heads.cola.1.bias
+06/01/2024 12:05:51 - INFO - __main__ - heads.cola.4.weight
+06/01/2024 12:05:51 - INFO - __main__ - heads.cola.4.bias
+06/01/2024 12:05:54 - INFO - __main__ - Sample 3397 of the training set: {'input_ids': [101, 9901, 13303, 2044, 1996, 12383, 1012, 102], 'token_type_ids': [0, 0, 0, 0, 0, 0, 0, 0], 'attention_mask': [1, 1, 1, 1, 1, 1, 1, 1], 'labels': 1}.
+06/01/2024 12:05:54 - INFO - __main__ - Sample 2366 of the training set: {'input_ids': [101, 1996, 3586, 3631, 10647, 1005, 1055, 12277, 1012, 102], 'token_type_ids': [0, 0, 0, 0, 0, 0, 0, 0, 0, 0], 'attention_mask': [1, 1, 1, 1, 1, 1, 1, 1, 1, 1], 'labels': 1}.
+06/01/2024 12:05:54 - INFO - __main__ - Sample 2356 of the training set: {'input_ids': [101, 2057, 19379, 26860, 2094, 4981, 2083, 1996, 4624, 1012, 102], 'token_type_ids': [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0], 'attention_mask': [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1], 'labels': 0}.
+06/01/2024 12:10:44 - INFO - __main__ - f_mu shape : torch.Size([1043, 2])
+06/01/2024 12:10:44 - INFO - __main__ - f_var shape :  torch.Size([1043, 2, 2])
+06/01/2024 12:10:44 - INFO - __main__ - tensor([[-2.2763,  2.3324],
+        [-1.8188,  1.8609],
+        [-1.6634,  1.6638],
+        ...,
+        [-3.0412,  3.1232],
+        [-0.9870,  0.8577],
+        [-0.5357,  0.3929]], device='cuda:0')
+06/01/2024 12:10:44 - INFO - __main__ - tensor([[[ 4.2765,  2.1601],
+         [ 2.1601,  4.4863]],
+        [[ 3.1863,  1.3376],
+         [ 1.3376,  3.4189]],
+        [[ 3.6683,  0.5845],
+         [ 0.5845,  4.1141]],
+        ...,
+        [[ 4.6443,  3.8401],
+         [ 3.8401,  4.7094]],
+        [[ 5.9511, -2.9900],
+         [-2.9900,  6.5578]],
+        [[ 5.5230, -3.1333],
+         [-3.1333,  6.1906]]], device='cuda:0')
+06/01/2024 12:10:44 - INFO - __main__ - ***** Completed training *****
+06/01/2024 12:10:49 - INFO - __main__ -  Number of labels detected = 2
+06/01/2024 12:10:49 - INFO - __main__ - ***** Starting script *****
+06/01/2024 12:10:50 - INFO - adapters.heads.model_mixin - Adding head 'default' with config {'head_type': 'masked_lm', 'vocab_size': 30522, 'embedding_size': 768, 'layers': 2, 'activation_function': 'gelu', 'layer_norm': True, 'bias': True, 'shift_labels': False, 'label2id': None}.
+06/01/2024 12:10:51 - INFO - adapters.loading - Loading module configuration from ./outputs/cola/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_5999/adapter_config.json
+06/01/2024 12:10:51 - INFO - adapters.configuration.model_adapters_config - Adding adapter 'cola'.
+06/01/2024 12:10:51 - INFO - adapters.loading - Loading module weights from ./outputs/cola/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_5999/pytorch_adapter.bin
+06/01/2024 12:10:51 - INFO - adapters.loading - Loading module configuration from ./outputs/cola/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_5999/head_config.json
+06/01/2024 12:10:51 - INFO - adapters.heads.model_mixin - Adding head 'cola' with config {'head_type': 'classification', 'num_labels': 2, 'layers': 2, 'activation_function': 'tanh', 'label2id': {'LABEL_0': 0, 'LABEL_1': 1}, 'use_pooler': False, 'bias': True, 'dropout_prob': None}.
+06/01/2024 12:10:51 - INFO - adapters.loading - Loading module weights from ./outputs/cola/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_5999/pytorch_model_head.bin
+06/01/2024 12:10:51 - INFO - __main__ - Adapter Name = cola
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.0.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.0.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.0.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.0.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.0.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.0.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.0.output.adapters.cola.adapter_up.weight
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.0.output.adapters.cola.adapter_up.bias
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.1.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.1.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.1.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.1.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.1.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.1.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.1.output.adapters.cola.adapter_up.weight
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.1.output.adapters.cola.adapter_up.bias
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.2.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.2.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.2.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.2.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.2.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.2.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.2.output.adapters.cola.adapter_up.weight
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.2.output.adapters.cola.adapter_up.bias
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.3.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.3.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.3.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.3.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.3.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.3.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.3.output.adapters.cola.adapter_up.weight
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.3.output.adapters.cola.adapter_up.bias
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.4.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.4.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.4.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.4.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.4.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.4.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.4.output.adapters.cola.adapter_up.weight
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.4.output.adapters.cola.adapter_up.bias
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.5.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.5.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.5.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.5.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.5.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.5.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.5.output.adapters.cola.adapter_up.weight
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.5.output.adapters.cola.adapter_up.bias
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.6.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.6.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.6.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.6.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.6.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.6.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.6.output.adapters.cola.adapter_up.weight
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.6.output.adapters.cola.adapter_up.bias
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.7.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.7.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.7.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.7.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.7.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.7.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.7.output.adapters.cola.adapter_up.weight
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.7.output.adapters.cola.adapter_up.bias
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.8.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.8.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.8.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.8.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.8.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.8.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.8.output.adapters.cola.adapter_up.weight
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.8.output.adapters.cola.adapter_up.bias
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.9.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.9.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.9.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.9.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.9.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.9.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.9.output.adapters.cola.adapter_up.weight
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.9.output.adapters.cola.adapter_up.bias
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.10.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.10.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.10.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.10.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.10.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.10.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.10.output.adapters.cola.adapter_up.weight
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.10.output.adapters.cola.adapter_up.bias
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.11.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.11.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.11.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.11.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.11.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.11.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.11.output.adapters.cola.adapter_up.weight
+06/01/2024 12:10:51 - INFO - __main__ - bert.encoder.layer.11.output.adapters.cola.adapter_up.bias
+06/01/2024 12:10:51 - INFO - __main__ - heads.cola.1.weight
+06/01/2024 12:10:51 - INFO - __main__ - heads.cola.1.bias
+06/01/2024 12:10:51 - INFO - __main__ - heads.cola.4.weight
+06/01/2024 12:10:51 - INFO - __main__ - heads.cola.4.bias
+06/01/2024 12:10:54 - INFO - __main__ - Sample 3397 of the training set: {'input_ids': [101, 9901, 13303, 2044, 1996, 12383, 1012, 102], 'token_type_ids': [0, 0, 0, 0, 0, 0, 0, 0], 'attention_mask': [1, 1, 1, 1, 1, 1, 1, 1], 'labels': 1}.
+06/01/2024 12:10:54 - INFO - __main__ - Sample 2366 of the training set: {'input_ids': [101, 1996, 3586, 3631, 10647, 1005, 1055, 12277, 1012, 102], 'token_type_ids': [0, 0, 0, 0, 0, 0, 0, 0, 0, 0], 'attention_mask': [1, 1, 1, 1, 1, 1, 1, 1, 1, 1], 'labels': 1}.
+06/01/2024 12:10:54 - INFO - __main__ - Sample 2356 of the training set: {'input_ids': [101, 2057, 19379, 26860, 2094, 4981, 2083, 1996, 4624, 1012, 102], 'token_type_ids': [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0], 'attention_mask': [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1], 'labels': 0}.
+06/01/2024 12:15:51 - INFO - __main__ - f_mu shape : torch.Size([1043, 2])
+06/01/2024 12:15:51 - INFO - __main__ - f_var shape :  torch.Size([1043, 2, 2])
+06/01/2024 12:15:51 - INFO - __main__ - tensor([[-2.4427,  2.6179],
+        [-1.8617,  1.9990],
+        [-1.7362,  1.8366],
+        ...,
+        [-3.4044,  3.5965],
+        [-2.7229,  2.8187],
+        [-2.1238,  2.1852]], device='cuda:0')
+06/01/2024 12:15:51 - INFO - __main__ - tensor([[[ 4.2594,  2.3833],
+         [ 2.3833,  4.3946]],
+        [[ 3.1920,  1.2501],
+         [ 1.2501,  3.4573]],
+        [[ 3.6047,  0.5266],
+         [ 0.5266,  4.1780]],
+        ...,
+        [[ 4.9522,  4.3707],
+         [ 4.3707,  4.9895]],
+        [[ 5.7035,  0.4758],
+         [ 0.4758,  6.6389]],
+        [[ 7.4642, -3.3615],
+         [-3.3615,  8.7533]]], device='cuda:0')
+06/01/2024 12:15:51 - INFO - __main__ - ***** Completed training *****
+06/01/2024 12:15:55 - INFO - __main__ -  Number of labels detected = 2
+06/01/2024 12:15:55 - INFO - __main__ - ***** Starting script *****
+06/01/2024 12:15:56 - INFO - adapters.heads.model_mixin - Adding head 'default' with config {'head_type': 'masked_lm', 'vocab_size': 30522, 'embedding_size': 768, 'layers': 2, 'activation_function': 'gelu', 'layer_norm': True, 'bias': True, 'shift_labels': False, 'label2id': None}.
+06/01/2024 12:15:57 - INFO - adapters.loading - Loading module configuration from ./outputs/cola/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_7999/adapter_config.json
+06/01/2024 12:15:57 - INFO - adapters.configuration.model_adapters_config - Adding adapter 'cola'.
+06/01/2024 12:15:57 - INFO - adapters.loading - Loading module weights from ./outputs/cola/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_7999/pytorch_adapter.bin
+06/01/2024 12:15:57 - INFO - adapters.loading - Loading module configuration from ./outputs/cola/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_7999/head_config.json
+06/01/2024 12:15:57 - INFO - adapters.heads.model_mixin - Adding head 'cola' with config {'head_type': 'classification', 'num_labels': 2, 'layers': 2, 'activation_function': 'tanh', 'label2id': {'LABEL_0': 0, 'LABEL_1': 1}, 'use_pooler': False, 'bias': True, 'dropout_prob': None}.
+06/01/2024 12:15:57 - INFO - adapters.loading - Loading module weights from ./outputs/cola/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_7999/pytorch_model_head.bin
+06/01/2024 12:15:57 - INFO - __main__ - Adapter Name = cola
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.0.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.0.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.0.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.0.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.0.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.0.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.0.output.adapters.cola.adapter_up.weight
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.0.output.adapters.cola.adapter_up.bias
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.1.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.1.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.1.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.1.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.1.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.1.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.1.output.adapters.cola.adapter_up.weight
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.1.output.adapters.cola.adapter_up.bias
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.2.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.2.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.2.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.2.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.2.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.2.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.2.output.adapters.cola.adapter_up.weight
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.2.output.adapters.cola.adapter_up.bias
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.3.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.3.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.3.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.3.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.3.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.3.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.3.output.adapters.cola.adapter_up.weight
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.3.output.adapters.cola.adapter_up.bias
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.4.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.4.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.4.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.4.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.4.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.4.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.4.output.adapters.cola.adapter_up.weight
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.4.output.adapters.cola.adapter_up.bias
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.5.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.5.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.5.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.5.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.5.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.5.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.5.output.adapters.cola.adapter_up.weight
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.5.output.adapters.cola.adapter_up.bias
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.6.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.6.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.6.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.6.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.6.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.6.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.6.output.adapters.cola.adapter_up.weight
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.6.output.adapters.cola.adapter_up.bias
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.7.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.7.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.7.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.7.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.7.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.7.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.7.output.adapters.cola.adapter_up.weight
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.7.output.adapters.cola.adapter_up.bias
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.8.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.8.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.8.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.8.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.8.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.8.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.8.output.adapters.cola.adapter_up.weight
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.8.output.adapters.cola.adapter_up.bias
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.9.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.9.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.9.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.9.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.9.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.9.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.9.output.adapters.cola.adapter_up.weight
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.9.output.adapters.cola.adapter_up.bias
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.10.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.10.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.10.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.10.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.10.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.10.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.10.output.adapters.cola.adapter_up.weight
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.10.output.adapters.cola.adapter_up.bias
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.11.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.11.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.11.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.11.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.11.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.11.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.11.output.adapters.cola.adapter_up.weight
+06/01/2024 12:15:57 - INFO - __main__ - bert.encoder.layer.11.output.adapters.cola.adapter_up.bias
+06/01/2024 12:15:57 - INFO - __main__ - heads.cola.1.weight
+06/01/2024 12:15:57 - INFO - __main__ - heads.cola.1.bias
+06/01/2024 12:15:57 - INFO - __main__ - heads.cola.4.weight
+06/01/2024 12:15:57 - INFO - __main__ - heads.cola.4.bias
+06/01/2024 12:16:02 - INFO - __main__ - Sample 3397 of the training set: {'input_ids': [101, 9901, 13303, 2044, 1996, 12383, 1012, 102], 'token_type_ids': [0, 0, 0, 0, 0, 0, 0, 0], 'attention_mask': [1, 1, 1, 1, 1, 1, 1, 1], 'labels': 1}.
+06/01/2024 12:16:02 - INFO - __main__ - Sample 2366 of the training set: {'input_ids': [101, 1996, 3586, 3631, 10647, 1005, 1055, 12277, 1012, 102], 'token_type_ids': [0, 0, 0, 0, 0, 0, 0, 0, 0, 0], 'attention_mask': [1, 1, 1, 1, 1, 1, 1, 1, 1, 1], 'labels': 1}.
+06/01/2024 12:16:02 - INFO - __main__ - Sample 2356 of the training set: {'input_ids': [101, 2057, 19379, 26860, 2094, 4981, 2083, 1996, 4624, 1012, 102], 'token_type_ids': [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0], 'attention_mask': [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1], 'labels': 0}.
+06/01/2024 12:21:09 - INFO - __main__ - f_mu shape : torch.Size([1043, 2])
+06/01/2024 12:21:09 - INFO - __main__ - f_var shape :  torch.Size([1043, 2, 2])
+06/01/2024 12:21:09 - INFO - __main__ - tensor([[-2.7018,  2.9278],
+        [-2.1563,  2.3556],
+        [-1.7670,  1.8868],
+        ...,
+        [-3.7648,  3.9964],
+        [-2.8124,  2.9454],
+        [-1.9931,  2.0436]], device='cuda:0')
+06/01/2024 12:21:09 - INFO - __main__ - tensor([[[ 4.7950,  1.9634],
+         [ 1.9634,  4.9622]],
+        [[ 3.6191,  1.1228],
+         [ 1.1228,  3.9051]],
+        [[ 4.1466, -0.2768],
+         [-0.2768,  4.9214]],
+        ...,
+        [[ 5.2033,  4.4562],
+         [ 4.4562,  5.2588]],
+        [[ 6.5369, -0.6365],
+         [-0.6365,  7.5989]],
+        [[ 9.1744, -5.8993],
+         [-5.8993, 10.9482]]], device='cuda:0')
+06/01/2024 12:21:09 - INFO - __main__ - ***** Completed training *****
+06/01/2024 12:21:14 - INFO - __main__ -  Number of labels detected = 2
+06/01/2024 12:21:14 - INFO - __main__ - ***** Starting script *****
+06/01/2024 12:21:16 - INFO - adapters.heads.model_mixin - Adding head 'default' with config {'head_type': 'masked_lm', 'vocab_size': 30522, 'embedding_size': 768, 'layers': 2, 'activation_function': 'gelu', 'layer_norm': True, 'bias': True, 'shift_labels': False, 'label2id': None}.
+06/01/2024 12:21:16 - INFO - adapters.loading - Loading module configuration from ./outputs/cola/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_9999/adapter_config.json
+06/01/2024 12:21:16 - INFO - adapters.configuration.model_adapters_config - Adding adapter 'cola'.
+06/01/2024 12:21:16 - INFO - adapters.loading - Loading module weights from ./outputs/cola/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_9999/pytorch_adapter.bin
+06/01/2024 12:21:16 - INFO - adapters.loading - Loading module configuration from ./outputs/cola/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_9999/head_config.json
+06/01/2024 12:21:16 - INFO - adapters.heads.model_mixin - Adding head 'cola' with config {'head_type': 'classification', 'num_labels': 2, 'layers': 2, 'activation_function': 'tanh', 'label2id': {'LABEL_0': 0, 'LABEL_1': 1}, 'use_pooler': False, 'bias': True, 'dropout_prob': None}.
+06/01/2024 12:21:16 - INFO - adapters.loading - Loading module weights from ./outputs/cola/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_9999/pytorch_model_head.bin
+06/01/2024 12:21:16 - INFO - __main__ - Adapter Name = cola
+06/01/2024 12:21:16 - INFO - __main__ - bert.encoder.layer.0.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:21:16 - INFO - __main__ - bert.encoder.layer.0.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:21:16 - INFO - __main__ - bert.encoder.layer.0.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 12:21:16 - INFO - __main__ - bert.encoder.layer.0.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 12:21:16 - INFO - __main__ - bert.encoder.layer.0.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.0.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.0.output.adapters.cola.adapter_up.weight
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.0.output.adapters.cola.adapter_up.bias
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.1.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.1.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.1.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.1.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.1.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.1.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.1.output.adapters.cola.adapter_up.weight
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.1.output.adapters.cola.adapter_up.bias
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.2.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.2.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.2.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.2.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.2.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.2.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.2.output.adapters.cola.adapter_up.weight
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.2.output.adapters.cola.adapter_up.bias
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.3.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.3.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.3.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.3.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.3.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.3.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.3.output.adapters.cola.adapter_up.weight
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.3.output.adapters.cola.adapter_up.bias
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.4.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.4.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.4.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.4.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.4.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.4.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.4.output.adapters.cola.adapter_up.weight
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.4.output.adapters.cola.adapter_up.bias
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.5.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.5.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.5.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.5.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.5.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.5.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.5.output.adapters.cola.adapter_up.weight
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.5.output.adapters.cola.adapter_up.bias
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.6.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.6.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.6.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.6.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.6.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.6.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.6.output.adapters.cola.adapter_up.weight
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.6.output.adapters.cola.adapter_up.bias
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.7.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.7.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.7.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.7.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.7.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.7.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.7.output.adapters.cola.adapter_up.weight
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.7.output.adapters.cola.adapter_up.bias
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.8.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.8.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.8.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.8.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.8.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.8.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.8.output.adapters.cola.adapter_up.weight
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.8.output.adapters.cola.adapter_up.bias
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.9.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.9.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.9.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.9.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.9.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.9.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.9.output.adapters.cola.adapter_up.weight
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.9.output.adapters.cola.adapter_up.bias
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.10.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.10.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.10.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.10.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.10.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.10.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.10.output.adapters.cola.adapter_up.weight
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.10.output.adapters.cola.adapter_up.bias
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.11.attention.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.11.attention.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.11.attention.output.adapters.cola.adapter_up.weight
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.11.attention.output.adapters.cola.adapter_up.bias
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.11.output.adapters.cola.adapter_down.0.weight
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.11.output.adapters.cola.adapter_down.0.bias
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.11.output.adapters.cola.adapter_up.weight
+06/01/2024 12:21:17 - INFO - __main__ - bert.encoder.layer.11.output.adapters.cola.adapter_up.bias
+06/01/2024 12:21:17 - INFO - __main__ - heads.cola.1.weight
+06/01/2024 12:21:17 - INFO - __main__ - heads.cola.1.bias
+06/01/2024 12:21:17 - INFO - __main__ - heads.cola.4.weight
+06/01/2024 12:21:17 - INFO - __main__ - heads.cola.4.bias
+06/01/2024 12:21:20 - INFO - __main__ - Sample 3397 of the training set: {'input_ids': [101, 9901, 13303, 2044, 1996, 12383, 1012, 102], 'token_type_ids': [0, 0, 0, 0, 0, 0, 0, 0], 'attention_mask': [1, 1, 1, 1, 1, 1, 1, 1], 'labels': 1}.
+06/01/2024 12:21:20 - INFO - __main__ - Sample 2366 of the training set: {'input_ids': [101, 1996, 3586, 3631, 10647, 1005, 1055, 12277, 1012, 102], 'token_type_ids': [0, 0, 0, 0, 0, 0, 0, 0, 0, 0], 'attention_mask': [1, 1, 1, 1, 1, 1, 1, 1, 1, 1], 'labels': 1}.
+06/01/2024 12:21:20 - INFO - __main__ - Sample 2356 of the training set: {'input_ids': [101, 2057, 19379, 26860, 2094, 4981, 2083, 1996, 4624, 1012, 102], 'token_type_ids': [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0], 'attention_mask': [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1], 'labels': 0}.
+06/01/2024 12:26:23 - INFO - __main__ - f_mu shape : torch.Size([1043, 2])
+06/01/2024 12:26:23 - INFO - __main__ - f_var shape :  torch.Size([1043, 2, 2])
+06/01/2024 12:26:23 - INFO - __main__ - tensor([[-2.9716,  3.2141],
+        [-2.3593,  2.5730],
+        [-1.9422,  2.0817],
+        ...,
+        [-3.9324,  4.1705],
+        [-3.0374,  3.1900],
+        [-1.5928,  1.5935]], device='cuda:0')
+06/01/2024 12:26:23 - INFO - __main__ - tensor([[[ 4.9167,  2.1319],
+         [ 2.1319,  5.0604]],
+        [[ 3.8028,  1.1293],
+         [ 1.1293,  4.0759]],
+        [[ 4.5062, -0.5867],
+         [-0.5867,  5.3611]],
+        ...,
+        [[ 5.2096,  4.3945],
+         [ 4.3945,  5.2706]],
+        [[ 6.9878, -0.8966],
+         [-0.8966,  8.0646]],
+        [[ 9.9758, -7.6343],
+         [-7.6343, 11.9324]]], device='cuda:0')
+06/01/2024 12:26:23 - INFO - __main__ - ***** Completed training *****

outputs/cola/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_0/all_results_la_kron_all_homo_mc_corr_1000.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7fa753ec8c196b6ba25d397655827b50ba5e4e8ab3a0611696974cb2b176b709
+size 51

outputs/cola/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_0/eval_res_la_kron_all_homo_mc_corr_1000.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:54df68e9df6ab9cdfff8670128c4ae7855dd74634433c34c8bba67be1e7133fe
+size 175602

outputs/cola/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_0/gpu_stats_la.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:95e66d4b04c437fd3ccaffc68e04f9fd2e618372223261826928f3b73f44e7c0
+size 6119

outputs/cola/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_1999/all_results_la_kron_all_homo_mc_corr_1000.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e7e4aa22e380a680fd4a19f99c0eb816c1aae5d95049578a40b736bc9e748b8a
+size 49

outputs/cola/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_1999/eval_res_la_kron_all_homo_mc_corr_1000.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:311348bd7650a8f3a355048163b4f943fb66e1e2f0dd3bb51fdeaf84ef29eef8
+size 176263

outputs/cola/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_1999/gpu_stats_la.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c033519eef70ba83c5d56b44f0bbce32998e594d87922adfc87a047d5afdd226
+size 6136

outputs/cola/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_3999/all_results_la_kron_all_homo_mc_corr_1000.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:12595e64dabbe54a88115349f4e3a6060d2960b905e840e2f4f7adc226c3dacf
+size 49

outputs/cola/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_3999/eval_res_la_kron_all_homo_mc_corr_1000.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:18c6f66a36c141b6cf55345c06acc811085e79f70323c696b9b4ef8c8a66fc26
+size 176796

outputs/cola/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_3999/gpu_stats_la.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fbf247548110d6eb743395d6cc995cf4dc124733f6fd2c09e0c22d7d4e360904
+size 6144

outputs/cola/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_5999/all_results_la_kron_all_homo_mc_corr_1000.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7f65b5125b231f4c170f931737ff92430d26d6c425fac07c8e6bd7e8f6b82e45
+size 49

outputs/cola/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_5999/eval_res_la_kron_all_homo_mc_corr_1000.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a2207108a665da35372314f7bf8dcb6793f4632cfa96a3ffb5f38571c3194d27
+size 176990

outputs/cola/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_5999/gpu_stats_la.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9b7a3635831442acc4ebfce084fc82ac522911c3c939c9bcc15e2d2872d3c19d
+size 6155

outputs/cola/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_7999/all_results_la_kron_all_homo_mc_corr_1000.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f583a0ab2f642aa1ff56b5493e1e6845d5bd4d6440091a8dbd30c69223fcd290
+size 49

outputs/cola/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_7999/eval_res_la_kron_all_homo_mc_corr_1000.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e004f76425a6dcabe795fa4f58e43f8473366b1d64aeba5826173b3c97e16bc8
+size 177233

outputs/cola/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_7999/gpu_stats_la.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:949998cdd85f8fe1da2e099e65f3d64761bdf65f9ccb3bac58ebcb7985b18898
+size 6162

outputs/cola/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_9999/all_results_la_kron_all_homo_mc_corr_1000.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4349923e2abe2a9a9e0aec6228bc19283b7531532d5e3089dfb7d93b460c85dd
+size 49

outputs/cola/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_9999/eval_res_la_kron_all_homo_mc_corr_1000.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:55e72b1e1981b619c147da31387e7eddaeeceb3eacb4d3e42ecaf3e0c5325352
+size 177446

outputs/cola/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_9999/gpu_stats_la.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6d0360d311ca735a14bfd39cf6b4fdfdfd9198c0da9f6fe6b494b049d612c4bf
+size 6169

outputs/mrpc/bert-base-uncased_adapterstrain_val_0.0001_42_8_10000/logfile_la_{args.laplace_sub}.log ADDED Viewed

	@@ -0,0 +1,7 @@

+06/01/2024 11:25:34 - INFO - __main__ -  Number of labels detected = 2
+06/01/2024 11:25:34 - INFO - __main__ - ***** Starting script *****
+06/01/2024 11:25:35 - INFO - adapters.heads.model_mixin - Adding head 'default' with config {'head_type': 'masked_lm', 'vocab_size': 30522, 'embedding_size': 768, 'layers': 2, 'activation_function': 'gelu', 'layer_norm': True, 'bias': True, 'shift_labels': False, 'label2id': None}.
+06/01/2024 11:25:36 - INFO - adapters.utils - Attempting to load adapter from source 'hf'...
+06/01/2024 11:25:36 - INFO - adapters.utils - Repo id must be in the form 'repo_name' or 'namespace/repo_name': './outputs/mrpc/bert-base-uncased_adapterstrain_val_0.0001_42_8_10000/step_0'. Use `repo_type` argument if needed.
+06/01/2024 11:25:36 - INFO - adapters.utils - Attempting to load adapter from source 'ah'...
+06/01/2024 11:25:36 - INFO - adapters.utils - No adapter with name './outputs/mrpc/bert-base-uncased_adapterstrain_val_0.0001_42_8_10000/step_0' was found in the adapter index.

outputs/mrpc/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/logfile_la_{args.laplace_sub}.log ADDED Viewed

The diff for this file is too large to render. See raw diff

outputs/mrpc/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_0/all_results_la_kron_all_homo_mc_corr_1000.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f5c340ee078dd34e63f2ece7311b2000c2656dcb82475fc69852cb61dd8480c9
+size 69

outputs/mrpc/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_0/eval_res_la_kron_all_homo_mc_corr_1000.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:238e336de54b22ba2e51b422b5c3e6ffb986047ab9fc3564ae64ba8e22a6fb9b
+size 68667

outputs/mrpc/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_0/gpu_stats_la.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ecfe87259e2e429200d03c344842629eafc4a94ca868a77feed719e295991414
+size 6117

outputs/mrpc/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_1999/all_results_la_kron_all_homo_mc_corr_1000.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d63b62c0874c2f4f8e1b95ad25aaeafd910795ec519b6990474c1a96f9480adc
+size 68

outputs/mrpc/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_1999/eval_res_la_kron_all_homo_mc_corr_1000.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:680d6a81a26decd83b1066d9d1b8b5660e50edc6e5ef8390177dd1b9cd399005
+size 69192

outputs/mrpc/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_1999/gpu_stats_la.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c44b1d5774d7a0140f9490f19c6522dc7ae4ae52a4936f17a97e56260564f5b4
+size 6126

outputs/mrpc/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_3999/all_results_la_kron_all_homo_mc_corr_1000.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ee37011a76c331e5d81afafae436bf65f8ef27864968ebad7db073046f7196f5
+size 68

outputs/mrpc/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_3999/eval_res_la_kron_all_homo_mc_corr_1000.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f65b5d6b860784277d3407fcb662151ef7401237646d22ddd00cde3aa4a5b1e3
+size 69224

outputs/mrpc/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_3999/gpu_stats_la.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e2900938a34c4900220e231392afad9c2c87ea6a93e129ca8747be441d3e321b
+size 6132

outputs/mrpc/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_5999/all_results_la_kron_all_homo_mc_corr_1000.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:05642000bfd35d8399125bc08678dfb01c74e8ae4e34be30bb48c7bc86639405
+size 68

outputs/mrpc/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_5999/eval_res_la_kron_all_homo_mc_corr_1000.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cc986dd29f091adee1a46af3ecd42016a0b00e9e202511f3c88fe036ab119fda
+size 69368

outputs/mrpc/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_5999/gpu_stats_la.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d4ee178a4f8ca7625d30afaefe2284db9288722727900095f5bc46aa86e8fe72
+size 6141

outputs/mrpc/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_7999/all_results_la_kron_all_homo_mc_corr_1000.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b22be691ad6d600e15acf1701ca9d926b42e740f74dab3bb43f6e070056dabd6
+size 68

outputs/mrpc/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_7999/eval_res_la_kron_all_homo_mc_corr_1000.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a851b20df67042973f2242e4af2e08ef5154fa8ec35279ec24902468bbb4697f
+size 69456

outputs/mrpc/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_7999/gpu_stats_la.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:68137da4aa4cba3d12a8a7050809107fc8788963f0121e4bfdecba98f8d9ecd1
+size 6168

outputs/mrpc/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_9999/all_results_la_kron_all_homo_mc_corr_1000.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1f78f933b7b7c9c44ce7d7a5a3e85a7fff35981f2a0bcd28bdbcca11b64f09a6
+size 68

outputs/mrpc/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_9999/eval_res_la_kron_all_homo_mc_corr_1000.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:bb219c2690e703c318aef585ea697a44bc420a0bab5de8820cd841d0afd996e8
+size 69275

outputs/mrpc/bert-base-uncased_adapterstrain_val_0.0001_65_8_10000/step_9999/gpu_stats_la.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7767e31bf735f013d27120195c2ab3738c953460ff0f6ebad7f3764abfe0b79b
+size 6162

outputs/mrpc/bert-base-uncased_adapterstrain_val_5e-05_42_8_10000/logfile_la_{args.laplace_sub}.log ADDED Viewed

	@@ -0,0 +1,10 @@

+06/01/2024 11:24:10 - INFO - __main__ -  Number of labels detected = 2
+06/01/2024 11:24:10 - INFO - __main__ - ***** Starting script *****
+06/01/2024 11:24:16 - INFO - adapters.heads.model_mixin - Adding head 'default' with config {'head_type': 'masked_lm', 'vocab_size': 30522, 'embedding_size': 768, 'layers': 2, 'activation_function': 'gelu', 'layer_norm': True, 'bias': True, 'shift_labels': False, 'label2id': None}.
+06/01/2024 11:24:17 - INFO - adapters.utils - Attempting to load adapter from source 'hf'...
+06/01/2024 11:24:17 - INFO - adapters.utils - Repo id must be in the form 'repo_name' or 'namespace/repo_name': './outputs/mrpc/bert-base-uncased_adapterstrain_val_5e-05_42_8_10000/step_0'. Use `repo_type` argument if needed.
+06/01/2024 11:24:17 - INFO - adapters.utils - Attempting to load adapter from source 'ah'...
+06/01/2024 11:24:18 - INFO - adapters.utils - https://raw.githubusercontent.com/Adapter-Hub/Hub/master/dist/v2/index/bert-base-uncased.json not found in cache or force_download set to True, downloading to /root/.cache/torch/adapters/tmp7fkjbr_f
+06/01/2024 11:24:18 - INFO - adapters.utils - storing https://raw.githubusercontent.com/Adapter-Hub/Hub/master/dist/v2/index/bert-base-uncased.json in cache at /root/.cache/torch/adapters/22e416a3791c0b8e1aafcfac89db490ae05250204ed58e5d81a8645b0726dda0.b141886e1b58ad87e04b024247bf438580086cd7bd78529838848a12d9323e20
+06/01/2024 11:24:18 - INFO - adapters.utils - creating metadata file for /root/.cache/torch/adapters/22e416a3791c0b8e1aafcfac89db490ae05250204ed58e5d81a8645b0726dda0.b141886e1b58ad87e04b024247bf438580086cd7bd78529838848a12d9323e20
+06/01/2024 11:24:18 - INFO - adapters.utils - No adapter with name './outputs/mrpc/bert-base-uncased_adapterstrain_val_5e-05_42_8_10000/step_0' was found in the adapter index.

outputs/mrpc/roberta-base_adapterstrain_val_0.0001_65_8_10000/logfile_la_{args.laplace_sub}.log ADDED Viewed

The diff for this file is too large to render. See raw diff

outputs/mrpc/roberta-base_adapterstrain_val_0.0001_65_8_10000/step_0/all_results_la_kron_all_homo_mc_corr_1000.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:85862ef53cde04fd095621971c40cd6d4aa56cadff8274c52cfddf86adefe180
+size 68

outputs/mrpc/roberta-base_adapterstrain_val_0.0001_65_8_10000/step_0/eval_res_la_kron_all_homo_mc_corr_1000.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e1a9346ab14168a80c973e1a5e3b6b0c6f05eb6b62263987fc724c387cf5061d
+size 68606

outputs/mrpc/roberta-base_adapterstrain_val_0.0001_65_8_10000/step_0/gpu_stats_la.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8875908da7a136b6600fcb2d3ffe61c9a5a8a14a8a36d535486ed9ff8f8c3638
+size 6120

outputs/mrpc/roberta-base_adapterstrain_val_0.0001_65_8_10000/step_1999/all_results_la_kron_all_homo_mc_corr_1000.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ffe9f2bec627fac5d0b50392516d59184df547f09babf0e417e119c429e05f08
+size 68

outputs/mrpc/roberta-base_adapterstrain_val_0.0001_65_8_10000/step_1999/eval_res_la_kron_all_homo_mc_corr_1000.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:78135c57fba98a9328bb1737b3062ac46ab32fdffb55fad82ef0fa5b729fa354
+size 69312

outputs/mrpc/roberta-base_adapterstrain_val_0.0001_65_8_10000/step_1999/gpu_stats_la.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:15e3619ce929c748a3e942288b03a8049ad12664e6dc2539b41f78c11773fd28
+size 6135

outputs/mrpc/roberta-base_adapterstrain_val_0.0001_65_8_10000/step_3999/all_results_la_kron_all_homo_mc_corr_1000.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1683d8b9f46dedb78e1f52b1461afd9ca4fce40efc968789f3349f99200edf7b
+size 68

outputs/mrpc/roberta-base_adapterstrain_val_0.0001_65_8_10000/step_3999/eval_res_la_kron_all_homo_mc_corr_1000.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:26ab816f2f13ecc0b1092f1bd232250458c175b0b2b1be4d215087dc87484083
+size 69609