| {'batch_size_per_replica': 8, | |
| 'data_num': -1, | |
| 'deepspeed': None, | |
| 'epochs': 3, | |
| 'eval_step': 500, | |
| 'fp16': False, | |
| 'grad_acc_steps': 4, | |
| 'load': 'Salesforce/codet5p-220m', | |
| 'local_rank': -1, | |
| 'log_freq': 10, | |
| 'lr': 5e-05, | |
| 'lr_warmup_steps': 200, | |
| 'max_source_len': 1024, | |
| 'max_target_len': 50, | |
| 'save_dir': 'saved_models/q90cce', | |
| 'save_freq': 500, | |
| 'train_dataset': 'dataset/funcom_q90_train.json', | |
| 'val_dataset': 'dataset/funcom_q90_val.json'} |