import argparse

def parse_opt():
    parser = argparse.ArgumentParser()
    # Overall settings
    parser.add_argument('--mode', type=str, default='train')
    parser.add_argument('--video_name', type=str, default=None, help='Name of the single video to evaluate')
    parser.add_argument('--video_path', type=str, default='', help='Path to the input video file for visualization')
    parser.add_argument('--checkpoint_path', type=str, default='./checkpoint')
    parser.add_argument('--segment_size', type=int, default=64)
    parser.add_argument('--anchors', type=str, default='2,4,6,8,12,16')
    parser.add_argument('--seed', default=7, type=int, help='random seed for reproducibility')

    # Overall Dataset settings
    parser.add_argument('--num_of_class', type=int, default=23)
    parser.add_argument('--data_format', type=str, default="npz_i3d")
    parser.add_argument('--data_rescale', default=False, action='store_true')
    parser.add_argument('--predefined_fps', default=None, type=float)
    parser.add_argument('--rgb_only', default=False, action='store_true')
    parser.add_argument('--video_anno', type=str, default="./data/egtea_annotations_split{}.json")
    parser.add_argument('--video_feature_all_train', type=str, default="./data/I3D/")
    parser.add_argument('--video_feature_all_test', type=str, default="./data/I3D/")
    parser.add_argument('--setup', type=str, default="")
    parser.add_argument('--exp', type=str, default="01")
    parser.add_argument('--split', type=str, default="1")

    # Network
    parser.add_argument('--feat_dim', type=int, default=2048)
    parser.add_argument('--hidden_dim', type=int, default=1024)
    parser.add_argument('--out_dim', type=int, default=23)
    parser.add_argument('--enc_layer', type=int, default=3)
    parser.add_argument('--enc_head', type=int, default=8)
    parser.add_argument('--dec_layer', type=int, default=5)
    parser.add_argument('--dec_head', type=int, default=4)

    # Training settings
    parser.add_argument('--batch_size', type=int, default=128)
    parser.add_argument('--lr', type=float, default=1e-4)
    parser.add_argument('--weight_decay', type=float, default=1e-4)
    parser.add_argument('--epoch', type=int, default=5)
    parser.add_argument('--lr_step', type=int, default=3)

    # Post processing
    parser.add_argument('--alpha', type=float, default=1)
    parser.add_argument('--beta', type=float, default=1)
    parser.add_argument('--gamma', type=float, default=0.2)
    parser.add_argument('--pptype', type=str, default="net")
    parser.add_argument('--pos_threshold', type=float, default=0.5)
    parser.add_argument('--sup_threshold', type=float, default=0.1)
    parser.add_argument('--threshold', type=float, default=0.1)
    parser.add_argument('--inference_subset', type=str, default="test")
    parser.add_argument('--soft_nms', type=float, default=0.3)
    parser.add_argument('--video_len_file', type=str, default="./output/video_len_{}.json")
    parser.add_argument('--proposal_label_file', type=str, default="./output/proposal_label_{}.h5")
    parser.add_argument('--suppress_label_file', type=str, default="./output/suppress_label_{}.h5")
    parser.add_argument('--suppress_result_file', type=str, default="./output/suppress_result{}.h5")
    parser.add_argument('--frame_result_file', type=str, default="./output/frame_result{}.h5")
    parser.add_argument('--result_file', type=str, default="./output/result_proposal{}.json")
    parser.add_argument('--wterm', type=bool, default=False)

    args = parser.parse_args()
    return args