| # import argparse | |
| # def parse_opt(): | |
| # parser = argparse.ArgumentParser() | |
| # # Overall settings | |
| # parser.add_argument('--mode', type=str, default='train') | |
| # parser.add_argument('--video_name', type=str, default=None, help='Name of the single video to evaluate') | |
| # parser.add_argument('--video_path', type=str, default='', help='Path to the input video file for visualization') | |
| # parser.add_argument('--checkpoint_path', type=str, default='./checkpoint') | |
| # parser.add_argument('--segment_size', type=int, default=64) | |
| # parser.add_argument('--anchors', type=str, default='2,4,6,8,12,16') | |
| # parser.add_argument('--seed', default=7, type=int, help='random seed for reproducibility') | |
| # # Overall Dataset settings | |
| # parser.add_argument('--num_of_class', type=int, default=23) | |
| # parser.add_argument('--data_format', type=str, default="npz_i3d") | |
| # parser.add_argument('--data_rescale', default=False, action='store_true') | |
| # parser.add_argument('--predefined_fps', default=None, type=float) | |
| # parser.add_argument('--rgb_only', default=False, action='store_true') | |
| # parser.add_argument('--video_anno', type=str, default="./data/egtea_annotations_split{}.json") | |
| # parser.add_argument('--video_feature_all_train', type=str, default="./data/I3D/") | |
| # parser.add_argument('--video_feature_all_test', type=str, default="./data/I3D/") | |
| # parser.add_argument('--setup', type=str, default="") | |
| # parser.add_argument('--exp', type=str, default="01") | |
| # parser.add_argument('--split', type=str, default="1") | |
| # # Network | |
| # parser.add_argument('--feat_dim', type=int, default=2048) | |
| # parser.add_argument('--hidden_dim', type=int, default=1024) | |
| # parser.add_argument('--out_dim', type=int, default=23) | |
| # parser.add_argument('--enc_layer', type=int, default=3) | |
| # parser.add_argument('--enc_head', type=int, default=8) | |
| # parser.add_argument('--dec_layer', type=int, default=5) | |
| # parser.add_argument('--dec_head', type=int, default=4) | |
| # # Training settings | |
| # parser.add_argument('--batch_size', type=int, default=128) | |
| # parser.add_argument('--lr', type=float, default=1e-4) | |
| # parser.add_argument('--weight_decay', type=float, default=1e-4) | |
| # parser.add_argument('--epoch', type=int, default=5) | |
| # parser.add_argument('--lr_step', type=int, default=3) | |
| # # Post processing | |
| # parser.add_argument('--alpha', type=float, default=1) | |
| # parser.add_argument('--beta', type=float, default=1) | |
| # parser.add_argument('--gamma', type=float, default=0.2) | |
| # parser.add_argument('--pptype', type=str, default="net") | |
| # parser.add_argument('--pos_threshold', type=float, default=0.5) | |
| # parser.add_argument('--sup_threshold', type=float, default=0.1) | |
| # parser.add_argument('--threshold', type=float, default=0.1) | |
| # parser.add_argument('--inference_subset', type=str, default="test") | |
| # parser.add_argument('--soft_nms', type=float, default=0.3) | |
| # parser.add_argument('--video_len_file', type=str, default="./output/video_len_{}.json") | |
| # parser.add_argument('--proposal_label_file', type=str, default="./output/proposal_label_{}.h5") | |
| # parser.add_argument('--suppress_label_file', type=str, default="./output/suppress_label_{}.h5") | |
| # parser.add_argument('--suppress_result_file', type=str, default="./output/suppress_result{}.h5") | |
| # parser.add_argument('--frame_result_file', type=str, default="./output/frame_result{}.h5") | |
| # parser.add_argument('--result_file', type=str, default="./output/result_proposal{}.json") | |
| # parser.add_argument('--wterm', type=bool, default=False) | |
| # args = parser.parse_args() | |
| # return args | |
| import argparse | |
| import os | |
| def parse_opt(): | |
| parser = argparse.ArgumentParser() | |
| parser.add_argument('--video_anno', type=str, default=os.path.join(os.getcwd(), 'data', 'annotations.json')) | |
| parser.add_argument('--video_path', type=str, default=os.path.join(os.getcwd(), 'data', 'videos', 'test_video.mp4')) | |
| parser.add_argument('--video_feature_all_test', type=str, default=os.path.join(os.getcwd(), 'data', 'features') + os.sep) | |
| parser.add_argument('--video_len_file', type=str, default=os.path.join(os.getcwd(), 'data', 'video_len_{}.json')) | |
| parser.add_argument('--proposal_label_file', type=str, default=os.path.join(os.getcwd(), 'data', 'proposal_label_{}.h5')) | |
| parser.add_argument('--suppress_label_file', type=str, default=os.path.join(os.getcwd(), 'data', 'suppress_label_{}.h5')) | |
| parser.add_argument('--checkpoint_path', type=str, default=os.path.join(os.getcwd(), 'checkpoints')) | |
| parser.add_argument('--result_file', type=str, default=os.path.join(os.getcwd(), 'results', 'result_{}.json')) | |
| parser.add_argument('--frame_result_file', type=str, default=os.path.join(os.getcwd(), 'results', 'frame_result_{}.h5')) | |
| parser.add_argument('--batch_size', type=int, default=1) | |
| parser.add_argument('--gradio', type=bool, default=False) | |
| parser.add_argument('--exp', type=str, default='action_detection') | |
| parser.add_argument('--mode', type=str, default='test') | |
| parser.add_argument('--inference_subset', type=str, default='test') | |
| parser.add_argument('--num_of_class', type=int, default=23) # 22 EGTEA actions + background | |
| parser.add_argument('--segment_size', type=int, default=16) | |
| parser.add_argument('--threshold', type=float, default=0.5) | |
| parser.add_argument('--soft_nms', type=float, default=0.3) | |
| parser.add_argument('--sup_threshold', type=float, default=0.5) | |
| parser.add_argument('--anchors', type=str, default='1,2,4,8,16,32') | |
| parser.add_argument('--feat_dim', type=int, default=2048) # rgb (1024) + flow (1024) | |
| parser.add_argument('--lr', type=float, default=1e-4) | |
| parser.add_argument('--weight_decay', type=float, default=1e-4) | |
| parser.add_argument('--lr_step', type=int, default=10) | |
| parser.add_argument('--epoch', type=int, default=20) | |
| parser.add_argument('--alpha', type=float, default=1.0) | |
| parser.add_argument('--beta', type=float, default=1.0) | |
| parser.add_argument('--gamma', type=float, default=1.0) | |
| parser.add_argument('--seed', type=int, default=42) | |
| parser.add_argument('--pptype', type=str, default='nms') | |
| parser.add_argument('--data_format', type=str, default='npz_i3d') | |
| parser.add_argument('--rgb_only', type=bool, default=False) | |
| parser.add_argument('--predefined_fps', type=int, default=30) | |
| parser.add_argument('--split', type=str, default='test') | |
| parser.add_argument('--setup', type=str, default='default') | |
| parser.add_argument('--data_rescale', type=float, default=1.0) | |
| parser.add_argument('--pos_threshold', type=float, default=0.5) | |
| args = parser.parse_args() | |
| return args |