AlienKevin
/

canto_ocr

Model card Files Files and versions

文银龙 commited on Apr 4, 2022

Commit

b1c66ba

·

1 Parent(s): ca5fd54

update

Files changed (2) hide show

README.md +4 -2
eval.py +3 -3

README.md CHANGED Viewed

@@ -35,10 +35,12 @@ python init_custdata_model.py \
     --cust_vocab ./cust-data/vocab.txt \
     --pretrain_model ./weights \
     --cust_data_init_weights_path ./cust-data/weights
-```
 ## cust_vocab 词库文件
 ## pretrain_model 预训练模型权重
-## cut_data_init_weights_path 自定义模型初始化模型权重保存位置
 ### 训练模型
 #### 数据准备,数据结构如下图所示

     --cust_vocab ./cust-data/vocab.txt \
     --pretrain_model ./weights \
     --cust_data_init_weights_path ./cust-data/weights
 ## cust_vocab 词库文件
 ## pretrain_model 预训练模型权重
+## cust_data_init_weights_path 自定义模型初始化模型权重保存位置
+```
 ### 训练模型
 #### 数据准备,数据结构如下图所示

eval.py CHANGED Viewed

@@ -30,7 +30,7 @@ def compute_metrics(pred_str, label_str):
 if __name__ == '__main__':
     parser = argparse.ArgumentParser(description='trocr fine-tune训练')
-    parser.add_argument('--cut_data_init_weights_path', default='./cust-data/weights', type=str,
                         help="初始化训练权重，用于自己数据集上fine-tune权重")
     parser.add_argument('--CUDA_VISIBLE_DEVICES', default='-1', type=str, help="GPU设置")
     parser.add_argument('--test_img', default='test/test.jpg', type=str, help="img path")
@@ -50,11 +50,11 @@ if __name__ == '__main__':
     print("train num:", len(train_paths), "test num:", len(test_paths))
-    processor = TrOCRProcessor.from_pretrained(args.cut_data_init_weights_path)
     vocab = processor.tokenizer.get_vocab()
     vocab_inp = {vocab[key]: key for key in vocab}
-    model = VisionEncoderDecoderModel.from_pretrained(args.cut_data_init_weights_path)
     model.eval()
     model.cuda()

 if __name__ == '__main__':
     parser = argparse.ArgumentParser(description='trocr fine-tune训练')
+    parser.add_argument('--cust_data_init_weights_path', default='./cust-data/weights', type=str,
                         help="初始化训练权重，用于自己数据集上fine-tune权重")
     parser.add_argument('--CUDA_VISIBLE_DEVICES', default='-1', type=str, help="GPU设置")
     parser.add_argument('--test_img', default='test/test.jpg', type=str, help="img path")
     print("train num:", len(train_paths), "test num:", len(test_paths))
+    processor = TrOCRProcessor.from_pretrained(args.cust_data_init_weights_path)
     vocab = processor.tokenizer.get_vocab()
     vocab_inp = {vocab[key]: key for key in vocab}
+    model = VisionEncoderDecoderModel.from_pretrained(args.cust_data_init_weights_path)
     model.eval()
     model.cuda()