End of training

Browse files

Files changed (8) hide show

README.md +81 -0
logs/events.out.tfevents.1733254332.63d9064179a3.23.3 +2 -2
model.safetensors +1 -1
preprocessor_config.json +13 -0
special_tokens_map.json +37 -0
tokenizer.json +0 -0
tokenizer_config.json +80 -0
vocab.txt +0 -0

README.md ADDED Viewed

	@@ -0,0 +1,81 @@

+---
+library_name: transformers
+license: mit
+base_model: microsoft/layoutlm-base-uncased
+tags:
+- generated_from_trainer
+model-index:
+- name: layoutlm-mcocr
+  results: []
+---
+<!-- This model card has been generated automatically according to the information the Trainer had access to. You
+should probably proofread and complete it, then remove this comment. -->
+# layoutlm-mcocr
+This model is a fine-tuned version of [microsoft/layoutlm-base-uncased](https://huggingface.co/microsoft/layoutlm-base-uncased) on an unknown dataset.
+It achieves the following results on the evaluation set:
+- Loss: 0.1783
+- Ddress: {'precision': 0.9259259259259259, 'recall': 0.9259259259259259, 'f1': 0.9259259259259259, 'number': 54}
+- Eller: {'precision': 0.9464285714285714, 'recall': 0.9636363636363636, 'f1': 0.9549549549549549, 'number': 55}
+- Imestamp: {'precision': 1.0, 'recall': 0.9629629629629629, 'f1': 0.9811320754716981, 'number': 54}
+- Otal Cost: {'precision': 0.9636363636363636, 'recall': 0.9636363636363636, 'f1': 0.9636363636363636, 'number': 55}
+- Overall Precision: 0.9585
+- Overall Recall: 0.9541
+- Overall F1: 0.9563
+- Overall Accuracy: 0.9787
+## Model description
+More information needed
+## Intended uses & limitations
+More information needed
+## Training and evaluation data
+More information needed
+## Training procedure
+### Training hyperparameters
+The following hyperparameters were used during training:
+- learning_rate: 3e-05
+- train_batch_size: 16
+- eval_batch_size: 8
+- seed: 42
+- optimizer: Use adamw_torch with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
+- lr_scheduler_type: linear
+- num_epochs: 15
+- mixed_precision_training: Native AMP
+### Training results
+| Training Loss | Epoch | Step | Validation Loss | Ddress                                                                                                  | Eller                                                                                                   | Imestamp                                                                                 | Otal Cost                                                                                               | Overall Precision | Overall Recall | Overall F1 | Overall Accuracy |
+|:-------------:|:-----:|:----:|:---------------:|:-------------------------------------------------------------------------------------------------------:|:-------------------------------------------------------------------------------------------------------:|:----------------------------------------------------------------------------------------:|:-------------------------------------------------------------------------------------------------------:|:-----------------:|:--------------:|:----------:|:----------------:|
+| 0.0001        | 1.0   | 7    | 0.1773          | {'precision': 0.9454545454545454, 'recall': 0.9629629629629629, 'f1': 0.9541284403669724, 'number': 54} | {'precision': 0.9814814814814815, 'recall': 0.9636363636363636, 'f1': 0.9724770642201834, 'number': 55} | {'precision': 1.0, 'recall': 0.9629629629629629, 'f1': 0.9811320754716981, 'number': 54} | {'precision': 0.9814814814814815, 'recall': 0.9636363636363636, 'f1': 0.9724770642201834, 'number': 55} | 0.9767            | 0.9633         | 0.9700     | 0.9817           |
+| 0.0           | 2.0   | 14   | 0.1568          | {'precision': 0.9454545454545454, 'recall': 0.9629629629629629, 'f1': 0.9541284403669724, 'number': 54} | {'precision': 0.9814814814814815, 'recall': 0.9636363636363636, 'f1': 0.9724770642201834, 'number': 55} | {'precision': 1.0, 'recall': 0.9629629629629629, 'f1': 0.9811320754716981, 'number': 54} | {'precision': 0.9814814814814815, 'recall': 0.9636363636363636, 'f1': 0.9724770642201834, 'number': 55} | 0.9767            | 0.9633         | 0.9700     | 0.9817           |
+| 0.0           | 3.0   | 21   | 0.1664          | {'precision': 0.9454545454545454, 'recall': 0.9629629629629629, 'f1': 0.9541284403669724, 'number': 54} | {'precision': 0.9814814814814815, 'recall': 0.9636363636363636, 'f1': 0.9724770642201834, 'number': 55} | {'precision': 1.0, 'recall': 0.9629629629629629, 'f1': 0.9811320754716981, 'number': 54} | {'precision': 0.9814814814814815, 'recall': 0.9636363636363636, 'f1': 0.9724770642201834, 'number': 55} | 0.9767            | 0.9633         | 0.9700     | 0.9817           |
+| 0.0           | 4.0   | 28   | 0.1649          | {'precision': 0.9454545454545454, 'recall': 0.9629629629629629, 'f1': 0.9541284403669724, 'number': 54} | {'precision': 0.9814814814814815, 'recall': 0.9636363636363636, 'f1': 0.9724770642201834, 'number': 55} | {'precision': 1.0, 'recall': 0.9629629629629629, 'f1': 0.9811320754716981, 'number': 54} | {'precision': 0.9814814814814815, 'recall': 0.9636363636363636, 'f1': 0.9724770642201834, 'number': 55} | 0.9767            | 0.9633         | 0.9700     | 0.9817           |
+| 0.0           | 5.0   | 35   | 0.1713          | {'precision': 0.9454545454545454, 'recall': 0.9629629629629629, 'f1': 0.9541284403669724, 'number': 54} | {'precision': 0.9814814814814815, 'recall': 0.9636363636363636, 'f1': 0.9724770642201834, 'number': 55} | {'precision': 1.0, 'recall': 0.9629629629629629, 'f1': 0.9811320754716981, 'number': 54} | {'precision': 0.9814814814814815, 'recall': 0.9636363636363636, 'f1': 0.9724770642201834, 'number': 55} | 0.9767            | 0.9633         | 0.9700     | 0.9817           |
+| 0.0           | 6.0   | 42   | 0.1678          | {'precision': 0.9454545454545454, 'recall': 0.9629629629629629, 'f1': 0.9541284403669724, 'number': 54} | {'precision': 0.9814814814814815, 'recall': 0.9636363636363636, 'f1': 0.9724770642201834, 'number': 55} | {'precision': 1.0, 'recall': 0.9629629629629629, 'f1': 0.9811320754716981, 'number': 54} | {'precision': 0.9636363636363636, 'recall': 0.9636363636363636, 'f1': 0.9636363636363636, 'number': 55} | 0.9722            | 0.9633         | 0.9677     | 0.9817           |
+| 0.0           | 7.0   | 49   | 0.1669          | {'precision': 0.9454545454545454, 'recall': 0.9629629629629629, 'f1': 0.9541284403669724, 'number': 54} | {'precision': 0.9814814814814815, 'recall': 0.9636363636363636, 'f1': 0.9724770642201834, 'number': 55} | {'precision': 1.0, 'recall': 0.9629629629629629, 'f1': 0.9811320754716981, 'number': 54} | {'precision': 0.9636363636363636, 'recall': 0.9636363636363636, 'f1': 0.9636363636363636, 'number': 55} | 0.9722            | 0.9633         | 0.9677     | 0.9817           |
+| 0.0           | 8.0   | 56   | 0.1690          | {'precision': 0.9454545454545454, 'recall': 0.9629629629629629, 'f1': 0.9541284403669724, 'number': 54} | {'precision': 0.9814814814814815, 'recall': 0.9636363636363636, 'f1': 0.9724770642201834, 'number': 55} | {'precision': 1.0, 'recall': 0.9629629629629629, 'f1': 0.9811320754716981, 'number': 54} | {'precision': 0.9636363636363636, 'recall': 0.9636363636363636, 'f1': 0.9636363636363636, 'number': 55} | 0.9722            | 0.9633         | 0.9677     | 0.9817           |
+| 0.0           | 9.0   | 63   | 0.1686          | {'precision': 0.9629629629629629, 'recall': 0.9629629629629629, 'f1': 0.9629629629629629, 'number': 54} | {'precision': 0.9814814814814815, 'recall': 0.9636363636363636, 'f1': 0.9724770642201834, 'number': 55} | {'precision': 1.0, 'recall': 0.9629629629629629, 'f1': 0.9811320754716981, 'number': 54} | {'precision': 0.9636363636363636, 'recall': 0.9636363636363636, 'f1': 0.9636363636363636, 'number': 55} | 0.9767            | 0.9633         | 0.9700     | 0.9848           |
+| 0.0           | 10.0  | 70   | 0.1718          | {'precision': 0.9444444444444444, 'recall': 0.9444444444444444, 'f1': 0.9444444444444444, 'number': 54} | {'precision': 0.9636363636363636, 'recall': 0.9636363636363636, 'f1': 0.9636363636363636, 'number': 55} | {'precision': 1.0, 'recall': 0.9629629629629629, 'f1': 0.9811320754716981, 'number': 54} | {'precision': 0.9636363636363636, 'recall': 0.9636363636363636, 'f1': 0.9636363636363636, 'number': 55} | 0.9676            | 0.9587         | 0.9631     | 0.9817           |
+| 0.0           | 11.0  | 77   | 0.1893          | {'precision': 0.9259259259259259, 'recall': 0.9259259259259259, 'f1': 0.9259259259259259, 'number': 54} | {'precision': 0.9464285714285714, 'recall': 0.9636363636363636, 'f1': 0.9549549549549549, 'number': 55} | {'precision': 1.0, 'recall': 0.9629629629629629, 'f1': 0.9811320754716981, 'number': 54} | {'precision': 0.9636363636363636, 'recall': 0.9636363636363636, 'f1': 0.9636363636363636, 'number': 55} | 0.9585            | 0.9541         | 0.9563     | 0.9787           |
+| 0.0           | 12.0  | 84   | 0.1943          | {'precision': 0.9259259259259259, 'recall': 0.9259259259259259, 'f1': 0.9259259259259259, 'number': 54} | {'precision': 0.9464285714285714, 'recall': 0.9636363636363636, 'f1': 0.9549549549549549, 'number': 55} | {'precision': 1.0, 'recall': 0.9629629629629629, 'f1': 0.9811320754716981, 'number': 54} | {'precision': 0.9636363636363636, 'recall': 0.9636363636363636, 'f1': 0.9636363636363636, 'number': 55} | 0.9585            | 0.9541         | 0.9563     | 0.9787           |
+| 0.0           | 13.0  | 91   | 0.1914          | {'precision': 0.9259259259259259, 'recall': 0.9259259259259259, 'f1': 0.9259259259259259, 'number': 54} | {'precision': 0.9464285714285714, 'recall': 0.9636363636363636, 'f1': 0.9549549549549549, 'number': 55} | {'precision': 1.0, 'recall': 0.9629629629629629, 'f1': 0.9811320754716981, 'number': 54} | {'precision': 0.9636363636363636, 'recall': 0.9636363636363636, 'f1': 0.9636363636363636, 'number': 55} | 0.9585            | 0.9541         | 0.9563     | 0.9787           |
+| 0.0           | 14.0  | 98   | 0.1835          | {'precision': 0.9259259259259259, 'recall': 0.9259259259259259, 'f1': 0.9259259259259259, 'number': 54} | {'precision': 0.9464285714285714, 'recall': 0.9636363636363636, 'f1': 0.9549549549549549, 'number': 55} | {'precision': 1.0, 'recall': 0.9629629629629629, 'f1': 0.9811320754716981, 'number': 54} | {'precision': 0.9636363636363636, 'recall': 0.9636363636363636, 'f1': 0.9636363636363636, 'number': 55} | 0.9585            | 0.9541         | 0.9563     | 0.9787           |
+| 0.0           | 15.0  | 105  | 0.1783          | {'precision': 0.9259259259259259, 'recall': 0.9259259259259259, 'f1': 0.9259259259259259, 'number': 54} | {'precision': 0.9464285714285714, 'recall': 0.9636363636363636, 'f1': 0.9549549549549549, 'number': 55} | {'precision': 1.0, 'recall': 0.9629629629629629, 'f1': 0.9811320754716981, 'number': 54} | {'precision': 0.9636363636363636, 'recall': 0.9636363636363636, 'f1': 0.9636363636363636, 'number': 55} | 0.9585            | 0.9541         | 0.9563     | 0.9787           |
+### Framework versions
+- Transformers 4.46.3
+- Pytorch 2.4.0
+- Datasets 3.1.0
+- Tokenizers 0.20.3

logs/events.out.tfevents.1733254332.63d9064179a3.23.3 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:28e5d13b464f1eb9c5cd2ec37c221b90e7104a6b4fe246c392c4d1e86ac2604b
-size 14357

 version https://git-lfs.github.com/spec/v1
+oid sha256:51cbb2ea3a9eb7994dc2c3e018fbd0229924a063c90f86913491ba7350feb764
+size 16109

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:35a22fd1063ecebd52d3c60cf5cd27f78ea11a597371f3458bb084c8ebbc3b88
 size 450548984

 version https://git-lfs.github.com/spec/v1
+oid sha256:f78c7ea80d77912d050b8d68d104623cf389761498442e65dc4599b397fcff72
 size 450548984

preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,13 @@

+{
+  "apply_ocr": true,
+  "do_resize": true,
+  "image_processor_type": "LayoutLMv2ImageProcessor",
+  "ocr_lang": null,
+  "processor_class": "LayoutLMv2Processor",
+  "resample": 2,
+  "size": {
+    "height": 224,
+    "width": 224
+  },
+  "tesseract_config": ""
+}

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "cls_token": {
+    "content": "[CLS]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "mask_token": {
+    "content": "[MASK]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": {
+    "content": "[PAD]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "sep_token": {
+    "content": "[SEP]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "unk_token": {
+    "content": "[UNK]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  }
+}

tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,80 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "[PAD]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "100": {
+      "content": "[UNK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "101": {
+      "content": "[CLS]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "102": {
+      "content": "[SEP]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "103": {
+      "content": "[MASK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "additional_special_tokens": [],
+  "apply_ocr": false,
+  "clean_up_tokenization_spaces": false,
+  "cls_token": "[CLS]",
+  "cls_token_box": [
+    0,
+    0,
+    0,
+    0
+  ],
+  "do_basic_tokenize": true,
+  "do_lower_case": true,
+  "mask_token": "[MASK]",
+  "model_max_length": 512,
+  "never_split": null,
+  "only_label_first_subword": true,
+  "pad_token": "[PAD]",
+  "pad_token_box": [
+    0,
+    0,
+    0,
+    0
+  ],
+  "pad_token_label": -100,
+  "processor_class": "LayoutLMv2Processor",
+  "sep_token": "[SEP]",
+  "sep_token_box": [
+    1000,
+    1000,
+    1000,
+    1000
+  ],
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "LayoutLMv2Tokenizer",
+  "unk_token": "[UNK]"
+}

vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff