kaixkhazaki
/

vit_doclaynet_base

Image Classification

document-layout-analysis

document-classification

Model card Files Files and versions

kaixkhazaki commited on Jan 4, 2025

Commit

3850413

·

verified ·

1 Parent(s): 20cb3df

Update README.md

Files changed (1) hide show

README.md +4 -2

README.md CHANGED Viewed

@@ -13,7 +13,7 @@ tags:
 - vit
 - doclaynet
 ---
-# ViT Model for Document Layout Classification
 This model is a fine-tuned Vision Transformer (ViT) for document layout classification based on the DocLayNet dataset.
@@ -38,7 +38,9 @@ DocLayNet is a comprehensive dataset for document layout analysis, containing va
 ## Training procedure
-The training was made with following hyperparameters:
 ```python
 {

 - vit
 - doclaynet
 ---
+# Vision Transformer(ViT) for Document Classification(DocLayNet)
 This model is a fine-tuned Vision Transformer (ViT) for document layout classification based on the DocLayNet dataset.
 ## Training procedure
+Trained for 20 epochs on a single gpu for ~10 mins.
+The training hyperparameters:
 ```python
 {