Update README.md

Files changed (1) hide show

README.md CHANGED Viewed

@@ -1,21 +1,3 @@
----
-license: mit
-datasets:
-- ILSVRC/imagenet-1k
-language:
-- en
-tags:
-- image-classification
-- transformers
-- vit
-- vision transformer
-- tensorflow
-- vision
-metrics:
-- bleu
-library_name: transformers
-pipeline_tag: image-classification
----
 Model Overview:
 The Vision Transformer (ViT) is a transformer encoder model designed for image recognition tasks. It was pretrained on a large dataset of 14 million images and 21,843 classes known as ImageNet-21k, and fine-tuned on ImageNet 2012, which consists of 1 million images across 1,000 classes.




















1
2	Model Overview:
3	The Vision Transformer (ViT) is a transformer encoder model designed for image recognition tasks. It was pretrained on a large dataset of 14 million images and 21,843 classes known as ImageNet-21k, and fine-tuned on ImageNet 2012, which consists of 1 million images across 1,000 classes.