zhaospei commited on
Commit
691abb1
·
verified ·
1 Parent(s): 0c80770

Upload 5 files

Browse files
Files changed (5) hide show
  1. README.md +52 -3
  2. config.json +48 -0
  3. preprocessor_config.json +17 -0
  4. pytorch_model.bin +3 -0
  5. training_args.bin +3 -0
README.md CHANGED
@@ -1,3 +1,52 @@
1
- ---
2
- license: mit
3
- ---
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ # 🖼️ Mô hình Phân loại Ảnh - ViT Fine-tuned trên CIFAR-10
2
+
3
+ ## 📝 Mô tả
4
+ Đây là mô hình Vision Transformer (ViT) được fine-tuned từ mô hình khác trên tập dữ liệu CIFAR-10. Mô hình được huấn luyện để phân loại ảnh vào 10 lớp khác nhau, mỗi lớp đại diện cho một danh mục đối tượng cụ thể.
5
+
6
+ ## 📌 Nhiệm vụ
7
+ Loại bài toán: Phân loại ảnh (Image Classification)
8
+ Số lớp: 10 (Tương ứng nhãn) CIFAR-10
9
+
10
+ ## 📥 Đầu vào
11
+ Định dạng: Ảnh màu RGB
12
+ Kích thước ảnh: 224x224 pixels
13
+
14
+ ## 📤 Đầu ra
15
+ Định dạng: Xác suất cho mỗi lớp (logits)
16
+ Kiểu dữ liệu: Tensor có kích thước [batch_size, 10]
17
+ Ý nghĩa: Xác suất dự đoán cho từng lớp trong 10 lớp của CIFAR-10
18
+
19
+ 🛠 Yêu cầu thư viện
20
+ Cài đặt các thư viện cần thiết bằng:
21
+
22
+ ```bash
23
+ pip install transformers torch torchvision
24
+ ```
25
+
26
+ ## 🧪 Cách sử dụng mô hình
27
+
28
+ Dưới đây là ví dụ về cách sử dụng mô hình để phân loại một ảnh:
29
+
30
+ ```python
31
+ import torch
32
+ from transformers import ViTForImageClassification, ViTImageProcessor
33
+ from PIL import Image
34
+
35
+ # Tải ảnh cần phân loại
36
+ image = Image.open("path_to_your_image.jpg")
37
+
38
+ # Tải processor và mô hình từ Hugging Face
39
+ processor = ViTImageProcessor.from_pretrained("zhaospei/Model_7")
40
+ model = ViTForImageClassification.from_pretrained("zhaospei/Model_7")
41
+
42
+ # Xử lý đầu vào
43
+ inputs = processor(images=image, return_tensors="pt")
44
+
45
+ # Dự đoán với mô hình
46
+ with torch.no_grad():
47
+ outputs = model(**inputs)
48
+ logits = outputs.logits
49
+ predicted_label = logits.argmax(-1).item()
50
+
51
+ print(f"Nhãn dự đoán: {model.config.id2label[predicted_label]}")
52
+ ```
config.json ADDED
@@ -0,0 +1,48 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "_name_or_path": "google/vit-base-patch16-224",
3
+ "architectures": [
4
+ "ViTForImageClassification"
5
+ ],
6
+ "attention_probs_dropout_prob": 0.0,
7
+ "encoder_stride": 16,
8
+ "hidden_act": "gelu",
9
+ "hidden_dropout_prob": 0.0,
10
+ "hidden_size": 768,
11
+ "id2label": {
12
+ "0": "airplane",
13
+ "1": "automobile",
14
+ "2": "bird",
15
+ "3": "cat",
16
+ "4": "deer",
17
+ "5": "dog",
18
+ "6": "frog",
19
+ "7": "horse",
20
+ "8": "ship",
21
+ "9": "truck"
22
+ },
23
+ "image_size": 224,
24
+ "initializer_range": 0.02,
25
+ "intermediate_size": 3072,
26
+ "label2id": {
27
+ "airplane": 0,
28
+ "automobile": 1,
29
+ "bird": 2,
30
+ "cat": 3,
31
+ "deer": 4,
32
+ "dog": 5,
33
+ "frog": 6,
34
+ "horse": 7,
35
+ "ship": 8,
36
+ "truck": 9
37
+ },
38
+ "layer_norm_eps": 1e-12,
39
+ "model_type": "vit",
40
+ "num_attention_heads": 12,
41
+ "num_channels": 3,
42
+ "num_hidden_layers": 12,
43
+ "patch_size": 16,
44
+ "problem_type": "single_label_classification",
45
+ "qkv_bias": true,
46
+ "torch_dtype": "float32",
47
+ "transformers_version": "4.22.1"
48
+ }
preprocessor_config.json ADDED
@@ -0,0 +1,17 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "do_normalize": true,
3
+ "do_resize": true,
4
+ "feature_extractor_type": "ViTFeatureExtractor",
5
+ "image_mean": [
6
+ 0.5,
7
+ 0.5,
8
+ 0.5
9
+ ],
10
+ "image_std": [
11
+ 0.5,
12
+ 0.5,
13
+ 0.5
14
+ ],
15
+ "resample": 2,
16
+ "size": 224
17
+ }
pytorch_model.bin ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:92c692e53bf22eeaf5cb06bc59e3d5b7ff8d3a79d38f5f3a17283596f25f06bf
3
+ size 343291569
training_args.bin ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:85de8c2443edd63bab0d98c36637cbba93f17087b2ab26eec8dbc45cf21313eb
3
+ size 3375