🌈 Mô hình phân loại hình ảnh

📝 Mô tả

Mô hình này là phiên bản fine-tuned của google/vit-base-patch16-224-in21k trên bộ dữ liệu CIFAR-10 (60.000 ảnh màu 32×32, 10 lớp). Trên tập đánh giá, mô hình đạt: Loss: 0.2564 Accuracy: 97.88

📌 Ứng dụng

Phân loại ảnh CIFAR-10 (10 lớp như: airplane, automobile, bird, cat, …) Dùng để transfer learning cho các tập dữ liệu nhỏ hơn Làm nền tảng cho các thử nghiệm về fine-tuning ViT trên dữ liệu màu sắc nhỏ

📥 Chuẩn bị đầu vào

Ảnh màu RGB Thư viện sẽ xử lý bằng ViTImageProcessor: Resize hình về 224×224 Chuẩn hóa theo mean/std của ImageNet

📤 Đầu ra

Logits tensor kích thước [batch_size, 10] Dùng argmax(-1) để nhận nhãn dự đoán

🛠 Cài đặt

pip install torch torchvision transformers

🧪 Ví dụ sử dụng

import torch
from transformers import ViTForImageClassification, ViTImageProcessor
from PIL import Image

model_name = "zhaospei/Model_16"

processor = ViTImageProcessor.from_pretrained(model_name)
model = ViTForImageClassification.from_pretrained(model_name)

img = Image.open("path/to/cifar10_image.png").convert("RGB")
inputs = processor(img, return_tensors="pt")

with torch.no_grad():
    logits = model(**inputs).logits

pred = logits.argmax(-1).item()
label = model.config.id2label[pred]
print(f"Predicted label: {label} (Index: {pred})")

⚙️ Thông số huấn luyện

Thiết lập Giá trị Learning rate 5e-5 Batch size (train/eval) 32 / 32 Gradient accumulation 4 Total batch size 128 Optimizer Adam (β=(0.9,0.999), ε=1e-8) Scheduler Learning rate linearly giảm (warmup 0.1) Epochs 1 Seed 42 Framework Transformers 4.17.0, PyTorch 1.10.0+cu111

📊 Hiệu quả

Báo cáo accuracy đạt 97.88 % trên tập đánh giá CIFAR-10

Thích hợp để đánh giá khả năng áp dụng ViT ở dữ liệu nhỏ và cải tiến nhanh timemodels

✅ Lưu ý & Mở rộng

Đây là mô hình để demo hoặc baseline, không phù hợp cho trường hợp cần độ chính xác cao hơn (có thể fine-tune thêm)

Dễ dàng kết hợp với các kỹ thuật augment, thêm epochs, hoặc sử dụng data robustness khi cần

Có thể dùng làm backbone để ép nhỏ, kiểm thử OOD, adversarial training, v.v.

Downloads last month: 1

Inference Providers NEW

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support