🖼️ Mô hình Phân loại Ảnh – ResNet‑18 (ImageNet-1K)

📝 Mô tả

Mô hình ResNet‑18 là một kiến trúc CNN với 18 lớp, nổi bật với khả năng học sâu nhờ cơ chế residual connection. Đây là phiên bản được fine‑tuned trên bộ dữ liệu ImageNet-1K, từng giành chiến thắng cuộc thi ILSVRC và COCO 2015.

📌 Mục đích sử dụng

Phân loại ảnh: dự đoán 1000 lớp ImageNet

Transfer learning: làm backbone để fine-tune cho các bài toán cụ thể

Nghiên cứu & sản phẩm: dễ triển khai với tài nguyên vừa phải (11.7 triệu tham số)

📥 Đầu vào

Ảnh RGB. Được xử lý theo AutoImageProcessor: Resize và crop trung tâm về 224×224. Chuẩn hóa: sử dụng mean/std chuẩn ImageNet (trong feature_extractor)

📤 Đầu ra

logits: Tensor có shape [batch_size, 1000] tương ứng xác suất phù hợp với 1000 lớp ImageNet Sử dụng .argmax(-1) để lấy nhãn duy nhất mỗi ảnh

🛠 Cài đặt

pip install torch torchvision transformers

🧪 Cách sử dụng

Ví dụ phân loại ảnh đơn giản:

from transformers import AutoImageProcessor, AutoModelForImageClassification
import torch
from PIL import Image

# 1. Tải processor và mô hình
processor = AutoImageProcessor.from_pretrained("zhaospei/Model_12")
model = AutoModelForImageClassification.from_pretrained("zhaospei/Model_12")

# 2. Chuẩn bị ảnh
img = Image.open("path/to/image.jpg").convert("RGB")

# 3. Tiền xử lý
inputs = processor(img, return_tensors="pt")

# 4. Inference
with torch.no_grad():
    outputs = model(**inputs)
    logits = outputs.logits

# 5. Kết quả
idx = logits.argmax(-1).item()
print("Predicted class:", model.config.id2label[idx])

📊 Thông số mô hình

Params: ~11.7 triệu Kiến trúc: ResNet với 4 block residual Đầu vào default: [3, 224, 224] RGB Pretrained on: ImageNet‑1K

Downloads last month: 1

Safetensors

Model size

11.7M params

Tensor type

F32

Inference Providers NEW

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support