zhaospei
/

Model_14

zhaospei commited on Jun 20, 2025

Commit

ac2fc0e

verified ·

1 Parent(s): f29a863

Update README.md

Files changed (1) hide show

README.md CHANGED Viewed

@@ -1,4 +1,4 @@
-# 🖼️ Mô hình BLIP Image Captioning (Base)
 ##  📝 Giới thiệu
 Mô hình BLIP (Bootstrapping Language–Image Pre‑training) sử dụng Vision Transformer (ViT) để tạo ra mô hình hiểu và mô tả hình ảnh một cách linh hoạt, bao gồm cả các tác vụ như image captioning, image–text retrieval và visual question answering.
 Phiên bản base được fine‑tune trên tập dữ liệu COCO cho nhiệm vụ generate caption, hỗ trợ cả hai chế độ:

+# 🖼️ Mô hình sinh mô tả cho hình ảnh
 ##  📝 Giới thiệu
 Mô hình BLIP (Bootstrapping Language–Image Pre‑training) sử dụng Vision Transformer (ViT) để tạo ra mô hình hiểu và mô tả hình ảnh một cách linh hoạt, bao gồm cả các tác vụ như image captioning, image–text retrieval và visual question answering.
 Phiên bản base được fine‑tune trên tập dữ liệu COCO cho nhiệm vụ generate caption, hỗ trợ cả hai chế độ: