sunshine-lwt
/

Osprey-7b

Text Generation

Model card Files Files and versions

Add model card for Osprey-7b

#2

by nielsr HF Staff - opened Sep 9, 2025

base: refs/heads/main

←

from: refs/pr/2

Discussion Files changed

Files changed (1) hide show

README.md +18 -0

README.md ADDED Viewed

	@@ -0,0 +1,18 @@

+---
+library_name: transformers
+pipeline_tag: image-text-to-text
+---
+# Osprey: Pixel Understanding with Visual Instruction Tuning
+[Osprey: Pixel Understanding with Visual Instruction Tuning](https://huggingface.co/papers/2312.10032)
+[Code](https://github.com/CircleRadon/Osprey)
+Osprey is a mask-text instruction tuning approach that extends MLLMs by incorporating pixel-wise mask regions into language instructions, enabling **fine-grained visual understanding**. Based on input mask region, Osprey generates semantic descriptions including **short description** and **detailed description**.
+Our Osprey can seamlessly integrate with [SAM](https://github.com/facebookresearch/segment-anything) in point-prompt, box-prompt and segmentation everything modes to generate the semantics associated with specific parts or objects.
+<p align="center" width="100%">
+<img src="https://github.com/CircleRadon/Osprey/raw/main/assets/osprey.png"  width="90%">
+</p>