|
|
--- |
|
|
datasets: |
|
|
- ILSVRC/imagenet-1k |
|
|
language: |
|
|
- en |
|
|
base_model: |
|
|
- rupeshs/LCM-runwayml-stable-diffusion-v1-5 |
|
|
pipeline_tag: text-to-image |
|
|
tags: |
|
|
- stable-diffusion |
|
|
- imagenet |
|
|
- blip |
|
|
--- |
|
|
|
|
|
--- |
|
|
datasets: |
|
|
- ILSVRC/imagenet-1k |
|
|
base_model: |
|
|
- rupeshs/LCM-runwayml-stable-diffusion-v1-5 |
|
|
pipeline_tag: text-to-image |
|
|
tags: |
|
|
- stable-diffusion-1-5 |
|
|
- imagenet |
|
|
- blip |
|
|
--- |
|
|
|
|
|
# [SD 1.5 - ImageNet-BLIP-Finetune] |
|
|
|
|
|
这是一个在 **ImageNet** 数据集上微调的 **Stable Diffusion 1.5** 模型。 |
|
|
|
|
|
与常规微调不同的是,本模型的训练**没有**使用 ImageNet 原始的单一类别标签(例如 "tench" 或 "goldfish")。相反,我们使用 **BLIP 模型**为 ImageNet 数据库中的每张图片生成了**描述性的文本提示(Prompt)**。 |
|
|
|
|
|
这种方法使得模型能够学习图像与更丰富、更具上下文的文本描述之间的联系,而不仅仅是学习僵硬的类别名称。 |
|
|
|
|
|
## 🚀 如何使用 (How to Use) |
|
|
|
|
|
你可以像使用其他 `diffusers` 库中的 Stable Diffusion pipeline 一样使用这个模型。 |
|
|
|
|
|
首先,确保你安装了必要的库: |
|
|
```bash |
|
|
pip install diffusers transformers torch |