yutengz
/

Action2Vision

StableDiffusionInstructPix2PixPipeline

Model card Files Files and versions

Metrics Training metrics Community

yutengz commited on May 5, 2025

Commit

a9c0855

·

verified ·

1 Parent(s): 1437cf7

Create README.md

Files changed (1) hide show

README.md +39 -0

README.md ADDED Viewed

	@@ -0,0 +1,39 @@

+---
+license: mit
+tags:
+- image-to-image
+---
+# ip2p-RoboPredict: InstructPix2Pix Fine-tuning for Robotic Action Frame Prediction
+GitHub: https://github.com/yutengzhang03/ip2p-finetune
+<img src='https://github.com/yutengzhang03/ip2p-finetune/blob/main/img/show-example.png'/>
+## Example
+To use `InstructPix2Pix`, install `diffusers` using `main` for now. The pipeline will be available in the next release
+```bash
+pip install diffusers accelerate safetensors transformers
+```
+```python
+import PIL
+import requests
+import torch
+from diffusers import StableDiffusionInstructPix2PixPipeline, EulerAncestralDiscreteScheduler
+model_id = "yutengz/ip2p-RoboPredict"
+pipe = StableDiffusionInstructPix2PixPipeline.from_pretrained(model_id, torch_dtype=torch.float16, safety_checker=None)
+pipe.to("cuda")
+pipe.scheduler = EulerAncestralDiscreteScheduler.from_config(pipe.scheduler.config)
+url = "https://github.com/yutengzhang03/ip2p-finetune/blob/main/img/source.png"
+def download_image(url):
+    image = PIL.Image.open(requests.get(url, stream=True).raw)
+    image = PIL.ImageOps.exif_transpose(image)
+    image = image.convert("RGB")
+    return image
+image = download_image(url)
+prompt = "turn him into cyborg"
+images = pipe(prompt, image=image, num_inference_steps=10, image_guidance_scale=1).images
+images[0]
+```