Spaces:

CarolineM5
/

BoardGenerator

Sleeping

File size: 5,282 Bytes

38ecdbd
 
 
 
 
 
 
 
 
 
76bee53
990a91c
 
e5dea97
38ecdbd
990a91c
 
 
 
38ecdbd
990a91c
 
 
 
 
 
 
 
 
 
 
 
38ecdbd
990a91c
 
 
 
 
 
 
 
 
e40eff1
38ecdbd
e40eff1
38ecdbd
990a91c
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
b3652cf
 
 
 
7402c4e
 
b3652cf
 
 
 
 
 
 
7402c4e
 
b3652cf
7402c4e
 
 
 
 
 
 
b3652cf
 
 
 
 
7402c4e
 
 
 
 
b3652cf
7402c4e
 
 
 
 
 
 
 
85e2b85
7402c4e
 
 
 
00edf85
7402c4e

# -*- coding: utf-8 -*-
"""

Created on Tue Jun 10 11:16:28 2025



@author: camaac

"""

import gradio as gr
from PIL import Image
import torch
from inference import inference
from diffusers import StableDiffusionInstructPix2PixPipeline, UNet2DModel, AutoencoderKL, DDPMScheduler 
from transformers import CLIPTokenizer, CLIPTextModel, CLIPImageProcessor
import torch.nn as nn

class UNetNoCondWrapper(nn.Module):
    def __init__(self, base_unet: UNet2DModel):
        super().__init__()
        self.unet = base_unet

    def forward(

        self,

        sample,

        timestep,

        encoder_hidden_states=None,    

        added_cond_kwargs=None,        

        cross_attention_kwargs=None,   

        return_dict=False,

        **kwargs                       

    ):
        
        return self.unet(sample, timestep, return_dict=return_dict, **kwargs)

    def __getattr__(self, name):
        if name in ("unet", "forward", "__getstate__", "__setstate__"):
            return super().__getattr__(name)
        return getattr(self.unet, name)
    
    def save_pretrained(self, save_directory, **kwargs):
        # délègue à la vraie instance UNet2DModel
        return self.unet.save_pretrained(save_directory, **kwargs)
    
# device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

device = torch.device('cpu')

model_id = "CarolineM5/InstructPix2Pix_WithoutPrompt"
vae = AutoencoderKL.from_pretrained(model_id, subfolder="vae").to(device)
scheduler = DDPMScheduler.from_pretrained(model_id, subfolder="scheduler")
tokenizer = CLIPTokenizer.from_pretrained(model_id, subfolder="tokenizer")
text_encoder = CLIPTextModel.from_pretrained(model_id, subfolder="text_encoder").to(device)
feature_extractor = CLIPImageProcessor.from_pretrained(model_id, subfolder="feature_extractor")

# 2) Chargez votre UNet non‑conditionné et wrappez‑le
base_unet = UNet2DModel.from_pretrained(model_id, subfolder="unet").to(device)
wrapped_unet = UNetNoCondWrapper(base_unet).to(device)

# 3) Construisez la pipeline manuellement
pipe = StableDiffusionInstructPix2PixPipeline(
    vae=vae,
    text_encoder=text_encoder,
    tokenizer=tokenizer,
    unet=wrapped_unet,
    scheduler=scheduler,
    safety_checker=None,
    feature_extractor=feature_extractor,
)

pipe = pipe.to(torch.float32).to(device)

def gradio_generate(fibers_map: Image.Image,

                    rings_map: Image.Image,

                    num_steps: int) -> Image.Image:
    # 1) uniformiser le mode
    fibers_map = fibers_map.convert("RGB")
    rings_map = rings_map.convert("RGB")


    # 3) appeler l'inference avec la seed
    result_img = inference(pipe,
                           rings_map,
                           fibers_map,
                           num_steps)
    return result_img


iface = gr.Interface(
    fn=gradio_generate,
    inputs=[
        gr.Image(type="pil", label="Fibre orientation map"),
        gr.Image(type="pil", label="Growth ring map"),
        gr.Number(value=10, label="Number of inference steps")
    ],
    outputs=gr.Image(
        type="pil",
        label="Photorealistic wood generated",
        format="png"           # ← force le .png au téléchargement
    ),
    title="Photorealistic wood generator",
    description="""

    Upload :

    1) a fibre orientation map,

    2) a growth ring map.



    Set the number of inference steps.

    Higher values can improve quality but increase processing time.



    The model will return a photo-realistic rendering of the wood that you can download.

    """
)

if __name__ == "__main__":
    iface.launch(server_name="0.0.0.0", server_port=7860, share=True)


# with gr.Blocks() as demo:
#     gr.Markdown("## Photorealistic Wood Generator\nUpload your two maps, run inference, then use the slider to browse steps.")
    
#     with gr.Row():
#         fibers = gr.Image(type="pil", label="Fibre orientation map")
#         rings  = gr.Image(type="pil", label="Growth ring map")
#     steps = gr.Number(value=10, label="Number of inference steps")
#     btn   = gr.Button("Generate")

#     # State pour stocker la liste des images
#     state_images = gr.State([])

#     # Slider pour parcourir
#     slider = gr.Slider(minimum=0, maximum=0, step=1, value=0, interactive=True, label="Step index")
#     # Image affichée
#     display = gr.Image(label="Intermediate result")

#     # 1) Au clique, on génère et on met à jour state + slider + display
#     def run_and_store(fib, ring, num_steps):
#         imgs = inference(pipe, ring,fib,  int(num_steps))
#         # On renvoie : la liste, la nouvelle valeur max du slider, et l’image 0
#         return imgs, gr.update(maximum=len(imgs)-1, value=0), imgs[0]

#     btn.click(
#         fn=run_and_store,
#         inputs=[fibers, rings, steps],
#         outputs=[state_images, slider, display]
#     )

#     # 2) Quand on bouge le slider, on affiche state_images[slider]
#     def select_step(imgs, idx):
#         return imgs[int(idx)]

#     slider.change(
#         fn=select_step,
#         inputs=[state_images, slider],
#         outputs=display
#     )

#     demo.launch()