Spaces:

HReynaud
/

EchoDiffusionDemo

Runtime error

App Files Files Community

HReynaud Anonymous commited on May 25, 2023

Commit

316f1d5

0 Parent(s):

Duplicate from anon-SGXT/echocardiogram-video-diffusion

Browse files

Co-authored-by: Anonymous <anon-SGXT@users.noreply.huggingface.co>

This view is limited to 50 files because it contains too many changes. See raw diff

Files changed (50) hide show

.gitattributes +34 -0
.gitignore +3 -0
README.md +14 -0
app.py +145 -0
echo_images/0X10094BA0A028EAC3.png +0 -0
echo_images/0X1013E8A4864781B.png +0 -0
echo_images/0X12B890B1E2E14CC4.png +0 -0
echo_images/0X13E043A35E3EB490.png +0 -0
echo_images/0X159BDA520C61736A.png +0 -0
echo_images/0X15DA8D60960ABB2B.png +0 -0
echo_images/0X16AF26F9A372EEDE.png +0 -0
echo_images/0X17BC4EF4BF83368B.png +0 -0
echo_images/0X1B379931357428C0.png +0 -0
echo_images/0X1CDD9C054D8FB60D.png +0 -0
echo_images/0X1DF7163A74801695.png +0 -0
echo_images/0X20C397F012441121.png +0 -0
echo_images/0X22A1A8A656653343.png +0 -0
echo_images/0X22D7FDCF2827269E.png +0 -0
echo_images/0X230F00FD0DF5D71C.png +0 -0
echo_images/0X244CAB3550320216.png +0 -0
echo_images/0X24FEF7D294B35A5B.png +0 -0
echo_images/0X25D970C75A57B3F2.png +0 -0
echo_images/0X277FC348812C0E79.png +0 -0
echo_images/0X27836E538BD008A.png +0 -0
echo_images/0X2840438B29E95F1F.png +0 -0
echo_images/0X29A336DCE20541A0.png +0 -0
echo_images/0X29C81728B50A2E6C.png +0 -0
echo_images/0X2A830BC4A3A36A93.png +0 -0
echo_images/0X2AD994F98C491FA6.png +0 -0
echo_images/0X2BB766EF1A13DECC.png +0 -0
echo_images/0X2DA99F9FC1DAD8A9.png +0 -0
echo_images/0X3545F8A008B34ED0.png +0 -0
echo_images/0X36E4468C9E659B89.png +0 -0
echo_images/0X39CA8CC96A5D5E8B.png +0 -0
echo_images/0X3B01B7487E3D81EA.png +0 -0
echo_images/0X3B0D2D527C387A0E.png +0 -0
echo_images/0X3B54A5459841DCE8.png +0 -0
echo_images/0X3B9FBD87EE113D62.png +0 -0
echo_images/0X3BA9F7C9DB0CF55B.png +0 -0
echo_images/0X3DA2B290B58A6540.png +0 -0
echo_images/0X3E2F182038897EA5.png +0 -0
echo_images/0X3F076329C702F768.png +0 -0
echo_images/0X4130EB4CD7ED958B.png +0 -0
echo_images/0X42E8226CA93B7BAC.png +0 -0
echo_images/0X45418C574D97027A.png +0 -0
echo_images/0X45CE057EC2EB577F.png +0 -0
echo_images/0X463A7B7D46C6CA4.png +0 -0
echo_images/0X463C296E8E65DA97.png +0 -0
echo_images/0X46682D67FA3FE237.png +0 -0
echo_images/0X487B52623BC14C25.png +0 -0

.gitattributes ADDED Viewed

	@@ -0,0 +1,34 @@

+*.7z filter=lfs diff=lfs merge=lfs -text
+*.arrow filter=lfs diff=lfs merge=lfs -text
+*.bin filter=lfs diff=lfs merge=lfs -text
+*.bz2 filter=lfs diff=lfs merge=lfs -text
+*.ckpt filter=lfs diff=lfs merge=lfs -text
+*.ftz filter=lfs diff=lfs merge=lfs -text
+*.gz filter=lfs diff=lfs merge=lfs -text
+*.h5 filter=lfs diff=lfs merge=lfs -text
+*.joblib filter=lfs diff=lfs merge=lfs -text
+*.lfs.* filter=lfs diff=lfs merge=lfs -text
+*.mlmodel filter=lfs diff=lfs merge=lfs -text
+*.model filter=lfs diff=lfs merge=lfs -text
+*.msgpack filter=lfs diff=lfs merge=lfs -text
+*.npy filter=lfs diff=lfs merge=lfs -text
+*.npz filter=lfs diff=lfs merge=lfs -text
+*.onnx filter=lfs diff=lfs merge=lfs -text
+*.ot filter=lfs diff=lfs merge=lfs -text
+*.parquet filter=lfs diff=lfs merge=lfs -text
+*.pb filter=lfs diff=lfs merge=lfs -text
+*.pickle filter=lfs diff=lfs merge=lfs -text
+*.pkl filter=lfs diff=lfs merge=lfs -text
+*.pt filter=lfs diff=lfs merge=lfs -text
+*.pth filter=lfs diff=lfs merge=lfs -text
+*.rar filter=lfs diff=lfs merge=lfs -text
+*.safetensors filter=lfs diff=lfs merge=lfs -text
+saved_model/**/* filter=lfs diff=lfs merge=lfs -text
+*.tar.* filter=lfs diff=lfs merge=lfs -text
+*.tflite filter=lfs diff=lfs merge=lfs -text
+*.tgz filter=lfs diff=lfs merge=lfs -text
+*.wasm filter=lfs diff=lfs merge=lfs -text
+*.xz filter=lfs diff=lfs merge=lfs -text
+*.zip filter=lfs diff=lfs merge=lfs -text
+*.zst filter=lfs diff=lfs merge=lfs -text
+*tfevents* filter=lfs diff=lfs merge=lfs -text

.gitignore ADDED Viewed

	@@ -0,0 +1,3 @@

+*.mp4
+*.ipynb
+*__pycache__*

README.md ADDED Viewed

	@@ -0,0 +1,14 @@

+---
+title: EchoNet Video Diffusion
+emoji: 🖤
+colorFrom: gray
+colorTo: purple
+sdk: gradio
+sdk_version: 3.17.0
+app_file: app.py
+pinned: false
+license: mit
+duplicated_from: anon-SGXT/echocardiogram-video-diffusion
+---
+Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference

app.py ADDED Viewed

	@@ -0,0 +1,145 @@

+import gradio as gr
+import os
+from omegaconf import OmegaConf
+from imagen_pytorch import Unet3D, ElucidatedImagen, ImagenTrainer, ElucidatedImagenConfig, NullUnet, Imagen
+import torch
+import numpy as np
+import cv2
+from PIL import Image
+import torchvision.transforms as T
+device = "cuda" if torch.cuda.is_available() else "cpu"
+exp_path = "model"
+class BetterCenterCrop(T.CenterCrop):
+    def __call__(self, img):
+        h = img.shape[-2]
+        w = img.shape[-1]
+        dim = min(h, w)
+        return T.functional.center_crop(img, dim)
+class ImageLoader:
+    def __init__(self, path) -> None:
+        self.path = path
+        self.all_files = os.listdir(path)
+        self.transform = T.Compose([
+            T.ToTensor(),
+            BetterCenterCrop((112, 112)),
+            T.Resize((112, 112)),
+        ])
+    def get_image(self):
+        idx = np.random.randint(0, len(self.all_files))
+        img = Image.open(os.path.join(self.path, self.all_files[idx]))
+        return img
+class Context:
+    def __init__(self, path, device):
+        self.path = path
+        self.config_path = os.path.join(path, "config.yaml")
+        self.weight_path = os.path.join(path, "merged.pt")
+        self.config = OmegaConf.load(self.config_path)
+        self.config.dataset.num_frames = int(self.config.dataset.fps * self.config.dataset.duration)
+        self.im_load = ImageLoader("echo_images")
+        unets = []
+        for i, (k, v) in enumerate(self.config.unets.items()):
+            unets.append(Unet3D(**v, lowres_cond=(i>0))) # type: ignore
+        imagen_klass = ElucidatedImagen if self.config.imagen.elucidated == True else Imagen
+        del self.config.imagen.elucidated
+        imagen = imagen_klass(
+            unets = unets,
+            **OmegaConf.to_container(self.config.imagen), # type: ignore
+        )
+        self.trainer = ImagenTrainer(
+            imagen = imagen,
+            **self.config.trainer
+        ).to(device)
+        print("Loading weights from", self.weight_path)
+        additional_data = self.trainer.load(self.weight_path)
+        print("Loaded weights from", self.weight_path)
+    def reshape_image(self, image):
+        try:
+            image = self.im_load.transform(image).multiply(255).byte().permute(1,2,0).numpy()
+            return image
+        except:
+            return None
+    def load_random_image(self):
+        print("Loading random image")
+        image = self.im_load.get_image()
+        return image
+    def generate_video(self, image, lvef, cond_scale):
+        print("Generating video")
+        print(f"lvef: {lvef}, cond_scale: {cond_scale}")
+        image = self.im_load.transform(image).unsqueeze(0)
+        sample_kwargs = {}
+        sample_kwargs = {
+            "text_embeds": torch.tensor([[[lvef/100.0]]]),
+            "cond_scale": cond_scale,
+            "cond_images": image,
+        }
+        self.trainer.eval()
+        with torch.no_grad():
+            video = self.trainer.sample(
+                batch_size=1,
+                video_frames=self.config.dataset.num_frames,
+                **sample_kwargs,
+                use_tqdm = True,
+            ).detach().cpu() # C x F x H x W
+        if video.shape[-3:] != (64, 112, 112):
+            video = torch.nn.functional.interpolate(video, size=(64, 112, 112), mode='trilinear', align_corners=False)
+        video = video.repeat((1,1,5,1,1)) # make the video loop 5 times - easier to see
+        uid = np.random.randint(0, 10) # prevent overwriting if multiple users are using the app
+        path = f"tmp/{uid}.mp4"
+        video = video.multiply(255).byte().squeeze(0).permute(1, 2, 3, 0).numpy()
+        out = cv2.VideoWriter(path, cv2.VideoWriter_fourcc(*'mp4v'), 32, (112, 112))
+        for i in video:
+            out.write(i)
+        out.release()
+        return path
+context = Context(exp_path, device)
+with gr.Blocks(css="style.css") as demo:
+    with gr.Row():
+        gr.Label("Cardiac Ultrasound Video Generation Demo (paper: 905)")
+    with gr.Row():
+        with gr.Column():
+            with gr.Row():
+                with gr.Column(scale=3, variant="panel"):
+                    text = gr.Markdown(value="This is a live demo of our work on cardiac ultrasound video generation. The model is trained on 4-chamber cardiac ultrasound videos and can generate realistic 4-chamber videos given a target Left Ventricle Ejection Fraction. Please, start by sampling a random frame from the pool of 100 images taken from the EchoNet-Dynamic dataset, which will act as the conditional image, representing the anatomy of the video. Then, set the target LVEF, and click the button to generate a video. The process takes 30s to 60s. The model running here corresponds to the 1SCM from the paper. **Click on the video to play it.** ")
+                with gr.Column(scale=1, min_width="226"):
+                    image = gr.Image(interactive=True)
+                with gr.Column(scale=1, min_width="226"):
+                    video = gr.Video(interactive=False)
+            slider_ef = gr.Slider(minimum=10, maximum=90, step=1, label="Target LVEF", value=60, interactive=True)
+            slider_cond = gr.Slider(minimum=0, maximum=20, step=1, label="Conditional scale (if set to more than 1, generation time is 60s)", value=1, interactive=True)
+            with gr.Row():
+                img_btn = gr.Button(value="❶ Get a random cardiac ultrasound image (4Ch)")
+                run_btn = gr.Button(value="❷ Generate a video (~30s) 🚀")
+    image.change(context.reshape_image, inputs=[image], outputs=[image])
+    img_btn.click(context.load_random_image, inputs=[], outputs=[image])
+    run_btn.click(context.generate_video, inputs=[image, slider_ef, slider_cond], outputs=[video])
+if __name__ == "__main__":
+    demo.queue()
+    demo.launch()

echo_images/0X10094BA0A028EAC3.png ADDED Viewed

echo_images/0X1013E8A4864781B.png ADDED Viewed

echo_images/0X12B890B1E2E14CC4.png ADDED Viewed

echo_images/0X13E043A35E3EB490.png ADDED Viewed

echo_images/0X159BDA520C61736A.png ADDED Viewed

echo_images/0X15DA8D60960ABB2B.png ADDED Viewed

echo_images/0X16AF26F9A372EEDE.png ADDED Viewed

echo_images/0X17BC4EF4BF83368B.png ADDED Viewed

echo_images/0X1B379931357428C0.png ADDED Viewed

echo_images/0X1CDD9C054D8FB60D.png ADDED Viewed

echo_images/0X1DF7163A74801695.png ADDED Viewed

echo_images/0X20C397F012441121.png ADDED Viewed

echo_images/0X22A1A8A656653343.png ADDED Viewed

echo_images/0X22D7FDCF2827269E.png ADDED Viewed

echo_images/0X230F00FD0DF5D71C.png ADDED Viewed

echo_images/0X244CAB3550320216.png ADDED Viewed

echo_images/0X24FEF7D294B35A5B.png ADDED Viewed

echo_images/0X25D970C75A57B3F2.png ADDED Viewed

echo_images/0X277FC348812C0E79.png ADDED Viewed

echo_images/0X27836E538BD008A.png ADDED Viewed

echo_images/0X2840438B29E95F1F.png ADDED Viewed

echo_images/0X29A336DCE20541A0.png ADDED Viewed

echo_images/0X29C81728B50A2E6C.png ADDED Viewed

echo_images/0X2A830BC4A3A36A93.png ADDED Viewed

echo_images/0X2AD994F98C491FA6.png ADDED Viewed

echo_images/0X2BB766EF1A13DECC.png ADDED Viewed

echo_images/0X2DA99F9FC1DAD8A9.png ADDED Viewed

echo_images/0X3545F8A008B34ED0.png ADDED Viewed

echo_images/0X36E4468C9E659B89.png ADDED Viewed

echo_images/0X39CA8CC96A5D5E8B.png ADDED Viewed

echo_images/0X3B01B7487E3D81EA.png ADDED Viewed

echo_images/0X3B0D2D527C387A0E.png ADDED Viewed

echo_images/0X3B54A5459841DCE8.png ADDED Viewed

echo_images/0X3B9FBD87EE113D62.png ADDED Viewed

echo_images/0X3BA9F7C9DB0CF55B.png ADDED Viewed

echo_images/0X3DA2B290B58A6540.png ADDED Viewed

echo_images/0X3E2F182038897EA5.png ADDED Viewed

echo_images/0X3F076329C702F768.png ADDED Viewed

echo_images/0X4130EB4CD7ED958B.png ADDED Viewed

echo_images/0X42E8226CA93B7BAC.png ADDED Viewed

echo_images/0X45418C574D97027A.png ADDED Viewed

echo_images/0X45CE057EC2EB577F.png ADDED Viewed

echo_images/0X463A7B7D46C6CA4.png ADDED Viewed

echo_images/0X463C296E8E65DA97.png ADDED Viewed

echo_images/0X46682D67FA3FE237.png ADDED Viewed

echo_images/0X487B52623BC14C25.png ADDED Viewed