atMrMattV
/

Visione

@@ -1,3 +1,9 @@
 # Visione
 A local-first AI creative production suite for consumer GPUs.
@@ -13,6 +19,29 @@ The pipeline covers the full creative arc: text-to-image and video generation, r
 **Stack:** Python 3.12 + FastAPI + SSE · React 18 + TypeScript + Zustand · Tauri 2 desktop shell · ComfyUI headless for video inference · PyTorch 2.7 + CUDA
 ---
 ## Components
@@ -28,43 +57,28 @@ The pipeline covers the full creative arc: text-to-image and video generation, r
 | **Characters** | Persistent character library with 5-shot reference generation for cross-shot consistency |
 | **Gallery** | Unified asset browser across all components |
-## Models
-| Model | Purpose |
-|-------|---------|
-| Z-Image Turbo FP8 | Image generation |
-| Z-Image Qwen 3 4B | Text encoder |
-| Z-Image VAE | VAE |
-| Z-Image LoRAs (38) | Style presets |
-| Flux2 Klein 4B FP8 | Image gen / editing |
-| Flux2 Klein 9B BF16 | Image gen/ High-quality editing |
-| Flux2 VAE | VAE |
-| ControlNet Union 2.1 | Structural conditioning (Retexture) |
-| Patina LoRAs (21) | Stylization presets |
-| SPAN 4x Upscaler | Image upscaling |
-| SCUNet Denoiser | Image denoising |
-| CodeFormer | Face enhancement |
-| LTX-2.3 22B FP8 | Video generation |
-| LTX-2 Gemma 3 12B FP4 | Video text encoder |
-| LTX-2.3 22B Distilled LoRA | Fast video sampling |
-| LTX-2.3 Spatial Upscaler | 2× video upscale |
-| LTX-2.3 Audio VAE | Audio generation |
-| VEnhancer FP16 | Video enhancement |
-| SeedVR2 3B FP8 | Video upscaling |
-| RIFE v4.26 | Frame interpolation |
-| ACE-Step SFT + Base | Music generation |
-| ACE-Step LM 1.7B | Music language model |
-| ACE-Step VAE + TextEnc | Music pipeline |
-| Qwen3-TTS 1.7B (3 variants) | Text-to-speech |
-| HunyuanVideo-Foley XL | Video-to-audio |
-| Wan 2.1 T2V 1.3B | StyleMaster backbone |
-| StyleMaster checkpoints | Style injection weights |
-| CLIP ViT-H-14 | Style extraction |
-| IS-Net (rembg) | Background removal (CPU) |
-| LatentSync 1.6 | Lip sync (quality) |
-| MuseTalk 1.5 | Lip sync (fast) |
-| InsightFace buffalo_l | Face detection/swap |
-| Inswapper_128.onnx | Face swap model |
 ---
@@ -76,7 +90,27 @@ The desktop shell (Tauri 2) wraps the frontend as a native window and manages ba
 Components share models where possible. Image generation models are reused across Imagine, Retouch, Retexture, and Storyboard; video models feed through from Imagine into Retexture and Sound Studio. The Video Editor and Gallery operate CPU-side, assembling outputs produced by the GPU components.
 ---
 ## License
 MIT

+ <p align="center">
+    <img
+  src="https://cdn-uploads.huggingface.co/production/uploads/695017bb0c3fc8b9c78497e9/YJHpzH436J828nNymCNk7.png"
+  width="600" />
+  </p>
 # Visione
 A local-first AI creative production suite for consumer GPUs.
 **Stack:** Python 3.12 + FastAPI + SSE · React 18 + TypeScript + Zustand · Tauri 2 desktop shell · ComfyUI headless for video inference · PyTorch 2.7 + CUDA
+  <table align="center"><tr>
+  <td><a href="https://cdn-uploads.huggingface.co/production/uploads/695017bb0c3fc8b9c78497e9/X0pIezsKwIRl-Guw3k58A.
+  png"><img
+  src="https://cdn-uploads.huggingface.co/production/uploads/695017bb0c3fc8b9c78497e9/X0pIezsKwIRl-Guw3k58A.png"
+  width="300" /></a></td>
+  <td><a href="https://cdn-uploads.huggingface.co/production/uploads/695017bb0c3fc8b9c78497e9/euOPxXTNWxjmRl-C88uU2.
+  png"><img
+  src="https://cdn-uploads.huggingface.co/production/uploads/695017bb0c3fc8b9c78497e9/euOPxXTNWxjmRl-C88uU2.png"
+  width="300" /></a></td>
+  <td><a href="https://cdn-uploads.huggingface.co/production/uploads/695017bb0c3fc8b9c78497e9/lW_zGi1O8HblIoamV0RLr.
+  png"><img
+  src="https://cdn-uploads.huggingface.co/production/uploads/695017bb0c3fc8b9c78497e9/lW_zGi1O8HblIoamV0RLr.png"
+  width="300" /></a></td>
+  <td><a href="https://cdn-uploads.huggingface.co/production/uploads/695017bb0c3fc8b9c78497e9/qKWonqa8ZQvl3CTdD0Pje.
+  png"><img
+  src="https://cdn-uploads.huggingface.co/production/uploads/695017bb0c3fc8b9c78497e9/qKWonqa8ZQvl3CTdD0Pje.png"
+  width="300" /></a></td>
+  <td><a href="https://cdn-uploads.huggingface.co/production/uploads/695017bb0c3fc8b9c78497e9/IjNbVVpnLepr9NI8cdxA3.
+  png"><img
+  src="https://cdn-uploads.huggingface.co/production/uploads/695017bb0c3fc8b9c78497e9/IjNbVVpnLepr9NI8cdxA3.png"
+  width="300" /></a></td>
+  </tr></table>
 ---
 ## Components
 | **Characters** | Persistent character library with 5-shot reference generation for cross-shot consistency |
 | **Gallery** | Unified asset browser across all components |
+<table align="center"><tr>
+  <td><a href="https://cdn-uploads.huggingface.co/production/uploads/695017bb0c3fc8b9c78497e9/No1ABmspTrCWqpvsukafQ.
+  png"><img
+  src="https://cdn-uploads.huggingface.co/production/uploads/695017bb0c3fc8b9c78497e9/No1ABmspTrCWqpvsukafQ.png"
+  width="300" /></a></td>
+  <td><a href="https://cdn-uploads.huggingface.co/production/uploads/695017bb0c3fc8b9c78497e9/mXVAiuj8Vpik0a_UNREIU.
+  png"><img
+  src="https://cdn-uploads.huggingface.co/production/uploads/695017bb0c3fc8b9c78497e9/mXVAiuj8Vpik0a_UNREIU.png"
+  width="300" /></a></td>
+  <td><a href="https://cdn-uploads.huggingface.co/production/uploads/695017bb0c3fc8b9c78497e9/Gmzmavqm9antFHYsbl4Ka.
+  png"><img
+  src="https://cdn-uploads.huggingface.co/production/uploads/695017bb0c3fc8b9c78497e9/Gmzmavqm9antFHYsbl4Ka.png"
+  width="300" /></a></td>
+  <td><a href="https://cdn-uploads.huggingface.co/production/uploads/695017bb0c3fc8b9c78497e9/BbYSmMGcXZENjW-LBiIUz.
+  png"><img
+  src="https://cdn-uploads.huggingface.co/production/uploads/695017bb0c3fc8b9c78497e9/BbYSmMGcXZENjW-LBiIUz.png"
+  width="300" /></a></td>
+  <td><a href="https://cdn-uploads.huggingface.co/production/uploads/695017bb0c3fc8b9c78497e9/jcy5-_cKf0oa_Utf3ZXbK.
+  png"><img
+  src="https://cdn-uploads.huggingface.co/production/uploads/695017bb0c3fc8b9c78497e9/jcy5-_cKf0oa_Utf3ZXbK.png"
+  width="300" /></a></td>
+  </tr></table>
 ---
 Components share models where possible. Image generation models are reused across Imagine, Retouch, Retexture, and Storyboard; video models feed through from Imagine into Retexture and Sound Studio. The Video Editor and Gallery operate CPU-side, assembling outputs produced by the GPU components.
+  <table align="center"><tr>
+  <td><a href="https://cdn-uploads.huggingface.co/production/uploads/695017bb0c3fc8b9c78497e9/7_CDVBV6B08IosFIkr5jq.
+  png"><img
+  src="https://cdn-uploads.huggingface.co/production/uploads/695017bb0c3fc8b9c78497e9/7_CDVBV6B08IosFIkr5jq.png"
+  width="300" /></a></td>
+  <td><a href="https://cdn-uploads.huggingface.co/production/uploads/695017bb0c3fc8b9c78497e9/fRhZcUYtK_TE8uIlXyPH-.
+  png"><img
+  src="https://cdn-uploads.huggingface.co/production/uploads/695017bb0c3fc8b9c78497e9/fRhZcUYtK_TE8uIlXyPH-.png"
+  width="300" /></a></td>
+  <td><a href="https://cdn-uploads.huggingface.co/production/uploads/695017bb0c3fc8b9c78497e9/B1J7kJuRPiPY12-Wja0jW.
+  png"><img
+  src="https://cdn-uploads.huggingface.co/production/uploads/695017bb0c3fc8b9c78497e9/B1J7kJuRPiPY12-Wja0jW.png"
+  width="300" /></a></td>
+  <td><a href="https://cdn-uploads.huggingface.co/production/uploads/695017bb0c3fc8b9c78497e9/MXtHgy7hlq9YZVaQED_WA.
+  png"><img
+  src="https://cdn-uploads.huggingface.co/production/uploads/695017bb0c3fc8b9c78497e9/MXtHgy7hlq9YZVaQED_WA.png"
+  width="300" /></a></td>
+  </tr></table>
 ---
 ## License
 MIT