Spaces:

stacknet
/

stacknet-1-1-preview-demo

Running

hwonder Claude Opus 4.5 commited on Feb 6

Commit

b99fda7

1 Parent(s): 982cefe

Add 3D model (GLTF/GLB) support for Text to Image

- Add Model3D output component for 3D format
- Toggle visibility between Image and Model3D based on format
- Handler returns (image_url, model_url, status) tuple
- 3D format uses generate_image_3d tool and renders as Model3D

Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>

Files changed (3) hide show

app.py +1 -0
src/ui/handlers.py +21 -10
src/ui/tabs.py +19 -3

app.py CHANGED Viewed

@@ -66,6 +66,7 @@ def create_demo():
             ],
             outputs=[
                 tabs["text_to_image"]["output_image"],
                 tabs["text_to_image"]["status"]
             ],
             api_name=None

             ],
             outputs=[
                 tabs["text_to_image"]["output_image"],
+                tabs["text_to_image"]["output_model"],
                 tabs["text_to_image"]["status"]
             ],
             api_name=None

src/ui/handlers.py CHANGED Viewed

@@ -185,12 +185,18 @@ class Handlers:
         prompt: str,
         format_type: str,
         api_key: str = ""
-    ) -> Tuple[Optional[str], str]:
-        """Handle text-to-image generation."""
         if not prompt.strip():
-            return None, "Please enter a description for your image."
         if not api_key.strip():
-            return None, "Please enter your API key in the Settings section."
         client = StackNetClient(api_key=api_key.strip())
         service = ImageService(client=client)
@@ -200,24 +206,29 @@ class Handlers:
             asyncio.set_event_loop(loop)
             try:
-                images = loop.run_until_complete(
                     service.generate_image(
                         prompt=prompt,
                         format_type=format_type
                     )
                 )
-                if images:
-                    # Return URL directly - Gradio can display remote images
-                    return images[0].image_url, "Image generated successfully!"
                 else:
-                    return None, "No image was generated. Please try a different prompt."
             finally:
                 loop.close()
         except Exception as e:
-            return None, format_error(e)
         finally:
             service.cleanup()

         prompt: str,
         format_type: str,
         api_key: str = ""
+    ) -> Tuple[Optional[str], Optional[str], str]:
+        """Handle text-to-image generation.
+        Returns:
+            Tuple of (image_url, model_url, status)
+            - For image/multi: (url, None, status)
+            - For 3d: (None, url, status)
+        """
         if not prompt.strip():
+            return None, None, "Please enter a description for your image."
         if not api_key.strip():
+            return None, None, "Please enter your API key in the Settings section."
         client = StackNetClient(api_key=api_key.strip())
         service = ImageService(client=client)
             asyncio.set_event_loop(loop)
             try:
+                results = loop.run_until_complete(
                     service.generate_image(
                         prompt=prompt,
                         format_type=format_type
                     )
                 )
+                if results:
+                    url = results[0].image_url
+                    if format_type == "3d":
+                        # Return as 3D model
+                        return None, url, "3D model generated successfully!"
+                    else:
+                        # Return as image
+                        return url, None, "Image generated successfully!"
                 else:
+                    return None, None, "No result was generated. Please try a different prompt."
             finally:
                 loop.close()
         except Exception as e:
+            return None, None, format_error(e)
         finally:
             service.cleanup()

src/ui/tabs.py CHANGED Viewed

@@ -162,18 +162,34 @@ def create_text_to_image_tab():
             value="image"
         )
-        generate_btn = gr.Button("Generate Image", variant="primary", size="lg")
         status = gr.Textbox(label="Status", interactive=False, visible=False)
-        output_image = gr.Image(label="Generated Image", type="filepath")
     return {
         "prompt": prompt,
         "format_type": format_type,
         "generate_btn": generate_btn,
         "status": status,
-        "output_image": output_image
     }

             value="image"
         )
+        generate_btn = gr.Button("Generate", variant="primary", size="lg")
         status = gr.Textbox(label="Status", interactive=False, visible=False)
+        # Image output (for image and multi formats)
+        output_image = gr.Image(label="Generated Image", type="filepath", visible=True)
+        # 3D Model output (for 3d format)
+        output_model = gr.Model3D(label="Generated 3D Model", visible=False)
+    # Toggle output visibility based on format selection
+    format_type.change(
+        fn=lambda fmt: (
+            gr.update(visible=(fmt != "3d")),
+            gr.update(visible=(fmt == "3d"))
+        ),
+        inputs=[format_type],
+        outputs=[output_image, output_model],
+        api_name=None
+    )
     return {
         "prompt": prompt,
         "format_type": format_type,
         "generate_btn": generate_btn,
         "status": status,
+        "output_image": output_image,
+        "output_model": output_model
     }