Spaces:

pollen-robotics
/

reachy_mini_conversation_app

Running

App Files Files Community

Alina Lozovskaya commited on Oct 16

Commit

fbce00b

2 Parent(s): d554873 927fd13

Merge remote-tracking branch 'origin/develop' into add-github-workflows

Browse files

Files changed (5) hide show

README.md +4 -1
pyproject.toml +3 -3
src/reachy_mini_conversation_demo/utils.py +19 -4
src/reachy_mini_conversation_demo/vision/yolo_head_tracker.py +9 -2
uv.lock +0 -0

README.md CHANGED Viewed

@@ -12,6 +12,9 @@ Conversational demo for the Reachy Mini robot combining OpenAI's realtime APIs,
 ## Installation
 ### Using uv
 You can set up the project quickly using [uv](https://docs.astral.sh/uv/):
@@ -34,7 +37,7 @@ You can combine extras or include dev dependencies:
 uv sync --extra all_vision --group dev
 ```
-### Using pip (test on Ubuntu 24.04)
 ```bash
 python -m venv .venv # Create a virtual environment

 ## Installation
+> [!IMPORTANT]
+> Windows support is currently experimental and has not been extensively tested. Use with caution.
 ### Using uv
 You can set up the project quickly using [uv](https://docs.astral.sh/uv/):
 uv sync --extra all_vision --group dev
 ```
+### Using pip
 ```bash
 python -m venv .venv # Create a virtual environment

pyproject.toml CHANGED Viewed

@@ -24,9 +24,9 @@ dependencies = [
     "openai>=2.1",
     #Reachy mini
-    "reachy_mini_dances_library@git+ssh://git@github.com/pollen-robotics/reachy_mini_dances_library@main",
-    "reachy_mini_toolbox@git+ssh://git@github.com/pollen-robotics/reachy_mini_toolbox@main",
-    "reachy_mini@git+ssh://git@github.com/pollen-robotics/reachy_mini@develop",
 ]
 [project.optional-dependencies]

     "openai>=2.1",
     #Reachy mini
+    "reachy_mini_dances_library",
+    "reachy_mini_toolbox",
+    "reachy_mini>=1.0.0.rc4",
 ]
 [project.optional-dependencies]

src/reachy_mini_conversation_demo/utils.py CHANGED Viewed

@@ -3,7 +3,6 @@ import argparse
 import warnings
 from reachy_mini_conversation_demo.camera_worker import CameraWorker
-from reachy_mini_conversation_demo.vision.processors import initialize_vision_manager
 def parse_args():
@@ -16,7 +15,12 @@ def parse_args():
         help="Choose head tracker (default: None)",
     )
     parser.add_argument("--no-camera", default=False, action="store_true", help="Disable camera usage")
-    parser.add_argument("--local-vision", default=False, action="store_true", help="Use local vision model instead of gpt-realtime vision")
     parser.add_argument("--gradio", default=False, action="store_true", help="Open gradio interface")
     parser.add_argument("--debug", default=False, action="store_true", help="Enable debug logging")
     return parser.parse_args()
@@ -37,9 +41,11 @@ def handle_vision_stuff(args, current_robot):
         if args.head_tracker is not None:
             if args.head_tracker == "yolo":
                 from reachy_mini_conversation_demo.vision.yolo_head_tracker import HeadTracker
                 head_tracker = HeadTracker()
             elif args.head_tracker == "mediapipe":
                 from reachy_mini_toolbox.vision import HeadTracker
                 head_tracker = HeadTracker()
         # Initialize camera worker
@@ -47,9 +53,18 @@ def handle_vision_stuff(args, current_robot):
         # Initialize vision manager only if local vision is requested
         if args.local_vision:
-            vision_manager = initialize_vision_manager(camera_worker)
         else:
-            logging.getLogger(__name__).info("Using gpt-realtime for vision (default). Use --local-vision for local processing.")
     return camera_worker, head_tracker, vision_manager

 import warnings
 from reachy_mini_conversation_demo.camera_worker import CameraWorker
 def parse_args():
         help="Choose head tracker (default: None)",
     )
     parser.add_argument("--no-camera", default=False, action="store_true", help="Disable camera usage")
+    parser.add_argument(
+        "--local-vision",
+        default=False,
+        action="store_true",
+        help="Use local vision model instead of gpt-realtime vision",
+    )
     parser.add_argument("--gradio", default=False, action="store_true", help="Open gradio interface")
     parser.add_argument("--debug", default=False, action="store_true", help="Enable debug logging")
     return parser.parse_args()
         if args.head_tracker is not None:
             if args.head_tracker == "yolo":
                 from reachy_mini_conversation_demo.vision.yolo_head_tracker import HeadTracker
                 head_tracker = HeadTracker()
             elif args.head_tracker == "mediapipe":
                 from reachy_mini_toolbox.vision import HeadTracker
                 head_tracker = HeadTracker()
         # Initialize camera worker
         # Initialize vision manager only if local vision is requested
         if args.local_vision:
+            try:
+                from reachy_mini_conversation_demo.vision.processors import initialize_vision_manager
+                vision_manager = initialize_vision_manager(camera_worker)
+            except ImportError as e:
+                raise ImportError(
+                    "To use --local-vision, please install the extra dependencies: pip install '.[local_vision]'"
+                ) from e
         else:
+            logging.getLogger(__name__).info(
+                "Using gpt-realtime for vision (default). Use --local-vision for local processing."
+            )
     return camera_worker, head_tracker, vision_manager

src/reachy_mini_conversation_demo/vision/yolo_head_tracker.py CHANGED Viewed

@@ -3,8 +3,15 @@ import logging
 from typing import Tuple, Optional
 import numpy as np
-from supervision import Detections
-from ultralytics import YOLO
 from huggingface_hub import hf_hub_download

 from typing import Tuple, Optional
 import numpy as np
+try:
+    from supervision import Detections
+    from ultralytics import YOLO
+except ImportError as e:
+    raise ImportError(
+        "To use YOLO head tracker, please install the extra dependencies: pip install '.[yolo_vision]'"
+    ) from e
 from huggingface_hub import hf_hub_download

uv.lock CHANGED Viewed

The diff for this file is too large to render. See raw diff