Spaces:

HongzeFu
/

RoboMME

Running

File size: 36,442 Bytes

06c11b0

from typing import Callable, Dict, List
import numpy as np
import sys
import os
import inspect

from ...logging_utils import logger

# If run as script directly, add project root to sys.path
if __name__ == "__main__":
    # Get current file directory
    current_file = os.path.abspath(__file__)
    # Project root should be robomme-v5.7.2-sam2act-update
    project_root = os.path.dirname(os.path.dirname(os.path.dirname(os.path.dirname(current_file))))
    if project_root not in sys.path:
        sys.path.insert(0, project_root)

from robomme.robomme_env.utils.subgoal_planner_func import (
    grasp_and_lift_peg_side,
    insert_peg,
    solve_button,
    solve_button_ready,
    solve_hold_obj,
    solve_hold_obj_absTimestep,
    solve_pickup,
    solve_pickup_bin,
    solve_push_to_target,
    solve_push_to_target_with_peg,
    solve_putdown_whenhold,
    solve_putonto_whenhold,
    solve_putonto_whenhold_binspecial,
    solve_swingonto,
    solve_swingonto_withDirection,
    solve_swingonto_whenhold,
    solve_strong_reset,
)


def _options_default(env, planner, require_target, base) -> List[dict]:
    options: List[dict] = []

    return options

def _options_videorepick(env, planner, require_target, base) -> List[dict]:
    options: List[dict] = [
        {
            "label": "a",
            "action": "pick up the cube",
            "solve": lambda require_target=require_target: solve_pickup(
                env, planner, obj=require_target()),
            "available": env.spawned_cubes
        },
        {
            "label": "b",
            "action": "put it down",
            "solve": lambda: solve_putdown_whenhold(
                env, planner, release_z=0.01
            ),
        },
    ]
    button_obj = getattr(base, "button_left", None)
    if button_obj is not None:
        options.append(
            {
                "label": "c",
                "action": "press the button to finish",
                "solve": lambda button_obj=button_obj: solve_button(
                    env, planner, obj=button_obj
                ),
            }
        )
    return options


def _options_binfill(env, planner, require_target, base) -> List[dict]:
    options: List[dict] = [
        {
            "label": "a",
            "action": "pick up the cube",
            "solve": lambda require_target=require_target: solve_pickup(
                env, planner, obj=require_target()
            ),
            "available": env.all_cubes,
        },
    ]
    target = getattr(base, "board_with_hole", None)
    if target is not None:
        options.append(
            {
                "label": "b",
                "action": "put it into the bin",
                "solve": lambda require_target=require_target, target=target: solve_putonto_whenhold_binspecial(
                    env, planner, target=target
                ),
            }
        )
    button_obj = getattr(base, "button", None)
    if button_obj is not None:
        options.append(
            {
                "label": "c",
                "action": "press the button",
                "solve": lambda button_obj=button_obj: solve_button(
                    env, planner, obj=button_obj
                ),
            }
        )
    return options


def _options_button_unmask(env, planner, require_target, base) -> List[dict]:
    options: List[dict] = []
    button_obj = getattr(base, "button_left", None) or getattr(base, "button", None)
    if button_obj is not None:
        options.append(
            {
                "label": "a",
                "action": "press the button",
                "solve": lambda button_obj=button_obj: solve_button(
                    env, planner, obj=button_obj
                ),
            }
        )

    options.extend([{
            "label": "b",
            "action": "pick up the container",
            "solve": lambda require_target=require_target: solve_pickup_bin(
                env, planner, obj=require_target()
            ),
            "available": env.spawned_bins,
        },
        {
            "label": "c",
            "action": "put down the container",
            "solve": lambda: solve_putdown_whenhold(
                env, planner
            ),
        },])
    return options

def _options_button_unmask_swap(env, planner, require_target, base) -> List[dict]:
    options: List[dict] = []
    button_obj_left = getattr(base, "button_left", None) or getattr(base, "button", None)
    if button_obj_left is not None:
        options.append(
            {
                "label": "a",
                "action": "press the first button",
                "solve": lambda button_obj=button_obj_left: solve_button(
                    env, planner, obj=button_obj
                ),
            }
        )
    button_obj_right = getattr(base, "button_right", None)
    if button_obj_right is not None:
        options.append(
            {
                "label": "b",
                "action": "press the second button",
                "solve": lambda button_obj=button_obj_right: solve_button(
                    env, planner, obj=button_obj
                ),
            }
        )


    options.extend([{
            "label": "c",
            "action": "pick up the container",
            "solve": lambda require_target=require_target: solve_pickup_bin(
                env, planner, obj=require_target()
            ),
            "available": env.spawned_bins,
            #"available": env.spawned_bins+[env.button_right],#test gradio execution error
        },
        {
            "label": "d",
            "action": "put down the container",
            "solve": lambda: solve_putdown_whenhold(
                env, planner
            ),
        },])
    return options 


def _options_insertpeg(env, planner, require_target, base) -> List[dict]:
    options: List[dict] = []

    options.append(
        {
            "label": "a",
            "action": "pick up the peg by grasping one end",
            "solve": lambda require_target=require_target: grasp_and_lift_peg_side(
                env, planner, obj=require_target()
            ),
            "available": env.peg_heads + env.peg_tails,
        }
    )

    options.append(
        {
            "label": "b",
            "action": "insert the peg from the right side",
            "solve": lambda direction=1: insert_peg(
                env,
                planner,
                direction=direction,
                obj=env.obj_flag,
                insert_obj=env.insert_target,
                cut_retreat=True,
            ),
        }
    )
    options.append(
        {
            "label": "c",
            "action": "insert the peg from the left side",# Keep consistent with subgoal
            "solve": lambda direction=-1: insert_peg(
                env,
                planner,
                direction=direction,
                obj=env.obj_flag,
                insert_obj=env.insert_target,
                cut_retreat=True,
            ),
        }
    )

    return options


def _options_movecube(env, planner, require_target, base) -> List[dict]:
    options: List[dict] = []
    cube = getattr(base, "cube", None)
    cube_goal = getattr(base, "goal_site", None)
    peg_target = getattr(base, "grasp_target", None)
    obj_flag = getattr(base, "obj_flag", None)
    direction1 = getattr(base, "direction1", None)
    direction2 = getattr(base, "direction2", None)

    if peg_target is not None:
        options.append(
            {
                "label": "a",
                "action": "pick up the peg",
                "solve": lambda peg_target=peg_target: grasp_and_lift_peg_side(
                    env, planner, obj=peg_target
                ),
            }
        )



    if cube is not None and cube_goal is not None and direction2 is not None and obj_flag is not None:
        options.append(
            {
                "label": "b",
                "action": "hook the cube to the target with the peg",
                "solve": lambda cube=cube, goal=cube_goal, direction=direction2, obj_flag=obj_flag: solve_push_to_target_with_peg(
                    env,
                    planner,
                    obj=cube,
                    target=goal,
                    direction=direction,
                    obj_flag=obj_flag,
                ),
            }
        )


    if cube is not None and cube_goal is not None:
        options.append(
            {
                "label": "c",
                "action": "close gripper and push the cube to the target",
                "solve": lambda cube=cube, goal=cube_goal: solve_push_to_target(
                    env, planner, obj=cube, target=goal
                ),
            }
        )
    if cube is not None and cube_goal is not None:
        options.append(
            {
                "label": "d",
                "action": "pick up the cube",
                "solve": lambda cube=cube: solve_pickup(env, planner, obj=cube),
            }
        )
        options.append(
            {
                "label": "e",
                "action": "place the cube onto the target",
                "solve": lambda cube=cube, goal=cube_goal: solve_putonto_whenhold(
                    env, planner,target=goal
                ),
            }
        )

    return options


def _options_patternlock(env, planner, require_target, base) -> List[dict]:
    """
    Dynamically pick the nearest target to the current TCP and move to the
    closest neighbour along the requested direction.
    """
    directions = [
        "forward",
        "backward",
        "left",
        "right",
        "forward-left",
        "forward-right",
        "backward-left",
        "backward-right",
    ]

    dir_vectors = {
        "forward": np.array([1.0, 0.0]),
        "backward": np.array([-1.0, 0.0]),
        "left": np.array([0.0, 1.0]),
        "right": np.array([0.0, -1.0]),
        "forward-left": np.array([1.0, 1.0]) / np.sqrt(2.0),
        "forward-right": np.array([1.0, -1.0]) / np.sqrt(2.0),
        "backward-left": np.array([-1.0, 1.0]) / np.sqrt(2.0),
        "backward-right": np.array([-1.0, -1.0]) / np.sqrt(2.0),
    }

    # Quick half-plane filters so we only consider targets in the intended direction.
    eps = 1e-6
    dir_filters = {
        "forward": lambda dx, dy: dx > eps,
        "backward": lambda dx, dy: dx < -eps,
        "left": lambda dx, dy: dy > eps,
        "right": lambda dx, dy: dy < -eps,
        "forward-left": lambda dx, dy: dx > eps and dy > eps,
        "forward-right": lambda dx, dy: dx > eps and dy < -eps,
        "backward-left": lambda dx, dy: dx < -eps and dy > eps,
        "backward-right": lambda dx, dy: dx < -eps and dy < -eps,
    }

    def _actor_xy(actor):
        pose = getattr(actor, "pose", None)
        if pose is None:
            pose = actor.get_pose() if hasattr(actor, "get_pose") else None
        pos = getattr(pose, "p", None)
        if pos is None:
            return None
        arr = np.asarray(pos).reshape(-1)
        return arr[:2] if arr.size >= 2 else None

    def _collect_targets():
        """
        Gather all available target actors (targets_grid/buttons_grid/selected_buttons)
        and deduplicate by object id.
        """
        buckets = (
            getattr(base, "targets_grid", None),
            getattr(base, "buttons_grid", None),
            getattr(base, "selected_buttons", None),
        )
        seen = set()
        targets = []
        for bucket in buckets:
            if not bucket:
                continue
            for t in bucket:
                if t is None:
                    continue
                t_id = id(t)
                if t_id in seen:
                    continue
                seen.add(t_id)
                targets.append(t)
        return targets

    def _closest_target_to_tcp():
        targets = _collect_targets()
        if not targets:
            raise ValueError("PatternLock requires targets_grid/buttons_grid to be initialized.")

        tcp_pose = np.asarray(env.agent.tcp.pose.p).reshape(-1)
        if tcp_pose.size < 2:
            raise ValueError("TCP pose does not provide x/y coordinates.")
        tcp_xy = tcp_pose[:2]

        dist_list = []
        for t in targets:
            t_xy = _actor_xy(t)
            if t_xy is None:
                continue
            dist = float(np.linalg.norm(t_xy - tcp_xy))
            dist_list.append((dist, t, t_xy))

        if not dist_list:
            raise ValueError("PatternLock could not compute any valid target positions.")

        dist_list.sort(key=lambda item: item[0])
        return dist_list[0][1], dist_list[0][2], targets

    def _target_for_direction(dir_label: str):
        ref_target, ref_xy, candidates = _closest_target_to_tcp()
        vec = dir_vectors[dir_label]
        filt = dir_filters[dir_label]

        best = None
        best_score = None
        for cand in candidates:
            if cand is ref_target:
                continue
            c_xy = _actor_xy(cand)
            if c_xy is None:
                continue
            delta = c_xy - ref_xy
            if delta.shape[0] < 2:
                continue
            dx, dy = float(delta[0]), float(delta[1])
            if not filt(dx, dy):
                continue
            dist = float(np.linalg.norm(delta))
            if dist < eps:
                continue
            if dist>0.2:
                continue  # max distance threshold, won't select points too far
            align = float(np.dot(delta / dist, vec))
            score = (-align*0.5, dist)  # prioritize alignment, then closeness
            if best_score is None or score < best_score:
                best_score = score
                best = cand

        if best is None:
            logger.debug(f"[PatternLock] No candidate in direction '{dir_label}', using nearest target.")
            best = ref_target
        return best

    def _solve_direction(chosen_dir: str):
        try:
            target = _target_for_direction(chosen_dir)
        except ValueError as e:
            logger.debug(f"[PatternLock] {e}")
            return

        record_flag = getattr(base, "swing_qpos", None) is None
        return [solve_swingonto(env, planner, target=target),solve_swingonto(env, planner, target=target)]

    options: List[dict] = []
    for i, dir_label in enumerate(directions):
        options.append(
            {
                "label": chr(ord("a") + i),
                "action": f"move {dir_label}",
                "solve": (lambda d=dir_label: _solve_direction(d)),
            }
        )
    return options


def _options_routestick(env, planner, require_target, base) -> List[dict]:
    def _solve_route(side: str, direction: str):
        """
        Choose a target stick based on the desired side and move around it
        using the requested rotation direction.
        - side: "left"/"right" → pick the nearest target on that side of the
          last visited stick (fallback: current gripper position).
        - direction: "clockwise"/"counterclockwise" (accept short aliases).
        """
        # Normalize direction text
        dir_map = {
            "clock": "clockwise",
            "clockwise": "clockwise",
            "cw": "clockwise",
            "counterclock": "counterclockwise",
            "counterclockwise": "counterclockwise",
            "anticlockwise": "counterclockwise",
            "ccw": "counterclockwise",
        }
        direction_norm = dir_map.get(str(direction).lower(), "counterclockwise")

        def _actor_xy(a):
            if a is None:
                return None
            pose = getattr(a, "pose", None)
            if pose is None:
                pose = a.get_pose()
            p = getattr(pose, "p", None)
            if p is None:
                return None
            arr = np.asarray(p).reshape(-1)
            return arr[:2] if arr.size >= 2 else None

        # Reference actor: allowed button nearest to current TCP.
        ref_actor = None

        # Candidate targets: strictly use allowed indices on the buttons grid.
        grid = list(getattr(base, "buttons_grid", []) or [])
        allowed_idx = [int(i) for i in getattr(base, "route_button_indices", [0, 2, 4, 6, 8])]
        allowed_set = set(allowed_idx)
        allowed_candidates = [
            (idx, actor) for idx, actor in enumerate(grid) if idx in allowed_set and actor is not None
        ]

        # Pick reference as the allowed button closest to the current TCP.
        tcp_pose = np.asarray(env.agent.tcp.pose.p).reshape(-1)
        tcp_xy = tcp_pose[:2] if tcp_pose.size >= 2 else None
        dist_list = []
        for idx, actor in allowed_candidates:
            xy = _actor_xy(actor)
            if xy is None or tcp_xy is None:
                continue
            dist_list.append((np.linalg.norm(xy - tcp_xy), idx, actor))

        if dist_list:
            _, ref_idx, ref_actor = min(dist_list, key=lambda item: item[0])
        elif allowed_candidates:
            ref_idx, ref_actor = allowed_candidates[0]
        else:
            ref_idx, ref_actor = 0, None

        candidates = [(idx, actor) for idx, actor in allowed_candidates if actor is not ref_actor]

        if not candidates:
            raise ValueError("RouteStick: no available targets to swing onto.")

        side_l = str(side).lower()
        side_candidates = []
        for idx, actor in candidates:
            if side_l == "left" and idx > ref_idx:
                side_candidates.append((idx, actor))
            elif side_l == "right" and idx < ref_idx:
                side_candidates.append((idx, actor))

        
        if not side_candidates:
            # Fallback: if no candidate on the requested side, pick the nearest available candidate
            # from the general 'candidates' list (which excludes the reference/current button).
            fallback_target = None
            min_dist = float('inf')
            for idx, actor in allowed_candidates:
                xy = _actor_xy(actor)
                if xy is not None and tcp_xy is not None:
                    d = np.linalg.norm(xy - tcp_xy)
                    if d < min_dist:
                        min_dist = d
                        fallback_target = actor
            
            if fallback_target is None:
                # Should typically not happen if candidates is not empty
                if candidates:
                    fallback_target = allowed_candidates[0][1]
                else:
                    raise ValueError("RouteStick: failed to determine a target for the selected side.")

            logger.debug(f"RouteStick: failed to determine a target for side '{side_l}'. Fallback to nearest target.")
            return solve_swingonto(env, planner, target=fallback_target)

        # Pick the closest candidate by index in the requested direction (no distance check).
        if side_l == "left":
            _target_idx, target = min(side_candidates, key=lambda item: item[0] - ref_idx)
        else:
            _target_idx, target = min(side_candidates, key=lambda item: ref_idx - item[0])

        swing_radius = float(getattr(base, "swing_radius", 0.2) or 0.2)
        return solve_swingonto_withDirection(
            env, planner, target=target, radius=swing_radius, direction=direction_norm
        )


    options: List[dict] = []
    option_defs = [
        ("move to the nearest left target by circling around the stick clockwise", "left", "clockwise"),
        ("move to the nearest right target by circling around the stick clockwise", "right", "clockwise"),
        ("move to the nearest left target by circling around the stick counterclockwise", "left", "counterclockwise"),
        ("move to the nearest right target by circling around the stick counterclockwise", "right", "counterclockwise"),
    ]
    for i, (action_text, side, direction) in enumerate(option_defs):
        options.append(
            {
                "label": chr(ord("a") + i),
                "action": action_text,
                "solve": (lambda s=side, d=direction: _solve_route(s, d)),
            }
        )
    return options

def _options_pickhighlight(env, planner, require_target, base) -> List[dict]:
    options: List[dict] = []

    button_obj = getattr(base, "button", None) or getattr(base, "button_left", None)
    if button_obj is not None:
        options.append(
            {
                "label": "a",
                "action": "press button",
                "solve": lambda button_obj=button_obj: solve_button(
                    env, planner, obj=button_obj
                ),
            }
        )

    target_cubes = list(getattr(base, "target_cubes", []) or [])
    target_labels = list(getattr(base, "target_labels", []) or []) or getattr(
        base, "target_cube_names", []
    )

    options.extend(
        [
            {
                "label": "b",
                "action": "pick up the highlighted cube",
                "solve": lambda require_target=require_target: solve_pickup(
                    env, planner, obj=require_target()
                ),
                'available': env.all_cubes,
            },
            {
                "label": "c",
                "action": "place the cube onto the table",
                "solve": lambda: solve_putdown_whenhold(
                    env, planner, release_z=0.01
                ),
            },
        ]
    )

    return options

def _options_pickxtimes(env, planner, require_target, base) -> List[dict]:
    options: List[dict] = []
    options.extend(
        [
            {
                "label": "a",
                "action": "pick up the cube",
                "solve": lambda require_target=require_target: solve_pickup(
                    env, planner, obj=require_target()
                ),
                "available": env.all_cubes,
            },
            {
                "label": "b",
                "action": "place the cube onto the target",
                "solve": lambda require_target=require_target: solve_putonto_whenhold(
                    env, planner, target=env.target
                ),
            },
            {
                "label": "c",
                "action": "press the button to stop",
                "solve": lambda: solve_button(
                    env, planner, obj=env.button
                ),
            }
        ]
    )

    return options

def _options_swingxtimes(env, planner, require_target, base) -> List[dict]:
    options: List[dict] = []

    options.append(
        {
            "label": "a",
            "action": "pick up the cube",
            "solve": lambda require_target=require_target: solve_pickup(
                env, planner, obj=require_target()
            ),
            "available": env.all_cubes,
        }
    )

    target_cube = getattr(base, "target_cube", None)
    if target_cube is not None:
        options.append(
            {
                "label": "b",
                "action": "move to the top of the target",
                "solve": lambda require_target=require_target, target_cube=target_cube: solve_swingonto_whenhold(
                    env,
                    planner,
                    target=require_target(),
                    height=0.1,
                ),
                "available": [env.target_right]+[env.target_left],
            }
        )
        options.append(
            {
                "label": "c",
                "action": "put the cube on the table",
                "solve": lambda target_cube=target_cube: solve_putdown_whenhold(
                    env, planner
                ),
            }
        )

    button_obj = getattr(base, "button", None) or getattr(base, "button_left", None)
    if button_obj is not None:
        options.append(
            {
                "label": "d",
                "action": "press the button",
                "solve": lambda button_obj=button_obj: solve_button(
                    env, planner, obj=button_obj
                ),
            }
        )

    return options

def _options_videoplaceorder(env, planner, require_target, base) -> List[dict]:
    options: List[dict] = [
        {
            "label": "a",
            "action": "pick up the cube",
            "solve": lambda require_target=require_target: solve_pickup(
                env, planner, obj=require_target()
            ),
            "available": env.all_cubes,
        },
    ]

    target_cube = getattr(base, "target_cube", None)
    if target_cube is not None:
        options.append(
            {
                "label": "b",
                "action": "drop onto",
                "solve": lambda require_target=require_target, target_cube=target_cube: solve_putonto_whenhold(
                    env, planner, target=require_target()
                ),
                "available": env.targets,
            }
        )

    button_obj = getattr(base, "button", None) or getattr(base, "button_left", None)
    if button_obj is not None:
        options.append(
            {
                "label": "c",
                "action": "press the button",
                "solve": lambda button_obj=button_obj: solve_button(
                    env, planner, obj=button_obj
                ),
            }
        )

    return options
def _options_videoplacebutton(env, planner, require_target, base) -> List[dict]:
    options: List[dict] = [
        {
            "label": "a",
            "action": "pick up the cube",
            "solve": lambda require_target=require_target: solve_pickup(
                env, planner, obj=require_target()
            ),
            "available": env.all_cubes,
        },
    ]

    target_cube = getattr(base, "target_cube", None)
    if target_cube is not None:
        options.append(
            {
                "label": "b",
                "action": "drop onto",
                "solve": lambda target_cube=target_cube: solve_putonto_whenhold(
                    env, planner, target=require_target()
                ),
                "available": env.targets,
            }
        )

    button_obj = getattr(base, "button", None) or getattr(base, "button_left", None)
    if button_obj is not None:
        options.append(
            {
                "label": "c",
                "action": "press the button",
                "solve": lambda button_obj=button_obj: solve_button(
                    env, planner, obj=button_obj
                ),
            }
        )

    return options


def _options_stopcube(env, planner, require_target, base) -> List[dict]:
    options: List[dict] = []
    button_obj = getattr(base, "button", None)

    if button_obj is not None:
        options.append(
            {
                "label": "a",
                "action": "move to the top of the button to prepare",
                "solve": lambda button_obj=button_obj: solve_button_ready(
                    env, planner, obj=button_obj
                ),
            }
        )

    steps_press = getattr(base, "steps_press", None)
    if steps_press is not None:
        def solve_with_incremental_steps():
            steps_press_value = getattr(base, "steps_press", None)
            if steps_press_value is None:
                return None

            interval = getattr(base, "interval", 30)
            final_target = max(0, int(steps_press_value - interval))
            current_step = int(getattr(env, "elapsed_steps", 0))

            checkpoints_key = "_stopcube_static_checkpoints"
            index_key = "_stopcube_static_index"
            cached_final_target_key = "_stopcube_static_final_target"
            last_elapsed_step_key = "_stopcube_static_last_elapsed_step"

            checkpoints = getattr(base, checkpoints_key, None)
            index = getattr(base, index_key, None)
            cached_final_target = getattr(base, cached_final_target_key, None)
            last_elapsed_step = getattr(base, last_elapsed_step_key, None)

            needs_rebuild = (
                not isinstance(checkpoints, list)
                or len(checkpoints) == 0
                or index is None
                or cached_final_target is None
                or int(cached_final_target) != final_target
                or (
                    last_elapsed_step is not None
                    and current_step < int(last_elapsed_step)
                )
            )

            if needs_rebuild:
                checkpoints = list(range(100, final_target, 100))
                if not checkpoints or checkpoints[-1] != final_target:
                    checkpoints.append(final_target)
                index = 0
            else:
                index = int(index)
                if index < 0:
                    index = 0
                
                if index >= len(checkpoints):
                    index = len(checkpoints) - 1

            target = checkpoints[index]
            solve_hold_obj_absTimestep(env, planner, absTimestep=target)

            index += 1

            setattr(base, checkpoints_key, checkpoints)
            setattr(base, index_key, index)
            setattr(base, cached_final_target_key, final_target)
            setattr(base, last_elapsed_step_key, current_step)

            return None

        options.append(
            {
                "label": "b",
                "action": "remain static",
                "solve": solve_with_incremental_steps,
            }
        )

    if button_obj is not None:
        options.append(
            {
                "label": "c",
                "action": "press button to stop the cube",
                "solve": lambda button_obj=button_obj: solve_button(
                    env, planner, obj=button_obj, without_hold=True
                ),
            }
        )

    return options
def _options_video_unmask(env, planner, require_target, base) -> List[dict]:
    options: List[dict] = []
    options.extend([{
            "label": "a",
            "action": "pick up the container",
            "solve": lambda require_target=require_target: solve_pickup_bin(
                env, planner, obj=require_target()
            ),
            "available": env.spawned_bins,
        },
        {
            "label": "b",
            "action": "put down the container",
            "solve": lambda: solve_putdown_whenhold(
                env, planner
            ),
        },])
    return options

def _options_video_unmask_swap(env, planner, require_target, base) -> List[dict]:
    options: List[dict] = []
    options.extend([{
            "label": "a",
            "action": "pick up the container",
            "solve": lambda require_target=require_target: solve_pickup_bin(
                env, planner, obj=require_target()
            ),
            "available": env.spawned_bins,
        },
        {
            "label": "b",
            "action": "put down the container",
            "solve": lambda: solve_putdown_whenhold(
                env, planner
            ),
        },])
    return options

OPTION_BUILDERS: Dict[str, Callable] = {
    "VideoRepick": _options_videorepick,
    "BinFill": _options_binfill,
    "ButtonUnmask": _options_button_unmask,
    "ButtonUnmaskSwap": _options_button_unmask_swap,
    "InsertPeg": _options_insertpeg,
    "MoveCube": _options_movecube,
    "PatternLock": _options_patternlock,
    "PickHighlight": _options_pickhighlight,
    "PickXtimes": _options_pickxtimes,
    "RouteStick": _options_routestick,
    "SwingXtimes": _options_swingxtimes,
    "StopCube": _options_stopcube,
    "VideoPlaceButton": _options_videoplacebutton,
    "VideoPlaceOrder": _options_videoplaceorder,
    "VideoUnmask": _options_video_unmask,
    "VideoUnmaskSwap": _options_video_unmask_swap,
    
}


def get_vqa_options(env, planner, selected_target, env_id: str) -> List[dict]:
    """
    Return a fixed set of options (label + solve) based on env_id.
    Target object provided in selected_target after GUI click.
    """
    def _require_target():
        obj = selected_target.get("obj")
        if obj is None:
            raise ValueError("No available target cube found, please click target in segmentation map first.")
        return obj

    base = env.unwrapped
    builder = OPTION_BUILDERS.get(env_id, _options_default)
    return builder(env, planner, _require_target, base)


if __name__ == "__main__":
    """Print options label for all tasks"""
    class MockEnv:
        def __init__(self):
            self.spawned_cubes = ["cube1"]
            self.all_cubes = ["cube1", "cube2"]
            self.spawned_bins = ["bin1"]
            self.targets = ["target1"]
            self.target_right = "target_right"
            self.target_left = "target_left"
            # For InsertPeg
            self.peg_heads = ["peg_head"]
            self.peg_tails = ["peg_tail"]
            self.obj_flag = "obj_flag"
            self.insert_target = "insert_target"
            # For PickXtimes
            self.target = "target"
            self.button = "button"
    
    class MockBase:
        def __init__(self):
            # Common objects
            self.button = "button"
            self.button_left = "button_left"
            self.button_right = "button_right"
            self.cube = "cube"
            self.target = "target"
            
            # BinFill
            self.board_with_hole = "board_with_hole"
            
            # MoveCube
            self.goal_site = "goal_site"
            self.grasp_target = "grasp_target"
            self.obj_flag = "obj_flag"
            self.direction1 = 1
            self.direction2 = 1
            
            # PickHighlight
            self.target_cubes = ["cube1"]
            self.target_labels = ["cube1"]
            self.target_cube_names = ["cube1"]
            
            # SwingXtimes / VideoPlaceOrder / VideoPlaceButton
            self.target_cube = "target_cube"
            
            # StopCube
            self.steps_press = 100
            self.interval = 30
            
            # PatternLock / RouteStick (mocking basic lists to avoid attribute errors if accessed)
            self.targets_grid = []
            self.buttons_grid = []
            self.selected_buttons = []
            self.route_button_indices = []
    
    env = MockEnv()
    planner = None
    base = MockBase()
    
    def _require_target():
        return None
    
    logger.debug("=" * 80)
    logger.debug("Options Labels for all tasks:")
    logger.debug("=" * 80)
    
    for task_name, builder_func in OPTION_BUILDERS.items():
        try:
            options = builder_func(env, planner, _require_target, base)
            logger.debug(f"\nTask: {task_name}")
            valid_options = [opt for opt in options if isinstance(opt, dict)]
            logger.debug(f"  Options Labels ({len(valid_options)} items):")
            
            for i, opt in enumerate(valid_options, 1):
                label = opt.get("label", "No label")
                action = opt.get("action", "")
                solve_func = opt.get("solve")
                needs_target = False
                if solve_func:
                    try:
                        sig = inspect.signature(solve_func)
                        if "require_target" in sig.parameters:
                            needs_target = True
                    except ValueError:
                        pass
                
                target_str = " [Need click target]" if needs_target else ""
                action_str = f" - {action}" if action else ""
                logger.debug(f"    {i}. {label}{action_str}{target_str}")
        except Exception as e:
            logger.debug(f"\nTask: {task_name}")
            logger.debug(f"  Error: Failed to get options - {type(e).__name__}: {e}")
    
    logger.debug("\n" + "=" * 80)


# You need to add the environment library path to LD_LIBRARY_PATH environment variable to force program to load libraries within environment first.
# You can run your script with the following command:
# export LD_LIBRARY_PATH=/home/hongzefu/micromamba/envs/maniskillenv1228/lib:$LD_LIBRARY_PATH
# /home/hongzefu/micromamba/envs/maniskillenv1228/bin/python /home/hongzefu/robomme-v5.7.2-sam2act-update/robomme/robomme_env/util/vqa_options.py