# RoboCasa State / Action 명세

> 근거 파일: `env.py`, `gym_wrapper.py` (`PandaOmronKeyConverter`), `robosuite/controllers/parts/arm/osc.py`, `robosuite/controllers/config/robots/default_pandaomron.json`

---

## State (총 16차원)

`env.py: convert_state()` 기준으로 concatenate됨.

| 인덱스 | 차원 | 키 | absolute / relative | 표현 |
|--------|------|----|---------------------|------|
| 0~2 | 3 | `state.base_position` | **absolute** | xyz |
| 3~6 | 4 | `state.base_rotation` | **absolute** | **Quaternion** (`robot0_base_quat`) |
| 7~9 | 3 | `state.end_effector_position_relative` | **relative** (base → EE) | xyz |
| 10~13 | 4 | `state.end_effector_rotation_relative` | **relative** (base → EE) | **Quaternion** (`robot0_base_to_eef_quat`) |
| 14~15 | 2 | `state.gripper_qpos` | — | joint position |

---

## Action (총 12차원)

`env.py: convert_action()` 기준으로 분해됨.

| 인덱스 | 차원 | 키 | 설명 |
|--------|------|----|------|
| 0~3 | 4 | `action.base_motion` | 베이스 이동 (아래 참고) |
| 4 | 1 | `action.control_mode` | 제어 모드 스위치 (아래 참고) |
| 5~7 | 3 | `action.end_effector_position` | EE delta position, **base frame 기준** |
| 8~10 | 3 | `action.end_effector_rotation` | EE delta rotation, **base frame 기준, axis-angle** |
| 11 | 1 | `action.gripper_close` | 그리퍼 닫기 (0.5 threshold → binary) |

### base_motion (4차원) 상세

| 인덱스 | 대상 | controller type | 설명 |
|--------|------|-----------------|------|
| 0~2 | `robot0_base` | `JOINT_VELOCITY` | 모바일 베이스 x속도 / y속도 / yaw속도 |
| 3 | `robot0_torso` | `JOINT_POSITION` | 몸통 수직 리프트 joint position (≈ 높이) |

### control_mode (1차원) 상세

| 값 | base_mode | 동작 |
|----|-----------|------|
| < 0.5 | -1 | **Arm mode** — 베이스 고정, 팔로 조작 (goal: `achieved` 기준) |
| ≥ 0.5 | +1 | **Base mode** — 베이스 이동, 팔 목표 유지 (goal: `desired` 기준) |

---

## EE Rotation: axis-angle을 쓰는 이유

OSC controller(`osc.py`)는 rotation input을 `Rotation.from_rotvec()` 으로 해석 → **axis-angle 고정**.

RPY(Euler angle) 대신 axis-angle을 쓰는 이유:

1. **Gimbal lock 없음** — RPY는 특정 자세에서 두 축이 겹쳐 DOF를 잃는 singularity 발생. EE는 자유 회전하므로 실제 문제가 됨.
2. **Delta 제어에 자연스러움** — "이 축 방향으로 θ만큼 회전" 의미가 직관적이고 보간이 smooth. RPY delta는 순서 의존성(roll→pitch→yaw) 때문에 합성이 복잡함.
3. **크기 = 회전량** — 벡터 norm이 회전각이라 output clipping이 자연스러움. (`output_max: [0.5, 0.5, 0.5]` rad)

> RPY 입력은 코드상 지원하지 않음. 필요하면 wrapper에서 변환 필요:
> ```python
> from scipy.spatial.transform import Rotation
> axis_angle = Rotation.from_euler('xyz', rpy).as_rotvec()
> ```

---

## 시뮬레이션 연결 흐름

```
policy output (12-dim)
    ↓ convert_action()  [env.py]
action dict (base_motion, control_mode, EE_pos, EE_rot, gripper_close)
    ↓ unmap_action()  [gym_wrapper.py]
{
  robot0_right:        concat(EE_pos[3], EE_rot[3])  → OSC_POSE controller
  robot0_right_gripper: threshold(gripper_close, 0.5) → -1 or +1
  robot0_base:         base_motion[0:3]              → JOINT_VELOCITY controller
  robot0_torso:        base_motion[3:4]              → JOINT_POSITION controller
  robot0_base_mode:    threshold(control_mode, 0.5)  → -1 or +1
}
    ↓ env.step()  [robosuite]
MuJoCo simulation
```