Phase 5 Stage A v5 + Phase 7 multi-task LoRAs (server3, 2026-05-02)

Stage A v5 reasoning-only T1 LLM

merged_stub_20260502: trained on prod_samples_merged data (97% stub reasoning); paper §D baseline for "effect of reasoning data quality"
reasoning_only_20260502: trained on Ling-expanded reasoning_traces (T2: 9k Ling, T3: 4k Ling); paper §D rich-reasoning variant

The pair forms an §D ablation showing that pure-Ling reasoning data gives stronger task LoRAs than mixed-stub data.