Phase 3 κ°μ : AZR ν νλ¦Ώ μ§μ ν΅ν© μλ£
β μ£Όμ κ°μ μ¬ν
1. AZR ν νλ¦Ώ μ§μ μ¬μ©
- κΈ°μ‘΄: λ¨μνλ TestTime μ μ© ν νλ¦Ώ (20-30λΌμΈ)
- κ°μ : AZR μλ³Έ ν νλ¦Ώ μ§μ νμ© (2000+ λ¬Έμ)
- ν¨κ³Ό: μμΈν μ μ½μ¬ν, μμ, νκ°κΈ°μ€ ν¬ν¨
2. νμ€ν¬ νμ λ³ AZR λ§€ν
| TestTime νμ€ν¬ | AZR λ¬Έμ νμ | μ€λͺ |
|---|---|---|
| Induction | code_f |
ν¨μ μμ± λ¬Έμ |
| Deduction | code_o |
μΆλ ₯ μμΈ‘ λ¬Έμ |
| Abduction | code_i |
μ λ ₯ μμ± λ¬Έμ |
3. μ½λ ꡬ쑰 μ΅μ ν
- ν
νλ¦Ώ μν¬νΈ:
from ..data_construction.prompts import get_code_problem_generator_prompt - λΆνμν μ½λ μ κ±°: κΈ°μ‘΄ λ¨μ ν νλ¦Ώ μ½λ μμ (150+ λΌμΈ μ 리)
- λ§€κ°λ³μ μμ :
composite_functions=[]μΆκ°λ‘ μ€λ₯ ν΄κ²°
π§ͺ ν μ€νΈ κ²°κ³Ό
AZR ν νλ¦Ώ νμ§ λΉκ΅
κΈ°μ‘΄ TestTime ν
νλ¦Ώ: 20-30λΌμΈ, κΈ°λ³Έμ μ€λͺ
AZR ν
νλ¦Ώ: 2000+ λ¬Έμ, μμΈν ꡬ쑰
- λ€μν μμ μ 곡
- λͺ
νν μ μ½μ¬ν
- 체κ³μ νκ°κΈ°μ€
- λ¨κ³λ³ μΆλ‘ μ λ
μμ±λ ν둬ννΈ μμ
- Induction: 2,274μ μμΈ ν둬ννΈ
- Deduction: 3,057μ μμΈ ν둬ννΈ
- Abduction: 3,063μ μμΈ ν둬ννΈ
π μ 리λ νμΌ
λΆνμν νμΌ μμ
- β
/tmp/azr/debug_ipo_failures.py - β
/tmp/azr/detailed_failure_analysis.py - β
/tmp/azr/complete_pipeline_details.py - β
/tmp/azr/show_full_pipeline.py
μ μ§λλ ν΅μ¬ νμΌ
- β
/tmp/azr/ipo_failure_analysis.json- IPO μ€ν¨ ν¨ν΄ κΈ°λ‘ - β
/tmp/azr/complete_pipeline_analysis.json- μ 체 νμ΄νλΌμΈ λΆμ - β
/tmp/azr/test_azr_templates.py- AZR ν νλ¦Ώ ν μ€νΈμ©
π― ν΅μ¬ λ°κ²¬μ¬ν
IPO μΆμΆ μ€ν¨ ν¨ν΄
μ±κ³΅: 1/5 μΌμ΄μ€ (Division by Zeroλ§ μ±κ³΅)
μ€ν¨: 4/5 μΌμ΄μ€
- Infinite Loop: Timeout (5μ΄)
- Import Error: ModuleNotFoundError
- Variable Error: NameError
- No Function: ν¨μ μ μ μμ
AZR ν νλ¦Ώ ν¨κ³Ό
- ν둬ννΈ κΈΈμ΄: 100λ°° μ¦κ° (30μ β 3000μ)
- ꡬ쑰: 체κ³μ multi-step ν둬ννΈ
- νμ§: μμΈν μμμ μ μ½μ¬ν ν¬ν¨
π μ½λ λ³κ²½μ¬ν
task_generator.py μ£Όμ μμ
# 1. AZR ν
νλ¦Ώ μν¬νΈ
from ..data_construction.prompts import get_code_problem_generator_prompt
# 2. νμ€ν¬λ³ AZR ν
νλ¦Ώ νμ©
- induction: code_f (ν¨μ μμ±)
- deduction: code_o (μΆλ ₯ μμΈ‘)
- abduction: code_i (μ
λ ₯ μμ±)
# 3. λ§€κ°λ³μ μμ
composite_functions=[] # λΉ λ¦¬μ€νΈλ‘ μ€μ
μ κ±°λ μ½λ
- κΈ°μ‘΄ ν νλ¦Ώ λ©μλ (150+ λΌμΈ)
- λΆνμν μμ λ³μ
- μ€λ³΅ ν μ€νΈ νμΌλ€
π κ°μ ν¨κ³Ό
- νμ§: AZR μμ€μ κ³ νμ§ ν둬ννΈ νμ©
- μΌκ΄μ±: AZR νμ΅ λ°μ΄ν°μ λμΌν νμ
- ν¨μ¨μ±: μ½λ μ€λ³΅ μ κ±° λ° μ§μ μ¬μ¬μ©
- νμ₯μ±: AZRμ λͺ¨λ ν νλ¦Ώ κΈ°λ₯ νμ© κ°λ₯
μλ£ μΌμ: 2025-07-16
μν: β
AZR ν
νλ¦Ώ ν΅ν© μλ£
λ€μ λ¨κ³: Phase 4 - RLVR νμ΅ μμ€ν
ꡬν