neural-mesh-v2 / Update /Phase3_AZR_Template_Integration.md
hjkim00's picture
Restore all essential files - code, configs, and MBPP/HumanEval data
24c2665 verified

Phase 3 κ°œμ„ : AZR ν…œν”Œλ¦Ώ 직접 톡합 μ™„λ£Œ

βœ… μ£Όμš” κ°œμ„ μ‚¬ν•­

1. AZR ν…œν”Œλ¦Ώ 직접 μ‚¬μš©

  • κΈ°μ‘΄: λ‹¨μˆœν™”λœ TestTime μ „μš© ν…œν”Œλ¦Ώ (20-30라인)
  • κ°œμ„ : AZR 원본 ν…œν”Œλ¦Ώ 직접 ν™œμš© (2000+ 문자)
  • 효과: μƒμ„Έν•œ μ œμ•½μ‚¬ν•­, μ˜ˆμ‹œ, 평가기쀀 포함

2. νƒœμŠ€ν¬ νƒ€μž…λ³„ AZR λ§€ν•‘

TestTime νƒœμŠ€ν¬ AZR 문제 νƒ€μž… μ„€λͺ…
Induction code_f ν•¨μˆ˜ 생성 문제
Deduction code_o 좜λ ₯ 예츑 문제
Abduction code_i μž…λ ₯ 생성 문제

3. μ½”λ“œ ꡬ쑰 μ΅œμ ν™”

  • ν…œν”Œλ¦Ώ μž„ν¬νŠΈ: from ..data_construction.prompts import get_code_problem_generator_prompt
  • λΆˆν•„μš”ν•œ μ½”λ“œ 제거: κΈ°μ‘΄ λ‹¨μˆœ ν…œν”Œλ¦Ώ μ½”λ“œ μ‚­μ œ (150+ 라인 정리)
  • λ§€κ°œλ³€μˆ˜ μˆ˜μ •: composite_functions=[] μΆ”κ°€λ‘œ 였λ₯˜ ν•΄κ²°

πŸ§ͺ ν…ŒμŠ€νŠΈ κ²°κ³Ό

AZR ν…œν”Œλ¦Ώ ν’ˆμ§ˆ 비ꡐ

κΈ°μ‘΄ TestTime ν…œν”Œλ¦Ώ: 20-30라인, 기본적 μ„€λͺ…
AZR ν…œν”Œλ¦Ώ: 2000+ 문자, μƒμ„Έν•œ ꡬ쑰
- λ‹€μ–‘ν•œ μ˜ˆμ‹œ 제곡
- λͺ…ν™•ν•œ μ œμ•½μ‚¬ν•­
- 체계적 평가기쀀
- 단계별 μΆ”λ‘  μœ λ„

μƒμ„±λœ ν”„λ‘¬ν”„νŠΈ μ˜ˆμ‹œ

  • Induction: 2,274자 상세 ν”„λ‘¬ν”„νŠΈ
  • Deduction: 3,057자 상세 ν”„λ‘¬ν”„νŠΈ
  • Abduction: 3,063자 상세 ν”„λ‘¬ν”„νŠΈ

πŸ“‚ μ •λ¦¬λœ 파일

λΆˆν•„μš”ν•œ 파일 μ‚­μ œ

  • ❌ /tmp/azr/debug_ipo_failures.py
  • ❌ /tmp/azr/detailed_failure_analysis.py
  • ❌ /tmp/azr/complete_pipeline_details.py
  • ❌ /tmp/azr/show_full_pipeline.py

μœ μ§€λ˜λŠ” 핡심 파일

  • βœ… /tmp/azr/ipo_failure_analysis.json - IPO μ‹€νŒ¨ νŒ¨ν„΄ 기둝
  • βœ… /tmp/azr/complete_pipeline_analysis.json - 전체 νŒŒμ΄ν”„λΌμΈ 뢄석
  • βœ… /tmp/azr/test_azr_templates.py - AZR ν…œν”Œλ¦Ώ ν…ŒμŠ€νŠΈμš©

🎯 핡심 λ°œκ²¬μ‚¬ν•­

IPO μΆ”μΆœ μ‹€νŒ¨ νŒ¨ν„΄

성곡: 1/5 μΌ€μ΄μŠ€ (Division by Zero만 성곡)
μ‹€νŒ¨: 4/5 μΌ€μ΄μŠ€
- Infinite Loop: Timeout (5초)
- Import Error: ModuleNotFoundError  
- Variable Error: NameError
- No Function: ν•¨μˆ˜ μ •μ˜ μ—†μŒ

AZR ν…œν”Œλ¦Ώ 효과

  • ν”„λ‘¬ν”„νŠΈ 길이: 100λ°° 증가 (30자 β†’ 3000자)
  • ꡬ쑰: 체계적 multi-step ν”„λ‘¬ν”„νŠΈ
  • ν’ˆμ§ˆ: μƒμ„Έν•œ μ˜ˆμ‹œμ™€ μ œμ•½μ‚¬ν•­ 포함

πŸ“ μ½”λ“œ 변경사항

task_generator.py μ£Όμš” μˆ˜μ •

# 1. AZR ν…œν”Œλ¦Ώ μž„ν¬νŠΈ
from ..data_construction.prompts import get_code_problem_generator_prompt

# 2. νƒœμŠ€ν¬λ³„ AZR ν…œν”Œλ¦Ώ ν™œμš©
- induction: code_f (ν•¨μˆ˜ 생성)
- deduction: code_o (좜λ ₯ 예츑)  
- abduction: code_i (μž…λ ₯ 생성)

# 3. λ§€κ°œλ³€μˆ˜ μˆ˜μ •
composite_functions=[]  # 빈 리슀트둜 μ„€μ •

제거된 μ½”λ“œ

  • κΈ°μ‘΄ ν…œν”Œλ¦Ώ λ©”μ„œλ“œ (150+ 라인)
  • λΆˆν•„μš”ν•œ μž„μ‹œ λ³€μˆ˜
  • 쀑볡 ν…ŒμŠ€νŠΈ νŒŒμΌλ“€

πŸŽ‰ κ°œμ„  효과

  1. ν’ˆμ§ˆ: AZR μˆ˜μ€€μ˜ κ³ ν’ˆμ§ˆ ν”„λ‘¬ν”„νŠΈ ν™œμš©
  2. 일관성: AZR ν•™μŠ΅ 데이터와 λ™μΌν•œ ν˜•μ‹
  3. νš¨μœ¨μ„±: μ½”λ“œ 쀑볡 제거 및 직접 μž¬μ‚¬μš©
  4. ν™•μž₯μ„±: AZR의 λͺ¨λ“  ν…œν”Œλ¦Ώ κΈ°λŠ₯ ν™œμš© κ°€λŠ₯

μ™„λ£Œ μΌμ‹œ: 2025-07-16
μƒνƒœ: βœ… AZR ν…œν”Œλ¦Ώ 톡합 μ™„λ£Œ λ‹€μŒ 단계: Phase 4 - RLVR ν•™μŠ΅ μ‹œμŠ€ν…œ κ΅¬ν˜„