werty1248 commited on
Commit
09ba802
Β·
verified Β·
1 Parent(s): 9741d42

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +3 -3
README.md CHANGED
@@ -78,9 +78,9 @@ Janet은 맀일 농산물 μ‹œμž₯μ—μ„œ 18λ‹¬λŸ¬λ₯Ό λ²Œμ–΄λ“€μž…λ‹ˆλ‹€. μ΄λŠ”
78
  ### Rejection sampling Fine-Tuning (RFT) with least similar samples
79
 
80
  - λͺ©ν‘œ: μ΅œλŒ€ν•œ **λ‹€μ–‘ν•œ 풀이 방법**을 ν•™μŠ΅ν•˜κ²Œ λ§Œλ“œλŠ” 것
81
- 1. exp-models/Open-Reasoner-Zero-orz-math-57k-collected-Korean의 질문 μ…‹ 쀑, MCQA, 증λͺ…을 μš”κ΅¬ν•˜λŠ” 문제 μ œμ™Έ (54,832/56,878개)
82
- 2. HyperCLOVAX-1.5B에 CoT ν”„λ‘¬ν”„νŠΈλ₯Ό μΆ”κ°€(user μž…λ ₯에)ν•œ ν›„, **Pass@8** μ—μ„œ ν†΅κ³Όν•œ 질문만 μΆ”μΆœ (10,433/54,832개)
83
- 3. HyperCLOVAX-1.5B(+CoT)둜 **32회 μΆ”κ°€ μΆ”λ‘ ** ν›„ 정닡을 맞힌 λ‹΅λ³€λ§Œ μΆ”μΆœ + [Kanana-nano-2.1b](https://huggingface.co/kakaocorp/kanana-nano-2.1b-instruct)(+CoT)둜 **32회 μΆ”κ°€ μΆ”λ‘ ** ν›„ 정닡을 맞힌 λ‹΅λ³€λ§Œ μΆ”μΆœ
84
  - HyperCLOVAX-1.5B CoT Prompt: ```"μœ μ €κ°€ μ΅œμ’…μ μœΌλ‘œ κ΅¬ν•˜κ³ μž ν•˜λŠ” 값이 무엇인지 λ‹€μ‹œ ν•œ 번 μ •μ˜ν•˜κ³ , λ¬Έμ œμ—μ„œ μ œμ‹œλœ 쑰건도 κΉ”λ”ν•˜κ²Œ μ •λ¦¬ν•˜μ—¬ μž¬μž‘μ„±ν•©λ‹ˆλ‹€. 그리고 λ‚˜μ„œ 닡을 κ΅¬ν•˜κΈ° μœ„ν•΄ ꡬ체적으둜 논리 및 μˆ˜μ‹μ„ μ „κ°œν•˜λ©° 문제λ₯Ό ν‘Ό ν›„, μ΅œμ’… 닡변을 \\boxed{} μ•ˆμ— μž‘μ„±ν•©λ‹ˆλ‹€.\n\n"```
85
  - Kanana-2.1b CoT Prompt (λ§ˆμ§€λ§‰μ— "제λͺ© 없이 λ‚΄μš©λ§Œ 좜λ ₯ν•©λ‹ˆλ‹€." μΆ”κ°€): ```""μœ μ €κ°€ μ΅œμ’…μ μœΌλ‘œ κ΅¬ν•˜κ³ μž ν•˜λŠ” 값이 무엇인지 λ‹€μ‹œ ν•œ 번 μ •μ˜ν•˜κ³ , λ¬Έμ œμ—μ„œ μ œμ‹œλœ 쑰건도 κΉ”λ”ν•˜κ²Œ μ •λ¦¬ν•˜μ—¬ μž¬μž‘μ„±ν•©λ‹ˆλ‹€. 그리고 λ‚˜μ„œ 닡을 κ΅¬ν•˜κΈ° μœ„ν•΄ ꡬ체적으둜 논리 및 μˆ˜μ‹μ„ μ „κ°œν•˜λ©° 문제λ₯Ό ν‘Ό ν›„, μ΅œμ’… 닡변을 \\boxed{} μ•ˆμ— μž‘μ„±ν•©λ‹ˆλ‹€. 제λͺ© 없이 λ‚΄μš©λ§Œ μž‘μ„±ν•©λ‹ˆλ‹€.\n\n"```
86
 
 
78
  ### Rejection sampling Fine-Tuning (RFT) with least similar samples
79
 
80
  - λͺ©ν‘œ: μ΅œλŒ€ν•œ **λ‹€μ–‘ν•œ 풀이 방법**을 ν•™μŠ΅ν•˜κ²Œ λ§Œλ“œλŠ” 것
81
+ 1. [exp-models/Open-Reasoner-Zero-orz-math-57k-collected-Korean](https://huggingface.co/datasets/exp-models/Open-Reasoner-Zero-orz-math-57k-collected-Korean)의 질문 μ…‹ 쀑, MCQA, 증λͺ…을 μš”κ΅¬ν•˜λŠ” 문제 μ œμ™Έ (54,832/56,878개)
82
+ 2. [HyperCLOVAX-1.5B](https://huggingface.co/naver-hyperclovax/HyperCLOVAX-SEED-Text-Instruct-1.5B)에 CoT ν”„λ‘¬ν”„νŠΈλ₯Ό μΆ”κ°€(user μž…λ ₯에)ν•œ ν›„, **Pass@8** μ—μ„œ ν†΅κ³Όν•œ 질문만 μΆ”μΆœ (10,433/54,832개)
83
+ 3. [HyperCLOVAX-1.5B](https://huggingface.co/naver-hyperclovax/HyperCLOVAX-SEED-Text-Instruct-1.5B)(+CoT)둜 **32회 μΆ”κ°€ μΆ”λ‘ ** ν›„ 정닡을 맞힌 λ‹΅λ³€λ§Œ μΆ”μΆœ + [Kanana-nano-2.1b](https://huggingface.co/kakaocorp/kanana-nano-2.1b-instruct)(+CoT)둜 **32회 μΆ”κ°€ μΆ”λ‘ ** ν›„ 정닡을 맞힌 λ‹΅λ³€λ§Œ μΆ”μΆœ
84
  - HyperCLOVAX-1.5B CoT Prompt: ```"μœ μ €κ°€ μ΅œμ’…μ μœΌλ‘œ κ΅¬ν•˜κ³ μž ν•˜λŠ” 값이 무엇인지 λ‹€μ‹œ ν•œ 번 μ •μ˜ν•˜κ³ , λ¬Έμ œμ—μ„œ μ œμ‹œλœ 쑰건도 κΉ”λ”ν•˜κ²Œ μ •λ¦¬ν•˜μ—¬ μž¬μž‘μ„±ν•©λ‹ˆλ‹€. 그리고 λ‚˜μ„œ 닡을 κ΅¬ν•˜κΈ° μœ„ν•΄ ꡬ체적으둜 논리 및 μˆ˜μ‹μ„ μ „κ°œν•˜λ©° 문제λ₯Ό ν‘Ό ν›„, μ΅œμ’… 닡변을 \\boxed{} μ•ˆμ— μž‘μ„±ν•©λ‹ˆλ‹€.\n\n"```
85
  - Kanana-2.1b CoT Prompt (λ§ˆμ§€λ§‰μ— "제λͺ© 없이 λ‚΄μš©λ§Œ 좜λ ₯ν•©λ‹ˆλ‹€." μΆ”κ°€): ```""μœ μ €κ°€ μ΅œμ’…μ μœΌλ‘œ κ΅¬ν•˜κ³ μž ν•˜λŠ” 값이 무엇인지 λ‹€μ‹œ ν•œ 번 μ •μ˜ν•˜κ³ , λ¬Έμ œμ—μ„œ μ œμ‹œλœ 쑰건도 κΉ”λ”ν•˜κ²Œ μ •λ¦¬ν•˜μ—¬ μž¬μž‘μ„±ν•©λ‹ˆλ‹€. 그리고 λ‚˜μ„œ 닡을 κ΅¬ν•˜κΈ° μœ„ν•΄ ꡬ체적으둜 논리 및 μˆ˜μ‹μ„ μ „κ°œν•˜λ©° 문제λ₯Ό ν‘Ό ν›„, μ΅œμ’… 닡변을 \\boxed{} μ•ˆμ— μž‘μ„±ν•©λ‹ˆλ‹€. 제λͺ© 없이 λ‚΄μš©λ§Œ μž‘μ„±ν•©λ‹ˆλ‹€.\n\n"```
86