| ## λͺ¨λΈ κ°μ | |
| μ΄ νλ‘μ νΈλ λκ·λͺ¨ ν¬μ€μΌμ΄ λ°μ΄ν°μ μ κΈ°λ°μΌλ‘ μ¬μ©μκ° μ λ’°μ± μλ μλ£ μ 보λ₯Ό μΈμ μ΄λμλ μ»μ μ μλλ‘ λλ νλ«νΌ ꡬμΆμ λͺ©νλ‘ νμμ΅λλ€. **μ΄κ±°λ AI ν¬μ€μΌμ΄ μ§μμλ΅ λ°μ΄ν°**λ₯Ό νμ©νμ¬ μλ£ λΆμΌμ μ λ¬Έ μ§μμ ν¬ν¨ν λκ·λͺ¨ AI λͺ¨λΈμ κΈ°λ°μΌλ‘ νλ©°, νμλ€μκ² μ μνκ³ μ νν μλ£ μ 보λ₯Ό μ 곡ν©λλ€. | |
| ## λͺ¨λΈ μμΈ μ€λͺ | |
| - **λͺ¨λΈλͺ **: RAFT + RAG κΈ°λ° μλ£ μλ΄ μ±λ΄ | |
| - **κΈ°λ° λͺ¨λΈ**: Gemma-2-2b-it | |
| - **νμ΅ λ°©λ²**: GPT 4o-miniλ₯Ό νμ©ν λ°μ΄ν° μ¦κ° λ° RAFT λ°©λ² μ μ© | |
| - **μν€ν μ²**: Gemma-2-2b-itκ³Ό λμΌν ꡬ쑰 μ¬μ© | |
| ## λ°μ΄ν°μ | |
| - **λ°μ΄ν°μ μ΄λ¦**: μ΄κ±°λ AI ν¬μ€μΌμ΄ μ§μμλ΅ λ°μ΄ν° | |
| - **μΆμ²**: [AI νλΈ](https://www.aihub.or.kr/aihubdata/data/view.do?dataSetSn=71762) | |
| - **λ°μ΄ν° ꡬμ±**: | |
| - 40%: μ λ΅μ΄ ν¬ν¨λ λ¬Έμ 1κ° + μ λ΅κ³Ό κ΄λ ¨ μλ λ¬Έμ 1κ° | |
| - 60%: μ λ΅κ³Ό κ΄λ ¨ μλ λ¬Έμ 2κ° | |
| ## νμ΅ λ°©λ² | |
| λͺ¨λΈμ GPT 4o-miniλ₯Ό νμ©ν λ°μ΄ν° μ¦κ° κΈ°λ²κ³Ό RAFT([Adapting Language Model to Domain Specific RAG](https://arxiv.org/abs/2403.10131)) λ°©λ²μ μ μ©νμ¬ νμ΅λμμ΅λλ€. μ΄λ¬ν λ°©λ²μ ν΅ν΄ λͺ¨λΈμ 볡μ‘ν λ¬Έλ§₯ μ΄ν΄μ μ νν μ 보 κ²μ λ₯λ ₯μ ν₯μμμΌ°μ΅λλ€. | |
| ### μμ | |
| ````plaintext | |
| <bos><start_of_turn>user | |
| <Question>: μ‘±μ κ·Όλ§μΌ μ¬νμ μν΄ μ΄λ€ μ‘°μΉλ₯Ό μ·¨ν΄μΌ νλμ? | |
| <Documents>: [ | |
| 'μ‘±μ κ·Όλ§μΌ μ¬νμ λ° κ±΄κ°μ ν볡νκ³ ν΅μ¦μ μννκΈ° μν΄ λ€μν μ‘°μΉλ€μ μ·¨νλ κ²μ΄ μ€μν©λλ€. ...', | |
| 'μΈμ ν μ€νΈλ μ€ μ₯μ μΉλ£λ₯Ό μν΄ μ½λ¬Ό μΉλ£κ° μ νλ μ μμ΅λλ€. ...' | |
| ] | |
| <end_of_turn> | |
| <start_of_turn>model | |
| <Answer>: μ‘±μ κ·Όλ§μΌ μ¬νμ μν΄ μ·¨ν΄μΌ ν μ‘°μΉλ λ€μκ³Ό κ°μ΅λλ€: ... | |
| <end_of_turn><eos> | |
| ```` | |
| ### μμ | |
| #### μ§λ¬Έ: | |
| ````plaintext | |
| λν΅μ΄ μμ£Ό λ°μνλ μ΄μ κ° κΆκΈν©λλ€. μ€νΈλ μ€ λλ¬ΈμΌκΉμ, μλλ©΄ λ€λ₯Έ κ±΄κ° λ¬Έμ μΌκΉμ? μ΄λ€ μν©μμ λν΅μ΄ μ¬ν΄μ§λμ§μ ν¨κ» μ£Όμν μ μ μκ³ μΆμ΄μ. | |
| ```` | |
| #### λ΅λ³: | |
| ````markdown | |
| ## λν΅μ μμΈ | |
| λν΅μ μ¬λ¬ κ°μ§ μμΈμΌλ‘ λ°μν μ μμ΅λλ€. κ°μ₯ μΌλ°μ μΈ μμΈμΌλ‘λ λ€μκ³Ό κ°μ κ²λ€μ΄ μμ΅λλ€: | |
| 1. **μ€νΈλ μ€**: μΌμμνμμμ μ€νΈλ μ€λ λν΅μ μ λ°ν μ μμ΅λλ€. νΉν μ 무λ νμ , κ°μ‘± κ΄κ³μμμ μλ°κ°μ΄ λν΅μ μ νμν¬ μ μμ΅λλ€. | |
| 2. **μ 체μ μμΈ**: κ·Όμ‘μ κΈ΄μ₯, νμ‘ μν λ¬Έμ , νΈλ₯΄λͺ¬ λ³ν λ± μ 체μ μΈ μμΈλ λν΅μ μ λ°ν μ μμ΅λλ€. | |
| 3. **μμ κ²°ν**: λΉνλ―Ό B6 κ²°νμ΄λ λ¨λ°±μ§ λΆμ‘±μ λν΅μ μΌμΌν¬ μ μμ΅λλ€. | |
| 4. **μ½λ¬Ό**: νΉμ μ½λ¬Ό, νΉν νμ°μΈμ λ μ§ν΅μ λ±μ΄ λν΅μ μ λ°ν μ μμ΅λλ€. | |
| 5. **λΉλ§**: 체μ€μ΄ κ³Όλ€νλ©΄ νμ‘μνμ΄ μ νλμ΄ λν΅μ΄ λ°μν μ μμ΅λλ€. | |
| ## λν΅μ μ£Όμμ | |
| λν΅μ΄ μμ£Ό λ°μνλ κ²½μ°, λ€μκ³Ό κ°μ μ£Όμμ μ λ°λ₯΄λ κ²μ΄ μ€μν©λλ€: | |
| - **μ€νΈλ μ€ κ΄λ¦¬**: μ€νΈλ μ€λ₯Ό μ€μ΄κΈ° μν΄ λͺ μ, μκ°, μ¬νΈν‘ λ±μ λ°©λ²μ μλν΄λ³΄μΈμ. | |
| - **건κ°ν μμ΅κ΄**: κ· ν μ‘ν μμ¬λ₯Ό νκ³ , κ³Όμμ΄λ νμνλ¬Ό κ³Όλ€ μμ·¨λ₯Ό νΌνμΈμ. | |
| - **κ·μΉμ μΈ μ΄λ**: λ§€μΌ μ§§μ μ΄λμ ν΅ν΄ νμ‘μνμ κ°μ νκ³ μ€νΈλ μ€λ₯Ό μ€μ΄λ λ° λμμ΄ λ©λλ€. | |
| - **μΆ©λΆν μλ©΄**: κ·μΉμ μΈ μλ©΄ ν¨ν΄μ μ μ§νκ³ , μ μκΈ° μ μλ μ€νΈλ μ€λ₯Ό μ€μ΄λ κ²μ΄ μ€μν©λλ€. | |
| - **μ λ¬Έκ° μλ΄**: λν΅μ΄ λ°λ³΅μ μΌλ‘ λ°μνκ±°λ μ¬κ°ν μ¦μμ΄ μμ κ²½μ°, μμ¬μ μλ΄νμ¬ μ μ ν μ§λ¨κ³Ό μΉλ£λ₯Ό λ°λ κ²μ΄ νμν©λλ€. | |
| λν΅μ μΌλ°μ μΌλ‘ μΌμμνμ ν° μ§μ₯μ μ£Όμ§ μμ§λ§, λ§μ½ μμ£Ό λ°μνκ±°λ μ¬κ°ν μ¦μμ΄ λνλλ€λ©΄ μ λ¬Έκ°μ λμμ λ°λ κ²μ΄ μ’μ΅λλ€. | |
| ```` | |
| ## νκ° κ²°κ³Ό | |
| λ³Έ μ°κ΅¬μμλ RAFT + RAG λͺ¨λΈκ³Ό κΈ°μ‘΄ λͺ¨λΈμΈ Gemma-2-2b-itμ λΉκ΅νμ¬ **RAGAS: Automated Evaluation of Retrieval Augmented Generation** λ°©λ²λ‘ μ μ¬μ©νμ¬ λ΅λ³ μ μ¬λλ₯Ό νκ°νμ΅λλ€. | |
| - **Gemma-2-2b-it λͺ¨λΈ**: νκ· **79.98%** μ μ μ¬λ κΈ°λ‘ | |
| - **RAFT + RAG λͺ¨λΈ**: νκ· **96.02%** μ μ μ¬λ κΈ°λ‘ | |
| - μ΅μ μ μ¬λ: **92.39%** | |
| - μ΅λ μ μ¬λ: **98.56%** | |
| μ½ **16%** μ μ±λ₯ ν₯μμ΄ νμΈλμμΌλ©°, μ΄λ RAFT + RAG λͺ¨λΈμ΄ 볡μ‘ν λ¬Έλ§₯κ³Ό μ 보 κ²μμμ μ°μν μ²λ¦¬ λ₯λ ₯μ 보μ νκ³ μμμ λνλ λλ€. | |
| <img src="https://cdn-uploads.huggingface.co/production/uploads/64252e69120a3ed323304387/kcy1FWOJ2OxCtyhakfTGe.png" alt="image" width="80%"> | |
| ## μ¬μ© λ°©λ² | |
| μ¬μ© λ°©λ²κ³Ό μν€ν μ²λ **Gemma-2-2b-it** λͺ¨λΈκ³Ό λμΌν©λλ€. λͺ¨λΈμ νκ΅μ΄ μλ£ μ§μμ λν΄ μ λ¬Έμ μΈ λ΅λ³μ μ 곡ν©λλ€. | |
| ## λͺ¨λΈ λ° μμν λ²μ | |
| μλλ λ³Έ λͺ¨λΈκ³Ό μμνν λ²μ , κ·Έλ¦¬κ³ DSF(Domain-Specific Fine-tuning) λͺ¨λΈμ λ§ν¬μ λλ€: | |
| - **RAFT λͺ¨λΈ** | |
| - [devlim/Korea-HealthCare-RAFT-float16](https://huggingface.co/devlim/Korea-HealthCare-RAFT-float16) | |
| - [devlim/Korea-HealthCare-RAFT-unit8](https://huggingface.co/devlim/Korea-HealthCare-RAFT-unit8) | |
| - **DSF λͺ¨λΈ** | |
| - [devlim/Korea-HealthCare-DSF-float16](https://huggingface.co/devlim/Korea-HealthCare-DSF-float16) | |
| - [devlim/Korea-HealthCare-DSF-unit8](https://huggingface.co/devlim/Korea-HealthCare-DSF-unit8) | |
| ## μ ν μ¬ν λ° μ£Όμμ¬ν | |
| - **μλ£ μ‘°μΈ**: μ΄ λͺ¨λΈμ μλ£ μ 보λ₯Ό μ 곡νμ§λ§, μ λ¬Έμ μΈ μλ£ μλ΄μ΄λ μ§λ¨μ λ체νμ§ μμ΅λλ€. κ±΄κ° κ΄λ ¨ μμ¬ κ²°μ μ λ°λμ μλ£ μ λ¬Έκ°μ μμνμκΈ° λ°λλλ€. | |
| - **λ°μ΄ν° νκ³**: λͺ¨λΈμ νμ΅λ λ°μ΄ν° λ²μ λ΄μμ λ΅λ³μ μ 곡ν©λλ€. μ΅μ μλ£ μ§μΉ¨μ΄λ κ°μΈλ³ μν©μ λν κ³ λ €λ λΆμ‘±ν μ μμ΅λλ€. | |
| - **μ± μ νκ³**: μ΄ λͺ¨λΈμ μ¬μ©μΌλ‘ λ°μνλ κ²°κ³Όμ λν΄ κ°λ°μλ μ± μμ μ§μ§ μμ΅λλ€. | |
| ## μΈμ© | |
| μ΄ λͺ¨λΈμ μ¬μ©νκ±°λ μ°κ΅¬μ μ°Έκ³ νμ€ κ²½μ° λ€μ λ¬Ένμ μΈμ©ν΄μ£ΌμκΈ° λ°λλλ€: | |
| - **μ΄κ±°λ AI ν¬μ€μΌμ΄ μ§μμλ΅ λ°μ΄ν°**: AI νλΈ, [μ΄κ±°λ AI ν¬μ€μΌμ΄ μ§μμλ΅ λ°μ΄ν°](https://www.aihub.or.kr/aihubdata/data/view.do?dataSetSn=71762) | |
| - **Gemma 2 λͺ¨λΈ**: "Gemma 2: Improving Open Language Models at a Practical Size", *2023*. | |
| - **RAFT λ°©λ²λ‘ **: "Adapting Language Model to Domain Specific RAG", *arXiv preprint arXiv:2403.10131*, 2023. | |
| - **RAGAS νκ° λ°©λ²λ‘ **: "RAGAS: Automated Evaluation of Retrieval Augmented Generation", *2023*. | |
| ## λΌμ΄μ μ€ | |
| μ΄ λͺ¨λΈμ ν΄λΉ λ°μ΄ν°μ κ³Ό μμ² λͺ¨λΈμ λΌμ΄μ μ€ μ‘°κ±΄μ λ°λΌ μ¬μ©ν΄μΌ ν©λλ€. μ¬μ© μ μ λ°λμ λΌμ΄μ μ€ λ΄μ©μ νμΈνμκΈ° λ°λλλ€. | |