Codeit-AI-1team-LLM-project
μ±λ΄ μλΉμ€ μμ°
λ²‘ν° DB λμ보λ μμ
1. νλ‘μ νΈ κ°μ
- B2G μ μ°°μ§μ μ λ¬Έ 컨μ€ν μ€ννΈμ β 'RFPilot'
- RFP λ¬Έμλ₯Ό μμ½νκ³ , μ¬μ©μ μ§λ¬Έμ μ€μκ°μΌλ‘ μλ΅νλ μ±λ΄ μμ€ν
λ°°κ²½: λ§€μΌ μλ°± 건μ κΈ°μ λ° μ λΆ μ μμμ²μ(RFP)κ° κ²μλλλ°, κ° μμ²μ λΉ μμ νμ΄μ§κ° λλ 문건μ λͺ¨λ κ²ν νλ κ²μ λΆκ°λ₯ν©λλ€. μ΄λ¬ν κ³Όμ μ λΉν¨μ¨μ μ΄λ©°, μ€μν μ 보λ₯Ό λΉ λ₯΄κ² νμ νκΈ° μ΄λ ΅μ΅λλ€.
λͺ©ν: μ¬μ©μμ μ§λ¬Έμ μ€μκ°μΌλ‘ μλ΅νκ³ , κ΄λ ¨ μ μμλ₯Ό νμνμ¬ μμ½ μ 보λ₯Ό μ 곡νλ μ±λ΄μ κ°λ°νμ¬ μ»¨μ€ν΄νΈμ μ 무 ν¨μ¨μ ν₯μμν€κ³ μ ν©λλ€.
κΈ°λ ν¨κ³Ό: RAG μμ€ν μ ν΅ν΄ μ€μν μ 보λ₯Ό μ μνκ² μ 곡ν¨μΌλ‘μ¨, μ μμ κ²ν μκ°μ λ¨μΆνκ³ μ»¨μ€ν μ 무μ λ³΄λ€ μ§μ€ν μ μλ νκ²½μ μ‘°μ±ν©λλ€.
2. μ€μΉ λ° μ€ν(πͺ Windows)
Prerequisites
- Python 3.12.3 μ€μΉλ¨
- Poetry μ€μΉλ¨
- μ μ₯μ ν΄λ‘ μλ£
- λ°μ΄ν°μ λ‘컬μ μ μ₯
- μμνλ λͺ¨λΈ νμΌ(.gguf) μ μ₯
- .env μμ±(apiν€ μ λ ₯)
env νμΌ μ€μ λ°©λ²
OPENAI_API_KEY = "OpenAI API ν€"
WANDB_API_KEY = "WanDB API ν€"
LANGCHAIN_TRACING_V2=true
LANGSMITH_API_KEY = "LangSmith API ν€"
LANGCHAIN_PROJECT = "LangSmith νλ‘μ νΈ μ΄λ¦"
μ½λ μ€ν
# 1. νλ‘μ νΈ ν΄λλ‘ μ΄λ
cd Codeit-AI-1team-LLM-project
# 2. κ°μνκ²½ μ€μ λ° μμ‘΄μ± μ€μΉ
python -m poetry config virtualenvs.in-project true
python -m poetry env use 3.12.3
python -m poetry install
# 3. κ°μνκ²½ νμ±ν
python -m poetry env activate
# 4. μ€ν(μ μ²λ¦¬~벑ν°DB ꡬ츑)
python -m poetry run python main.py --step all
# 5. λ²‘ν° DB λμ보λ μ€ν
python -m poetry run streamlit run src/visualization/streamlit_app.py
# 6. μ±λ΄ μλΉμ€ μ€ν
python -m poetry run streamlit run src/visualization/chatbot_app.py
# 7. LangSmith μ€ν μ€ν(API λ° νλ‘μ νΈ μμ± νμ)
python -m poetry run python src/evaluation/run_experiment.py # λνν λ©λ΄
python -m poetry run python src/evaluation/run_experiment.py --run # μ€ν μ€ν
python -m poetry run python src/evaluation/run_experiment.py --compare # μ€ν λΉκ΅
3. νλ‘μ νΈ κ΅¬μ‘°
CODEIT-AI-1TEAM-LLM-PROJECT/
β
βββ main.py # μ€ν μ§μ
μ
βββ models/ # λ‘컬 λͺ¨λΈ λ‘λμ© μμν νμΌ μ μ₯ ν΄λ(λΉκ³΅κ°)
βββ data/ # λ¬Έμ λ° λ²‘ν°DB μ μ₯ ν΄λ(λΉκ³΅κ°)
β βββ files/ # hwp, pdf λ¬Έμ
β βββ data_list.csv # RFP λ¬Έμ μ 보 csv
βββ src/
β βββ loader/ # λ¬Έμ λ‘λ© λ° μ μ²λ¦¬
β βββ evaluation/ # LangSmith νκ°
β βββ embedding/ # μλ² λ©, 벑ν°DB μμ±
β βββ retriever/ # λ¬Έμ κ²μκΈ°
β βββ generator/ # μλ΅ μμ±κΈ°
β βββ visualization/ # UI ꡬμ±
β βββ notebooks/ # Hugging Face λͺ¨λΈ νμ΅ μ½λ
β βββ utils/ # κ³΅ν΅ ν¨μ λͺ¨λ
βββ README.md
main.py: μ 체 RAG νμ΄νλΌμΈ μ€νμ μ§μ μ μ λλ€.data/: μλ¬Έ λ¬Έμ, μμ±λ 벑ν°DB λ±μ΄ μ μ₯λ©λλ€.models/: λ‘컬 λͺ¨λΈ λ‘λμ© μμν λͺ¨λΈ νμΌμ μ μ₯νλ κ³³μ λλ€.src/loader: PDF, HWP λ¬Έμλ₯Ό ν μ€νΈλ‘ μΆμΆνκ³ μλ―Έ λ¨μλ‘ λΆν ν©λλ€.src/evaluation: LangSmith νκ° νκ²½μ κ΄λ¦¬νκ³ μ€νμ μ§νν©λλ€.src/embedding: ν μ€νΈ μλ² λ© λ²‘ν°λ₯Ό μμ±νκ³ Chroma DBλ₯Ό ꡬμΆν©λλ€.src/retriever: μ¬μ©μ μ§λ¬Έμ λν κ΄λ ¨ λ¬Έμλ₯Ό 벑ν°DBμμ κ²μν©λλ€.src/generator: κ²μλ λ¬Έμ κΈ°λ°μΌλ‘ LLMμ΄ μλ΅μ μμ±ν©λλ€.src/notebooks: λ‘컬 λͺ¨λΈμ Fine-Tuningνμ¬ μμν νμΌμ μμ±ν©λλ€.src/visualization: Streamlit κΈ°λ° μ¬μ©μ μΈν°νμ΄μ€λ₯Ό ꡬμ±ν©λλ€.src/utils: μ€μ νμΈ, κ²½λ‘ μ€μ λ± κ³΅ν΅ μ νΈλ¦¬ν° ν¨μλ€μ ν¬ν¨ν©λλ€.
4. ν μκ°
κΈ°λ³Έμ μΆ©μ€μ€νλ©° μ€μ μ¬μ© κ°λ₯ν λͺ¨λΈμ λ§λ€κΈ° μν΄ λμμμ΄ λ Έλ ₯νλ νμ λλ€.
π¨πΌβπ» λ©€λ² κ΅¬μ±
π¨πΌβπ» μν λΆλ΄
| μ§λμ§ | κΉμ§μ± | μ΄μ λ Έ | λ°μ§μ€ |
|---|---|---|---|
| PM/AI Enginner(Rettriever, Pre-trained, PEFT) | Data Scientist | AI Engineer(API, Prompt) | AI Engineer(HuggingFace, PEFT) |
| νλ‘μ νΈ μ΄κ΄. ν νμ μ§ν. ν νμ νκ²½ κ΄λ¦¬. RAG κ°λ°. λμ보λ κ°λ°, PEFT λ΄λΉ | νμ΅ λ°μ΄ν° ꡬμ±. λ°μ΄ν° μ μ²λ¦¬ νμ΄νλΌμΈ μμ±. κ°λ°κ° νμν μΈμ¬μ΄νΈ λμΆ λ° μ 보 μμ§, μ 곡 | API λͺ¨λΈ κ°λ°. ν둬ννΈ μμ±. λͺ¨λΈ κ°μ | HuggingFace λͺ¨λΈ νμ΅, λͺ¨λΈ κ°μ |
5. νλ‘μ νΈ νμλΌμΈ
6. μλΉμ€ μ€λͺ
μλΉμ€ μν€ν μ³
Further Information
κ°λ° μ€ν λ° κ°λ°νκ²½
μΈμ΄:
νλ μμν¬:
λΌμ΄λΈλ¬λ¦¬:
ν΄λΌμ°λ μλΉμ€:
λꡬ:
νμ Tools
κΈ°ν λ§ν¬
- Downloads last month
- 13
4-bit

