---
license: mit
base_model: klue/bert-base
tags:
- bert
- lora
- korean
- text-classification
- sentiment-analysis
language:
- ko
datasets:
- nsmc
---

# NSMC 감정 분석 (LoRA Fine-tuned)

이 모델은 LoRA를 사용하여 NSMC(Naver Sentiment Movie Corpus) 데이터셋으로 파인튜닝된 감정 분석 모델입니다.

## 모델 정보

- **베이스 모델:** klue/bert-base
- **파인튜닝 방법:** LoRA (Low-Rank Adaptation)
- **학습 파라미터:** 약 0.3% (~300K)
- **데이터셋:** NSMC (네이버 영화 리뷰)
- **Task:** 이진 분류 (긍정/부정)

## 사용 방법
```python
from transformers import AutoModelForSequenceClassification, AutoTokenizer
from peft import PeftModel
import torch

# 베이스 모델 로드
base_model = AutoModelForSequenceClassification.from_pretrained(
    "klue/bert-base",
    num_labels=2
)

# LoRA 어댑터 로드
model = PeftModel.from_pretrained(base_model, "JINIIII/nsmc-sentiment-lora")
tokenizer = AutoTokenizer.from_pretrained("JINIIII/nsmc-sentiment-lora")

# 추론
text = "이 영화 정말 재미있어요!"

inputs = tokenizer(text, return_tensors="pt", truncation=True, max_length=128)
outputs = model(**inputs)

probs = torch.softmax(outputs.logits, dim=-1)
pred = torch.argmax(probs, dim=-1).item()

label = "긍정" if pred == 1 else "부정"
confidence = probs[0][pred].item()

print(f"결과: {label} (확신도: {confidence:.2%})")
```

## 학습 세부사항

- **LoRA Rank (r):** 8
- **LoRA Alpha:** 16
- **Target Modules:** query, value
- **Dropout:** 0.1
- **학습 에폭:** 5
- **학습률:** 5e-4

## 성능

- **학습 데이터:** 10,000개
- **평가 데이터:** 2,000개
- **평가 정확도:** ~85-90%

## 활용 예시

- 영화 리뷰 감정 분석
- 상품 리뷰 분석
- SNS 감정 모니터링
- 고객 피드백 자동 분류

## 제한사항

- 영화 리뷰 도메인에 특화되어 있음
- 짧은 텍스트에서 가장 좋은 성능
- 극단적인 감정 표현에서 정확도가 높음

## 라이선스

MIT License

## 작성자

JINIIII

## 인용
```bibtex
@misc{nsmc-sentiment-lora,
  author = {JINIIII},
  title = {NSMC Sentiment Analysis with LoRA},
  year = {2024},
  publisher = {Hugging Face},
  url = {https://huggingface.co/JINIIII/nsmc-sentiment-lora}
}
```

**Note**: 이 모델은 교육 목적으로 만들어졌습니다.