Model Card for Model ID

language: ko datasets: - imdb metrics: - accuracy - f1 model_name: bert-based-uncased-imdb-sentiment license: apache-2.0 tags: - 텍스트분류 - 감성분석 - imdb

모델 카드: IMDB 데이터로 파인튜닝된 BERT-base-uncased 감성 분석 모델

모델 개요

이 모델은 BERT-base-uncased를 기반으로 하며, IMDB 영화 리뷰 데이터셋을 이용해 감성 분석(Sentiment Analysis) 작업에 맞게 파인튜닝되었습니다.
텍스트를 두 가지 감정으로 분류합니다:

0: 부정 (Negative)
1: 긍정 (Positive)

모델 상세 정보

기반 모델: bert-base-uncased
작업(Task): 감성 분류 (Sentiment Classification)
데이터셋: IMDB
라벨 수: 2 (부정, 긍정)
언어: 영어

학습 정보

파인튜닝 데이터셋: IMDB (Hugging Face Datasets의 공식 분할 사용)
에포크 수: (필요 시 명시)
옵티마이저: AdamW
학습률: (필요 시 명시)
평가 지표: Accuracy, F1-score

성능 지표

지표	점수
정확도 (Accuracy)	0.88
F1 점수 (F1 Score)	0.88

측정은 IMDB 테스트 세트에서 수행되었습니다.

사용 방법

from transformers import AutoTokenizer, AutoModelForSequenceClassification

model_name = "your-username/bert-based-uncased-imdb-sentiment"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSequenceClassification.from_pretrained(model_name)

text = "This movie was amazing!"
inputs = tokenizer(text, return_tensors="pt")
outputs = model(**inputs)
pred = outputs.logits.argmax(-1).item()
print("Sentiment:", "Positive" if pred == 1 else "Negative")

사용 의도

이 모델은 영어 영화 리뷰 감성 분석 작업을 위해 설계되었습니다.
다른 영어 텍스트 감성 분석 과제에 사용할 경우, 추가 파인튜닝을 통해 확장 응용할 수 있습니다.

제한 사항

영화 리뷰 데이터에 한정되어 학습되었기 때문에, 다른 도메인(예: 제품 리뷰, 뉴스 기사 등)에서는 정확도가 낮을 수 있습니다.
중립적이거나 복합적인 감정이 포함된 문장은 오분류될 가능성이 있습니다.

인용

연구 또는 서비스에서 본 모델을 사용할 경우 아래와 같이 인용해주세요.

@misc{bert-imdb-finetuned,
  title={BERT-base-uncased fine-tuned on IMDB Sentiment Dataset},
  author={Your Name},
  year={2025},
  howpublished={Hugging Face Hub},
}

라이선스

본 모델은 Apache 2.0 라이선스 하에 배포됩니다.

참고 문헌

BERT 모델: Devlin et al., 2019
데이터셋: Hugging Face Datasets의 IMDB

Downloads last month: 1

Safetensors

Model size

0.1B params

Tensor type

F32

Paper for blockenters/bert-based-uncased-imdb2-v01

BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

Paper • 1810.04805 • Published Oct 11, 2018 • 27