Korean XLM-RoBERTa Classifier

이 모델은 **xlm-roberta-base**를 기반으로 파인튜닝된 한국어/영어 이중언어 텍스트 분류 모델입니다.
총 66개 라벨 분류가 가능하며, 라벨 정보는 label_mapping.json 파일에서 확인할 수 있습니다.

📂 Files in Repository

config.json: 모델 설정
tokenizer.json / tokenizer_config.json: 토크나이저
special_tokens_map.json: 특수 토큰 매핑
pytorch_model.bin 또는 model.safetensors (둘 중 하나만 사용, safetensors 권장)
label_mapping.json: 인덱스 ↔ 라벨 매핑
classifier.pkl, label_embeddings.pkl: 추가 분류기 및 임베딩
label_independence_analysis.py: 분석 스크립트 (부가 자료)

🚀 Usage

from transformers import AutoTokenizer, AutoModelForSequenceClassification
import torch

model_name = "Halfotter/home"   # Hugging Face repo 경로

# 토크나이저와 모델 불러오기
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSequenceClassification.from_pretrained(model_name)

# 입력 예시
inputs = tokenizer("테스트 문장", return_tensors="pt")
outputs = model(**inputs)

# 소프트맥스로 확률 변환
probs = torch.nn.functional.softmax(outputs.logits, dim=-1)
label_id = torch.argmax(probs).item()

print("Predicted Label ID:", label_id)

Downloads last month: -; Downloads are not tracked for this model. How to track

Model tree for Halfotter/home

Base model

FacebookAI/xlm-roberta-base

Finetuned

(3856)

this model