ModernBERT-large-multilingual

Model Details

ModernBERT는 양방향 인코더 아키텍처에 현대적인 트랜스포머 기법을 적용한 모델입니다. RoPE를 사용해 최대 8,192 토큰의 긴 문맥을 효율적으로 처리하며, Local-Global 어텐션 패턴으로 계산 복잡도를 줄였습니다. GeGLU 활성화 함수와 Pre-normalization 블록, Unpadding 기법을 통해 기존 BERT 대비 최대 4배 빠른 처리 속도를 달성했습니다.

이 연구는 구글의 TPU Research Cloud(TRC)를 통해 지원받은 Cloud TPU로 학습되었습니다.

How to Get Started with the Model

from transformers import AutoTokenizer, ModernBertForSequenceClassification

tokenizer = AutoTokenizer.from_pretrained("team-lucid/ModernBERT-large-multilingual")
model = ModernBertForSequenceClassification.from_pretrained("team-lucid/ModernBERT-large-multilingual")

inputs = tokenizer("안녕, 세상!", return_tensors="pt")
outputs = model(**inputs)

Downloads last month: 6

Safetensors

Model size

0.5B params

Tensor type

F32

Inference Providers NEW

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

team-lucid
/

ModernBERT-large-multilingual

ModernBERT-large-multilingual

Model Details

How to Get Started with the Model

Dataset used to train team-lucid/ModernBERT-large-multilingual