Qwen3+PDAPT+SLERP - a PARTAGES-dev Collection

PARTAGES-dev 's Collections

Encoder pretraining from scratch (commercial use)

Encoder continual pretraining (research use)

Qwen3+PDAPT+SLERP

Qwen3+PDAPT+SLERP

updated May 15

Experiments conducted for the LREC paper (https://arxiv.org/abs/2604.06903)

PARTAGES-dev/Qwen3-8B-PDAPT-SLERP

Text Generation • 8B • Updated Apr 8 • 23
PARTAGES-dev/Qwen3-4B-PDAPT-SLERP

Text Generation • 4B • Updated Dec 3, 2025 • 31 •
Qwen/Qwen3-8B-Base

Text Generation • 8B • Updated May 21, 2025 • 525k • • 108
Qwen/Qwen3-4B-Base

Text Generation • 4B • Updated Jul 26, 2025 • 674k • • 95
Qwen/Qwen3-1.7B-Base

Text Generation • 2B • Updated Jul 26, 2025 • 711k • • 75
Qwen/Qwen3-0.6B-Base

Text Generation • 0.6B • Updated Jul 26, 2025 • 491k • • 174
PARTAGES-dev/Qwen3-1.7B-PDAPT-SLERP

Text Generation • 2B • Updated Feb 25 • 18
PARTAGES-dev/Qwen3-0.6B-PDAPT-SLERP

Text Generation • 0.8B • Updated Dec 4, 2025 • 48 •