Base Model
updated
mistralai/Mistral-Small-3.1-24B-Base-2503
24B • Updated • 1.53k
• 273
Text Generation
• 0.6B • Updated • 490k
• • 174
Text Generation
• 22B • Updated • 7M
• • 4.73k
Text Generation
• 685B • Updated • 7.2M
• • 13.4k
Text Generation
• 1T • Updated • 44.8k
• 303
baidu/ERNIE-4.5-0.3B-Base-PT
Text Generation
• 0.4B • Updated • 1.42k
• 27
Text Generation
• 1B • Updated • 1.9M
• • 2.46k
Updated • 46.5k
• 1.11k
deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B
Text Generation
• 2B • Updated • 636k
• • 1.53k
baidu/ERNIE-4.5-VL-28B-A3B-Thinking
Image-Text-to-Text
• 30B • Updated • 175
• 541
deepseek-ai/DeepSeek-R1-Zero
Text Generation
• 685B • Updated • 5.65k
• 958
Text Generation
• 9B • Updated • 27.1k
• • 104
Text Generation
• 0.4B • Updated • 12.4k
• 247
Text Generation
• 3B • Updated • 145
• 42
microsoft/Phi-4-mini-flash-reasoning
Text Generation
• 4B • Updated • 1.03k
• 281
Qwen/Qwen3-VL-2B-Instruct
Image-Text-to-Text
• 2B • Updated • 2.13M
• 431
deepseek-ai/DeepSeek-V3.2-Exp
Text Generation
• 685B • Updated • 211k
• • 990
tencent/Hunyuan-0.5B-Pretrain
0.5B • Updated • 9.15k
• 11
Text Generation
• 7B • Updated • 87.1k
• 71