PEFT модели, дообученные с помощью PEFT для определения тональности сообщений georgebu/peft_lora Text Generation • 0.3B • Updated Apr 11, 2025 • 2 georgebu/peft_dora Text Generation • 0.3B • Updated Apr 11, 2025 georgebu/peft_tinyllama_qlora Updated Apr 11, 2025
Alignment DPO model, PPO model, reward model georgebu/reward_model Text Classification • 0.1B • Updated Mar 28, 2025 • 4 georgebu/dpo_model Text Generation • 0.1B • Updated Mar 28, 2025 • 7 georgebu/ppo_model Text Generation • 0.1B • Updated Mar 28, 2025 • 1
PEFT модели, дообученные с помощью PEFT для определения тональности сообщений georgebu/peft_lora Text Generation • 0.3B • Updated Apr 11, 2025 • 2 georgebu/peft_dora Text Generation • 0.3B • Updated Apr 11, 2025 georgebu/peft_tinyllama_qlora Updated Apr 11, 2025
Alignment DPO model, PPO model, reward model georgebu/reward_model Text Classification • 0.1B • Updated Mar 28, 2025 • 4 georgebu/dpo_model Text Generation • 0.1B • Updated Mar 28, 2025 • 7 georgebu/ppo_model Text Generation • 0.1B • Updated Mar 28, 2025 • 1