raniero
/

submission_test_dpo_0807_002

Model card Files Files and versions

Submission for task `submission_test_dpo_0807_002`

🧠 Fine-tuned using LoRA on a dynamic dataset generated from LLaMA.

Task ID: sim-task-dpo-0807-002
Repo: submission_test_dpo_0807_002
Loss: 3.021432399749756
Timestamp: 2025-07-08T14:55:34.793588

Downloads last month: -; Downloads are not tracked for this model. How to track

Safetensors

Model size

4.19M params

Tensor type

F32

·

Inference Providers NEW

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for raniero/submission_test_dpo_0807_002

Base model

meta-llama/Llama-2-7b-hf

Finetuned

(967)

this model