raniero
/

submission_test_dpo_0807_001

Model card Files Files and versions

Submission for task `submission_test_dpo_0807_001`

🧠 Fine-tuned using LoRA on a dynamic dataset generated from LLaMA.

Task ID: sim-task-dpo-0807-001
Repo: submission_test_dpo_0807_001
Loss: 4.867627779642741
Timestamp: 2025-07-08T12:15:38.673479

Downloads last month: -; Downloads are not tracked for this model. How to track

Safetensors

Model size

4.19M params

Tensor type

F32

·

Inference Providers NEW

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for raniero/submission_test_dpo_0807_001

Base model

meta-llama/Llama-2-7b-hf

Finetuned

(974)

this model