raniero
/

submission_dpo_from_validator

raniero commited on Jul 9, 2025

Commit

8d10f11

verified ·

1 Parent(s): ac8c2b5

Upload README.md with huggingface_hub

Files changed (1) hide show

README.md CHANGED Viewed

@@ -1,17 +1,8 @@
----
-base_model: meta-llama/Llama-2-7b-hf
-tags:
-- LoRA
-- bittensor
-- gradients
-license: apache-2.0
----
-# Submission for task `submission_dpo_from_validator`
-🧠 Fine-tuned using LoRA on a dynamic dataset generated from LLaMA.
-- Task ID: `sim-task-dpo-validator-001`
-- Repo: `submission_dpo_from_validator`
-- Loss: `2.4597714705900713`
-- Timestamp: 2025-07-09T19:58:05.569050

+# Modello addestrato: submission_dpo_from_validator
+- Data: 2025-07-09T21:58:08.998726
+- Epochs: 2
+- Learning Rate: 1e-4
+- LoRA config: r=64, q=128
+SHA256 del modello (model.safetensors):
+238bf8909c1d373d93571890b67438ec1130ea05edd2f0a3556feba865061107