jonathanjordan21
/

my-thesis

Model card Files Files and versions

jonathanjordan21 commited on Sep 22, 2024

Commit

1ff422e

·

verified ·

1 Parent(s): 2ed511c

Upload folder using huggingface_hub

Files changed (36) hide show

outputs/assets/dpo/train|epoch.png +0 -0
outputs/assets/dpo/train|grad_norm.png +0 -0
outputs/assets/dpo/train|learning_rate.png +0 -0
outputs/assets/dpo/train|logits|chosen.png +0 -0
outputs/assets/dpo/train|logits|rejected.png +0 -0
outputs/assets/dpo/train|logps|chosen.png +0 -0
outputs/assets/dpo/train|logps|rejected.png +0 -0
outputs/assets/dpo/train|loss.png +0 -0
outputs/assets/dpo/train|nll_loss.png +0 -0
outputs/assets/dpo/train|rewards|accuracies.png +0 -0
outputs/assets/dpo/train|rewards|chosen.png +0 -0
outputs/assets/dpo/train|rewards|margins.png +0 -0
outputs/assets/dpo/train|rewards|rejected.png +0 -0
outputs/assets/dpo/train|total_flos.png +0 -0
outputs/assets/dpo/train|train_loss.png +0 -0
outputs/assets/dpo/train|train_runtime.png +0 -0
outputs/assets/dpo/train|train_samples_per_second.png +0 -0
outputs/assets/dpo/train|train_steps_per_second.png +0 -0
outputs/assets/sft/train|epoch.png +0 -0
outputs/assets/sft/train|grad_norm.png +0 -0
outputs/assets/sft/train|learning_rate.png +0 -0
outputs/assets/sft/train|loss.png +0 -0
outputs/assets/sft/train|total_flos.png +0 -0
outputs/assets/sft/train|train_loss.png +0 -0
outputs/assets/sft/train|train_runtime.png +0 -0
outputs/assets/sft/train|train_samples_per_second.png +0 -0
outputs/assets/sft/train|train_steps_per_second.png +0 -0
outputs/assets/st/train|epoch.png +0 -0
outputs/assets/st/train|grad_norm.png +0 -0
outputs/assets/st/train|learning_rate.png +0 -0
outputs/assets/st/train|loss.png +0 -0
outputs/assets/st/train|total_flos.png +0 -0
outputs/assets/st/train|train_loss.png +0 -0
outputs/assets/st/train|train_runtime.png +0 -0
outputs/assets/st/train|train_samples_per_second.png +0 -0
outputs/assets/st/train|train_steps_per_second.png +0 -0