shirwu
/

output

Text Classification

Generated from Trainer

text-embeddings-inference

4-bit precision

Model card Files Files and versions

shirwu commited on Feb 12, 2025

Commit

d511e3a

·

verified ·

1 Parent(s): 5390860

Model save

Files changed (1) hide show

README.md +3 -5

README.md CHANGED Viewed

@@ -1,7 +1,6 @@
 ---
 base_model: meta-llama/Llama-3.1-8B-Instruct
-datasets: snap-stanford/preference_iterative_hard-answer_generator-iter0
-library_name: peft
 model_name: output
 tags:
 - generated_from_trainer
@@ -12,7 +11,7 @@ licence: license
 # Model Card for output
-This model is a fine-tuned version of [meta-llama/Llama-3.1-8B-Instruct](https://huggingface.co/meta-llama/Llama-3.1-8B-Instruct) on the [snap-stanford/preference_iterative_hard-answer_generator-iter0](https://huggingface.co/datasets/snap-stanford/preference_iterative_hard-answer_generator-iter0) dataset.
 It has been trained using [TRL](https://github.com/huggingface/trl).
 ## Quick start
@@ -28,14 +27,13 @@ print(output["generated_text"])
 ## Training procedure
 This model was trained with Reward.
 ### Framework versions
-- PEFT 0.14.0
 - TRL: 0.14.0
 - Transformers: 4.48.2
 - Pytorch: 2.5.1

 ---
 base_model: meta-llama/Llama-3.1-8B-Instruct
+library_name: transformers
 model_name: output
 tags:
 - generated_from_trainer
 # Model Card for output
+This model is a fine-tuned version of [meta-llama/Llama-3.1-8B-Instruct](https://huggingface.co/meta-llama/Llama-3.1-8B-Instruct).
 It has been trained using [TRL](https://github.com/huggingface/trl).
 ## Quick start
 ## Training procedure
+[<img src="https://raw.githubusercontent.com/wandb/assets/main/wandb-github-badge-28.svg" alt="Visualize in Weights & Biases" width="150" height="24"/>](https://wandb.ai/dsp-team/optimas/runs/y3oacxbo)
 This model was trained with Reward.
 ### Framework versions
 - TRL: 0.14.0
 - Transformers: 4.48.2
 - Pytorch: 2.5.1