spankevich
/

trainer_output

Text Classification

Generated from Trainer

text-embeddings-inference

Model card Files Files and versions

spankevich commited on Mar 9, 2025

Commit

c30957a

·

verified ·

1 Parent(s): 2d33196

spankevich/llm-hw-2-reward-model

Files changed (1) hide show

README.md +1 -2

README.md CHANGED Viewed

@@ -1,6 +1,5 @@
 ---
 base_model: HuggingFaceTB/SmolLM-135M-Instruct
-datasets: HumanLLMs/Human-Like-DPO-Dataset
 library_name: transformers
 model_name: trainer_output
 tags:
@@ -12,7 +11,7 @@ licence: license
 # Model Card for trainer_output
-This model is a fine-tuned version of [HuggingFaceTB/SmolLM-135M-Instruct](https://huggingface.co/HuggingFaceTB/SmolLM-135M-Instruct) on the [HumanLLMs/Human-Like-DPO-Dataset](https://huggingface.co/datasets/HumanLLMs/Human-Like-DPO-Dataset) dataset.
 It has been trained using [TRL](https://github.com/huggingface/trl).
 ## Quick start

 ---
 base_model: HuggingFaceTB/SmolLM-135M-Instruct
 library_name: transformers
 model_name: trainer_output
 tags:
 # Model Card for trainer_output
+This model is a fine-tuned version of [HuggingFaceTB/SmolLM-135M-Instruct](https://huggingface.co/HuggingFaceTB/SmolLM-135M-Instruct).
 It has been trained using [TRL](https://github.com/huggingface/trl).
 ## Quick start