Howuhh
/

SmolLM2-135M-Instruct-Human-Like-Reward

Text Classification

Generated from Trainer

text-generation-inference

Model card Files Files and versions

SmolLM2-135M-Instruct-Human-Like-Reward

274 MB

1 contributor

History: 2 commits

Howuhh's picture

End of training

1761ae5 verified 10 months ago

.gitattributes

1.52 kB

initial commit 10 months ago
README.md

1.95 kB

End of training 10 months ago
config.json

1.03 kB

End of training 10 months ago
merges.txt

466 kB

End of training 10 months ago
model.safetensors

269 MB
xet

End of training 10 months ago
special_tokens_map.json

544 Bytes

End of training 10 months ago
tokenizer.json

3.52 MB

End of training 10 months ago
tokenizer_config.json

3.77 kB

End of training 10 months ago
training_args.bin
Detected Pickle imports (9)
- "transformers.trainer_utils.SchedulerType",
- "accelerate.utils.dataclasses.DistributedType",
- "accelerate.state.PartialState",
- "torch.device",
- "transformers.training_args.OptimizerNames",
- "transformers.trainer_utils.IntervalStrategy",
- "trl.trainer.reward_config.RewardConfig",
- "transformers.trainer_pt_utils.AcceleratorConfig",
- "transformers.trainer_utils.HubStrategy"
How to fix it?
5.43 kB
xet

End of training 10 months ago
vocab.json

801 kB

End of training 10 months ago