gabrielbo
/

spark-model-QLoRA

Text Generation

reinforcement-learning

Model card Files Files and versions

spark-model-QLoRA / tokenizer

17.3 MB

Ctrl+K

Ctrl+K

1 contributor

History: 1 commit

gabrielbo's picture

Add PPO trained model (actor, critic, tokenizer, hyperparams) and models.py

2a347f6 about 1 year ago

chat_template.jinja

4.61 kB
Add PPO trained model (actor, critic, tokenizer, hyperparams) and models.py about 1 year ago
special_tokens_map.json

325 Bytes
Add PPO trained model (actor, critic, tokenizer, hyperparams) and models.py about 1 year ago
tokenizer.json

17.2 MB
xet

Add PPO trained model (actor, critic, tokenizer, hyperparams) and models.py about 1 year ago
tokenizer_config.json

50.6 kB
Add PPO trained model (actor, critic, tokenizer, hyperparams) and models.py about 1 year ago