gabrielbo
/

spark-model-QLoRA

Text Generation

reinforcement-learning

Model card Files Files and versions

spark-model-QLoRA / critic

Ctrl+K

Ctrl+K

1 contributor

History: 1 commit

gabrielbo's picture

Add PPO trained model (actor, critic, tokenizer, hyperparams) and models.py

2a347f6 about 1 year ago

lora
Add PPO trained model (actor, critic, tokenizer, hyperparams) and models.py about 1 year ago
value_head.pt
Detected Pickle imports (3)
- "torch._utils._rebuild_tensor_v2",
- "torch.FloatStorage",
- "collections.OrderedDict"
What is a pickle import?
33.6 MB
xet

Add PPO trained model (actor, critic, tokenizer, hyperparams) and models.py about 1 year ago