186 MB

Ctrl+K

Add PRO-STEP PRM (LoRA over DeepSeek-R1-0528-Qwen3-8B)

c812dc1 verified 9 days ago

.gitattributes

1.57 kB
Add PRO-STEP PRM (LoRA over DeepSeek-R1-0528-Qwen3-8B) 9 days ago
README.md

2.33 kB
Add PRO-STEP PRM (LoRA over DeepSeek-R1-0528-Qwen3-8B) 9 days ago
adapter_config.json

740 Bytes
Add PRO-STEP PRM (LoRA over DeepSeek-R1-0528-Qwen3-8B) 9 days ago
adapter_model.safetensors

175 MB
xet

Add PRO-STEP PRM (LoRA over DeepSeek-R1-0528-Qwen3-8B) 9 days ago
chat_template.jinja

3.13 kB
Add PRO-STEP PRM (LoRA over DeepSeek-R1-0528-Qwen3-8B) 9 days ago
special_tokens_map.json

485 Bytes
Add PRO-STEP PRM (LoRA over DeepSeek-R1-0528-Qwen3-8B) 9 days ago
tokenizer.json

11.4 MB
xet

Add PRO-STEP PRM (LoRA over DeepSeek-R1-0528-Qwen3-8B) 9 days ago
tokenizer_config.json

5.59 kB
Add PRO-STEP PRM (LoRA over DeepSeek-R1-0528-Qwen3-8B) 9 days ago
training_args.bin
Detected Pickle imports (10)
- "transformers.trainer_utils.SaveStrategy",
- "accelerate.state.PartialState",
- "torch.device",
- "transformers.trainer_pt_utils.AcceleratorConfig",
- "transformers.trainer_utils.IntervalStrategy",
- "transformers.trainer_utils.SchedulerType",
- "transformers.trainer_utils.HubStrategy",
- "transformers.training_args.OptimizerNames",
- "trl.trainer.sft_config.SFTConfig",
- "accelerate.utils.dataclasses.DistributedType"
How to fix it?
6.29 kB
xet

Add PRO-STEP PRM (LoRA over DeepSeek-R1-0528-Qwen3-8B) 9 days ago