145 GB

Ctrl+K

1 contributor

History: 3 commits

pmahdavi

Upload math reasoning model with export data (without optimizer states)

fdbf4ad verified 12 months ago

export
Upload math reasoning model with export data (without optimizer states) 12 months ago
model_states
Upload math reasoning model with export data (without optimizer states) 12 months ago
optimizer_states
Upload model with optimizer states 12 months ago
.gitattributes

1.57 kB
Upload model with optimizer states 12 months ago
README.md

908 Bytes
Upload math reasoning model with export data (without optimizer states) 12 months ago
config.json

841 Bytes
Upload model with optimizer states 12 months ago
generation_config.json

180 Bytes
Upload model with optimizer states 12 months ago
latest

15 Bytes
Upload model with optimizer states 12 months ago
model-00001-of-00004.safetensors

4.98 GB
xet

Upload model with optimizer states 12 months ago
model-00002-of-00004.safetensors

5 GB
xet

Upload model with optimizer states 12 months ago
model-00003-of-00004.safetensors

4.92 GB
xet

Upload model with optimizer states 12 months ago
model-00004-of-00004.safetensors

1.17 GB
xet

Upload model with optimizer states 12 months ago
model.safetensors.index.json

24 kB
Upload model with optimizer states 12 months ago
rng_state_0.pth
Detected Pickle imports (7)
- "numpy.core.multiarray._reconstruct",
- "torch._utils._rebuild_tensor_v2",
- "torch.ByteStorage",
- "collections.OrderedDict",
- "numpy.dtype",
- "numpy.ndarray",
- "_codecs.encode"
How to fix it?
14.5 kB
xet

Upload model with optimizer states 12 months ago
rng_state_1.pth
Detected Pickle imports (7)
- "numpy.core.multiarray._reconstruct",
- "torch._utils._rebuild_tensor_v2",
- "torch.ByteStorage",
- "collections.OrderedDict",
- "numpy.dtype",
- "numpy.ndarray",
- "_codecs.encode"
How to fix it?
14.5 kB
xet

Upload model with optimizer states 12 months ago
scheduler.pt
Pickle imports
- No problematic imports detected
What is a pickle import?
1.06 kB
xet

Upload model with optimizer states 12 months ago
special_tokens_map.json

335 Bytes
Upload model with optimizer states 12 months ago
tokenizer.json

17.2 MB
xet

Upload model with optimizer states 12 months ago
tokenizer_config.json

51.2 kB
Upload model with optimizer states 12 months ago
trainer_log.jsonl

50.3 kB
Upload math reasoning model with export data (without optimizer states) 12 months ago
trainer_state.json

46.2 kB
Upload model with optimizer states 12 months ago
training_args.bin
Detected Pickle imports (14)
- "transformers.trainer_utils.HubStrategy",
- "transformers.trainer_utils.IntervalStrategy",
- "transformers.training_args.OptimizerNames",
- "torch.device",
- "accelerate.utils.dataclasses.DeepSpeedPlugin",
- "accelerate.utils.dataclasses.DistributedType",
- "transformers.integrations.deepspeed.HfTrainerDeepSpeedConfig",
- "transformers.trainer_utils.SaveStrategy",
- "transformers.trainer_pt_utils.AcceleratorConfig",
- "torch.bfloat16",
- "transformers.integrations.deepspeed.HfDeepSpeedConfig",
- "llamafactory.hparams.training_args.TrainingArguments",
- "transformers.trainer_utils.SchedulerType",
- "accelerate.state.PartialState"
How to fix it?
7.74 kB
xet

Upload model with optimizer states 12 months ago
training_config.yaml

738 Bytes
Upload math reasoning model with export data (without optimizer states) 12 months ago
zero_to_fp32.py

33.3 kB
Upload model with optimizer states 12 months ago

Detected Pickle imports (7)

Detected Pickle imports (7)

Pickle imports

Detected Pickle imports (14)