CodCodingCode
/

llama-3.1-8b-GRPO-V2.0

Generated from Trainer

Model card Files Files and versions

Metrics Training metrics Community

llama-3.1-8b-GRPO-V2.0 / checkpoint-100

48.2 GB

1 contributor

History: 1 commit

CodCodingCode's picture

Upload folder using huggingface_hub

27a72dd verified 6 months ago

config.json
716 Bytes

Upload folder using huggingface_hub 6 months ago
generation_config.json
142 Bytes

Upload folder using huggingface_hub 6 months ago
model-00001-of-00004.safetensors
4.98 GB
xet

Upload folder using huggingface_hub 6 months ago
model-00002-of-00004.safetensors
5 GB
xet

Upload folder using huggingface_hub 6 months ago
model-00003-of-00004.safetensors
4.92 GB
xet

Upload folder using huggingface_hub 6 months ago
model-00004-of-00004.safetensors
1.17 GB
xet

Upload folder using huggingface_hub 6 months ago
model.safetensors.index.json
24 kB

Upload folder using huggingface_hub 6 months ago
optimizer.pt
32.1 GB
xet

Upload folder using huggingface_hub 6 months ago
rng_state.pth
14.6 kB
xet

Upload folder using huggingface_hub 6 months ago
scheduler.pt
1.47 kB
xet

Upload folder using huggingface_hub 6 months ago
special_tokens_map.json
449 Bytes

Upload folder using huggingface_hub 6 months ago
tokenizer.json
17.2 MB
xet

Upload folder using huggingface_hub 6 months ago
tokenizer_config.json
50.7 kB

Upload folder using huggingface_hub 6 months ago
trainer_state.json
91.5 kB

Upload folder using huggingface_hub 6 months ago
training_args.bin
7.06 kB
xet

Upload folder using huggingface_hub 6 months ago