AlignmentResearch
/

imdb-policy-model-oskar_002_grpo_training

text-generation-inference

Model card Files Files and versions

imdb-policy-model-oskar_002_grpo_training

6.38 GB

Ctrl+K

Ctrl+K

1 contributor

History: 6 commits

skar0's picture

Upload tokenizer for grpo model

c4b4931 verified 12 months ago

.gitattributes

1.57 kB
Upload tokenizer for grpo model 12 months ago
README.md

5.18 kB
Upload trained grpo model 12 months ago
config.json

1.34 kB
Upload trained grpo model 12 months ago
pytorch_model-00001-of-00002.bin
Detected Pickle imports (5)
- "torch.BFloat16Storage",
- "torch._utils._rebuild_tensor_v2",
- "torch.ByteStorage",
- "collections.OrderedDict",
- "torch.FloatStorage"
What is a pickle import?
4.98 GB
xet

Upload trained grpo model 12 months ago
pytorch_model-00002-of-00002.bin
Detected Pickle imports (5)
- "torch.BFloat16Storage",
- "torch.FloatStorage",
- "torch._utils._rebuild_tensor_v2",
- "torch.ByteStorage",
- "collections.OrderedDict"
What is a pickle import?
1.39 GB
xet

Upload trained grpo model 12 months ago
pytorch_model.bin.index.json

429 kB
Upload trained grpo model 12 months ago
special_tokens_map.json

335 Bytes
Upload tokenizer for grpo model 12 months ago
tokenizer.json

17.2 MB
xet

Upload tokenizer for grpo model 12 months ago
tokenizer_config.json

50.6 kB
Upload tokenizer for grpo model 12 months ago