ComparisonPO
/

Qwen3-4B-DPO

Model card Files Files and versions

Ctrl+K

Ctrl+K

1 contributor

History: 3 commits

PeterLauLukCh's picture

Create README.md

16e00bd verified about 1 month ago

.gitattributes

1.57 kB
Upload qwen3-4b-base-ultrafeedback-dpo-full-fsdp about 1 month ago
FSDP_MERGE_DONE.txt

134 Bytes
Upload qwen3-4b-base-ultrafeedback-dpo-full-fsdp about 1 month ago
FSDP_SHARDED_CHECKPOINT.txt

441 Bytes
Upload qwen3-4b-base-ultrafeedback-dpo-full-fsdp about 1 month ago
README.md

90 Bytes
Create README.md about 1 month ago
all_results.json

660 Bytes
Upload qwen3-4b-base-ultrafeedback-dpo-full-fsdp about 1 month ago
chat_template.jinja

4.12 kB
Upload qwen3-4b-base-ultrafeedback-dpo-full-fsdp about 1 month ago
config.json

1.59 kB
Upload qwen3-4b-base-ultrafeedback-dpo-full-fsdp about 1 month ago
generation_config.json

148 Bytes
Upload qwen3-4b-base-ultrafeedback-dpo-full-fsdp about 1 month ago
model.safetensors

17.6 GB
xet

Upload qwen3-4b-base-ultrafeedback-dpo-full-fsdp about 1 month ago
tokenizer.json

11.4 MB
xet

Upload qwen3-4b-base-ultrafeedback-dpo-full-fsdp about 1 month ago
tokenizer_config.json

696 Bytes
Upload qwen3-4b-base-ultrafeedback-dpo-full-fsdp about 1 month ago
train_results.json

660 Bytes
Upload qwen3-4b-base-ultrafeedback-dpo-full-fsdp about 1 month ago
trainer_state.json

253 kB
Upload qwen3-4b-base-ultrafeedback-dpo-full-fsdp about 1 month ago