morizon
/

llm-jp-3-13b-instruct2-grpo-R1-0225_std_step3000_lora

text-generation-inference

Model card Files Files and versions

llm-jp-3-13b-instruct2-grpo-R1-0225_std_step3000_lora

Commit History

Trained with Unsloth

5990b96
verified

morizon commited on Feb 25, 2025

Trained with Unsloth

caf6197
verified

morizon commited on Feb 25, 2025

Upload README.md with huggingface_hub

2b44639
verified

morizon commited on Feb 25, 2025

initial commit

bf2ff58
verified

morizon commited on Feb 25, 2025