Xiaoyu O

xouyang

1

·

AI & ML interests

None yet

Organizations

None yet

spaces 1

Qwen2 0 5B GRPO Vllm Trl

models 4

xouyang/Qwen2-0-5B-GRPO-vllm-trl

Updated Oct 19, 2025

xouyang/llama-3-1-8b-math-orca-qlora-10k-ep1-merged

8B • Updated Jan 13, 2025 • 1

xouyang/llama-3-1-8b-math-orca-qlora-10k-ep1

Updated Jan 13, 2025

xouyang/modernbert-llm-router

Text Classification • 0.1B • Updated Dec 27, 2024 • 6

datasets 1

xouyang/smoltalk2-SFT

Viewer • Updated Sep 18, 2025 • 2.06k • 7