Levin Zheng

LevinZheng

·

AI & ML interests

None yet

Organizations

None yet

LevinZheng 's models 84

LevinZheng/Qwen2.5-14B-Instruct_loss_main_seed88

Updated Sep 15, 2025

LevinZheng/Qwen2.5-14B-Instruct_loss1_seed88

Updated Sep 15, 2025

LevinZheng/gpt-oss-20b-lora-adapter

Updated Aug 14, 2025

LevinZheng/rlhf_ppo_full

Text Generation • 8B • Updated Jul 20, 2025

LevinZheng/aha-moment-3B-v2

3B • Updated Jul 19, 2025 • 2

LevinZheng/edu_ppo_full_30k_150steps

8B • Updated Jul 19, 2025 • 1

LevinZheng/edu_ppo_full_30k

8B • Updated Jul 18, 2025 • 1

LevinZheng/edu_ppo_full_10k

8B • Updated Jul 18, 2025 • 1

LevinZheng/edu_sft_full

Updated Jul 17, 2025

LevinZheng/edu_dpo_full

Updated Jul 17, 2025

LevinZheng/rlhf_ppo_full-Q8_0-GGUF

8B • Updated Jul 10, 2025

LevinZheng/ppo-lunarlander-from0

Updated Jun 20, 2025

LevinZheng/poca-SoccerTwos

Reinforcement Learning • Updated May 28, 2025

LevinZheng/a2c-PandaReachDense-v3

Reinforcement Learning • Updated May 28, 2025 • 4

LevinZheng/ppo-Pyramids

Reinforcement Learning • Updated May 28, 2025 • 1

LevinZheng/ppo-SnowballTarget

Reinforcement Learning • Updated May 28, 2025

LevinZheng/Reinforce-Pixelcopter-PLE-v0

Reinforcement Learning • Updated May 27, 2025

LevinZheng/Reinforce-Cartpole-v1

Reinforcement Learning • Updated May 27, 2025

LevinZheng/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated May 27, 2025 • 4

LevinZheng/q-Taxi-v3

Reinforcement Learning • Updated May 27, 2025

LevinZheng/ppo-LunarLander-v2

Reinforcement Learning • Updated May 27, 2025 • 2

LevinZheng/aha-moment-3B

Text Generation • 3B • Updated May 13, 2025 • 2

LevinZheng/rlhf_dpo_full

Text Generation • 8B • Updated May 13, 2025

LevinZheng/rlhf_sft_full

Text Generation • 8B • Updated May 13, 2025