Yifan Wang's picture

Yifan Wang

AmberYifan

·

AI & ML interests

None yet

Recent Activity

authored a paper 11 days ago

Addressing Performance Saturation for LLM RL via Precise Entropy Curve Control

upvoted a paper 11 days ago

Addressing Performance Saturation for LLM RL via Precise Entropy Curve Control

published a model 4 months ago

AmberYifan/Qwen2.5-3B-MATH-MARL-structure-only

View all activity

Organizations

AmberYifan 's models 276

AmberYifan/Qwen2.5-3B-MATH-GRPO

Updated Dec 27, 2025

AmberYifan/Qwen2.5-3B-Instruct-MATH-MARL-structure-gating

Updated Dec 27, 2025

AmberYifan/Qwen2.5-3B-Instruct-GRPO

Updated Dec 25, 2025

AmberYifan/Qwen2.5-3B-Instruct-MATH-MARL-structure

Updated Dec 24, 2025

AmberYifan/Qwen3-1.7B-MATH-MARL-test

Updated Dec 24, 2025

AmberYifan/Qwen3-1.7B-MATH-MARL-mysw-diameter

Updated Dec 24, 2025

AmberYifan/Qwen3-1.7B-MATH-MARL-mysw-diameter-relative

Updated Dec 18, 2025

AmberYifan/qwen3-0.6b-p36-sft

Updated Dec 17, 2025

AmberYifan/qwen3-0.6b-mmlu-sft

Updated Dec 16, 2025

AmberYifan/Llama-3.1-8B-Instruct-tulu-sft-30k

Updated Dec 14, 2025

AmberYifan/Llama-3.1-8B-Instruct-tulu-sft-12k

Updated Dec 13, 2025

AmberYifan/qwen3-0.6b-tulu-sft-12k

Updated Dec 13, 2025

AmberYifan/qwen3-0.6b-math500-sft-12k

Updated Dec 13, 2025

AmberYifan/qwen3-0.6b-mmlu-sft-12k

Updated Dec 13, 2025

AmberYifan/Qwen3-1.7B-Polaris-MARL-mysw-relative

2B • Updated Dec 13, 2025 • 1

AmberYifan/Qwen3-1.7B-MATH-MARL-mysw-relative

Text Generation • 2B • Updated Dec 10, 2025 • 3

AmberYifan/Qwen3-1.7B-MATH-MARL-mysw-relative-qwen3-0.6b-embedding

Text Generation • 2B • Updated Dec 8, 2025 • 4

AmberYifan/Qwen3-1.7B-MATH-MARL-diameter-relative-qwen3-0.6b-embedding

Updated Dec 7, 2025

AmberYifan/Qwen3-1.7B-MATH-MARL-sw-relative-qwen3-0.6b-embedding

Updated Dec 6, 2025

AmberYifan/Qwen3-1.7B-MATH-GRPO-tuned

Updated Dec 6, 2025

AmberYifan/Qwen3-1.7B-MATH-MARL-diameter-relative

Updated Dec 5, 2025

AmberYifan/Qwen3-1.7B-MATH-MARL-sw-relative

Updated Dec 5, 2025

AmberYifan/Qwen3-1.7B-MATH-MARL-structure-relative

Updated Dec 5, 2025

AmberYifan/qwen3-0.6b-alpaca-sft

Text Generation • 0.6B • Updated Dec 3, 2025 • 4

AmberYifan/Qwen2.5-7B-Instruct-wildfeedback-SPIN-iter5

Updated Nov 14, 2025

AmberYifan/Qwen2.5-7B-Instruct-wildfeedback-DRIFT-iter5

Updated Nov 14, 2025

AmberYifan/Qwen2.5-7B-Instruct-wildfeedback-iterDPO-iter5

Updated Nov 14, 2025

AmberYifan/Qwen2.5-7B-Instruct-wildfeedback-iterDPO-NoPrompt-iter2

Updated Nov 14, 2025

AmberYifan/Qwen2.5-7B-Instruct-wildfeedback-DRIFT-iter4

Updated Nov 13, 2025

AmberYifan/Qwen2.5-7B-Instruct-wildfeedback-SPIN-iter3-T1.0

Updated Nov 13, 2025