Khiem Le's picture

2

Khiem Le

lhkhiem28

·

AI & ML interests

None yet

Recent Activity

updated a collection 13 days ago

updated a collection 13 days ago

updated a model 13 days ago

lhkhiem28/Llama-3.2-3B-DeepScaleR-HA-GRPO-SCAF

View all activity

Organizations

None yet

lhkhiem28 's models 85

lhkhiem28/Llama-3.2-3B-DeepScaleR-HA-GRPO-SCAF

4B • Updated 13 days ago • 31

lhkhiem28/Llama-3.2-3B-DeepScaleR-GRPO

4B • Updated 13 days ago • 25

lhkhiem28/CodeNet-llm_granite-3.3-2b_train_1_grpo

Updated 15 days ago

lhkhiem28/Llama-3.2-1B-DeepScaleR-HA-GRPO-SCAF

1B • Updated 15 days ago • 31

lhkhiem28/CodeNet-llm_gemma-2-2b_train_1_grpo

Updated 16 days ago

lhkhiem28/Llama-3.2-1B-DeepScaleR-GRPO

1B • Updated 16 days ago • 46

lhkhiem28/Qwen2.5-3B-ha_grpo

Text Generation • 3B • Updated 17 days ago • 104

lhkhiem28/Qwen2.5-3B-grpo

Text Generation • 3B • Updated 22 days ago • 66

lhkhiem28/Qwen2.5-Math-1.5B-grpo

Updated 24 days ago

lhkhiem28/Qwen3-1.7B-grpo

Updated 24 days ago

lhkhiem28/Qwen3-1.7B-MATH-A9-U-TA-GRPO

2B • Updated May 19 • 5

lhkhiem28/Qwen3-4B-MATH-A9-U-TA-GRPO

4B • Updated May 19 • 4

lhkhiem28/Qwen3-1.7B-MATH-GRPO

2B • Updated May 10 • 5

lhkhiem28/Llama-3.2-3B-MATH-A9-U-TA-GRPO

4B • Updated Apr 26 • 2

lhkhiem28/Llama-3.2-1B-MATH-A9-U-TA-GRPO

1B • Updated Apr 26 • 2

lhkhiem28/Qwen3-1.7B-MATH-A9-U-TA-GRPO-LEAD

2B • Updated Apr 25 • 2

lhkhiem28/Qwen3-4B-MATH-A9-U-TA-GRPO-LEAD

4B • Updated Apr 24 • 2

lhkhiem28/Llama-3.2-3B-MATH-GRPO-LEAD

4B • Updated Apr 23 • 3

lhkhiem28/Qwen3-1.7B-MATH-GRPO-LEAD

2B • Updated Apr 23 • 3

lhkhiem28/Qwen3-4B-MATH-GRPO-LEAD

4B • Updated Apr 23 • 2

lhkhiem28/Llama-3.2-1B-MATH-GRPO-LEAD

1B • Updated Apr 22 • 2

lhkhiem28/Qwen3-4B-OpenR1-MATH-p1-GRPO

4B • Updated Apr 22 • 2

lhkhiem28/Qwen3-1.7B-OpenR1-MATH-p1-GRPO

2B • Updated Apr 22 • 1

lhkhiem28/Qwen3-4B-MATH-DAPO-GRPO

4B • Updated Apr 18 • 1

lhkhiem28/Qwen3-1.7B-MATH-DAPO-GRPO

2B • Updated Apr 18 • 3

lhkhiem28/Qwen3-1.7B-MATH-A9-U-TA-GRPO-reweighting

2B • Updated Apr 13 • 2

lhkhiem28/Qwen3-4B-MATH-A9-U-TA-GRPO-reweighting

4B • Updated Apr 13 • 2

lhkhiem28/Qwen3-4B-MATH-GRPO-reweighting

4B • Updated Apr 11 • 2

lhkhiem28/Qwen3-1.7B-MATH-GRPO-reweighting

2B • Updated Apr 11 • 2

lhkhiem28/Qwen3-1.7B-MATH-GRPO-resampling

2B • Updated Apr 1 • 2