Peijia Qin's picture

👋 Open to Work

1

Peijia Qin

t2ance

·

AI & ML interests

None yet

Recent Activity

published a dataset about 2 months ago

t2ance/CodeRM-GRPO-2B-thinking-step700-test-traces

updated a model about 2 months ago

t2ance/CodeRM-SFT-Warmup-Selection-2B-Thinking-Merged

updated a model about 2 months ago

t2ance/CodeRM-SFT-Warmup-Selection-2B-Thinking-Merged-step700

View all activity

Organizations

None yet

t2ance 's models 66

t2ance/CodeRM-SFT-Warmup-Selection-2B-Thinking-Merged

2B • Updated May 2 • 3

t2ance/CodeRM-SFT-Warmup-Selection-2B-Thinking-LoRA

t2ance/CodeRM-SFT-Warmup-Selection-2B-Thinking-Merged-step700

2B • Updated May 2 • 4

t2ance/CodeRM-GRPO-1.7B-halluc-gh200

t2ance/CodeRM-SFT-Warmup-Selection-2B-Merged

2B • Updated May 1 • 4

t2ance/CodeRM-SFT-Warmup-Selection-2B-LoRA

t2ance/CodeRM-GRPO-4B-bs96-nrp-step110-merged

4B • Updated Apr 27 • 2

t2ance/CodeRM-GRPO-4B-bs96-nrp

t2ance/atts-grpo-8b-warmstart155-b63r16

t2ance/atts-grpo-8b-sft-2gpu-bs96

t2ance/sft_qwen3_8b_merged

8B • Updated Apr 19 • 1

t2ance/CodeRM-SFT-Haiku500-4B

4B • Updated Apr 17 • 2

t2ance/CodeRM-GRPO-Selection-8B

8B • Updated Apr 6 • 6 • 1

t2ance/CodeRM-Bilevel-GRPO-4B

4B • Updated Apr 5 • 1 • 1

t2ance/CodeRM-OnlineGRPO-Selection-8B-Domain-K8s-v2

t2ance/CodeRM-OnlineGRPO-Selection-4B-v13-ThinkingMasked

t2ance/CodeRM-OnlineGRPO-Selection-4B-v12-NoThinking

t2ance/CodeRM-OnlineGRPO-Selection-4B-Domain-SFT-v11

Updated Apr 2 • 1

t2ance/CodeRM-OnlineGRPO-Selection-4B-Domain-SFT-v9

t2ance/CodeRM-OnlineGRPO-Selection-4B-Domain-SFT-v6

t2ance/CodeRM-OnlineGRPO-Selection-4B-Domain-SFT-v5

t2ance/mle-playbooks

t2ance/CodeRM-OnlineGRPO-Selection-4B-Domain-SFT-v4

t2ance/CodeRM-OnlineGRPO-Selection-4B-Domain-SFT-v3

t2ance/CodeRM-OnlineGRPO-Selection-4B-Domain-SFT-v2

t2ance/CodeRM-SFT-Warmup-Selection-4B-Merged

4B • Updated Mar 28 • 5

t2ance/sft-4b-onpolicy-rejection-sampling

t2ance/CodeRM-OnlineGRPO-Selection-8B-Domain-SFT-K8s

t2ance/CodeRM-OnlineGRPO-Selection-4B-Domain-SFT

t2ance/CodeRM-SFT-Warmup-Selection-8B-Merged

8B • Updated Mar 28 • 5