cs-552-2026-barn
/

general_knowledge_model

Model card Files Files and versions

general_knowledge_model

Commit History

Upload folder using huggingface_hub

d7a368e
verified

Nahush-27 commited on Jun 8

v7 ck1100: GRPO from base_fmt, step 1100/4000 (27.5%), eval-v2 16k: 57.2% MMLU-Pro / 27.8% SuperGPQA / 42.5% overall

a374228
verified

Nahush-27 commited on Jun 5

v7 ck1100: GRPO from base_fmt, step 1100/4000 (27.5%), eval-v2 16k: 57.2% MMLU-Pro / 27.8% SuperGPQA / 42.5% overall

3ae0570
verified

Nahush-27 commited on Jun 5

Replace grpo_gk with base_fmt: Qwen3-1.7B base + format-forcing chat template (default system prompt + per-question boxed reminder). Zero training. eval-v2 34.7% overall / 50.2% MMLU-Pro (vs grpo_gk 27.0%). Template pre-baked; not re-patched.

bbaf4f0
verified

Nahush-27 commited on Jun 2

Push SFT GK model (MMLU 3k + NaturalReasoning 3k, LoRA r=64)

e3c9ac3
verified

Nahush-27 commited on Jun 2

Push SFT GK model (MMLU 3k + NaturalReasoning 3k, LoRA r=64)

65b0a27
verified

Nahush-27 commited on May 30

Automated MNLP evaluation report (2026-05-20) (#1)

8c78441

zechen-nlp commited on May 20

Push SFT GK model (MMLU 3k + NaturalReasoning 3k, LoRA r=64)

c7eae7a
verified

Nahush-27 commited on May 19

Add patched chat template: thinking ON + system prompt baked in

47ed28a
verified

Nahush-27 commited on May 19

initial commit

31bd977
verified

Nahush-27 commited on May 16