SUITE - a apeleg Collection

apeleg 's Collections

updated 7 days ago

Fine-grained LLM unlearning benchmark

apeleg/SUITE

Viewer • Updated 40 minutes ago • 6.43k • 370

Note Core benchmark: forget_train / retain_train / forget_eval / retain_eval. Columns [topic, question, answer, label]; filter by `topic` to slice one subject.
apeleg/SUITE-rephrasings

Viewer • Updated 40 minutes ago • 300 • 217

Note Robustness split: forget_eval_rephrasings — eval questions paraphrased many ways (q_*/blank_* columns) for measuring whether forgetting survives rewordings.