XiaoyuWen
/

PIA

persona-jailbreak

adversarial-self-play

instruction-tuning

large-language-model

Model card Files Files and versions

Commit History

Upload 2605.01899v1.pdf

8d11439
verified

XiaoyuWen commited on 21 days ago

update paper

49a723d

BattleWen commited on 21 days ago

initial commit

19e6991
verified

XiaoyuWen commited on 21 days ago