razlapid
/

sae-gemma-3-4b-it-classifier

jailbreak-detection

sparse-autoencoder

Model card Files Files and versions

sae-gemma-3-4b-it-classifier

4.24 MB

Ctrl+K

Ctrl+K

1 contributor

History: 2 commits

razlapid's picture

Upload SAE guard probes

f377030 verified about 1 month ago