vincentoh
/

llama-8b-af-detector

Text Generation

alignment-faking

interpretability

Model card Files Files and versions

llama-8b-af-detector

Commit History

Upload README.md with huggingface_hub

7bb4cb1
verified

vincentoh commited on 17 days ago

Update README.md

3cd296c
verified

vincentoh commited on 17 days ago

Upload folder using huggingface_hub

85d9718
verified

vincentoh commited on 17 days ago

initial commit

0b54cbc
verified

vincentoh commited on 17 days ago