Shunchang
/

sae-rm-checkpoints

Feature Extraction

sparse-autoencoder

interpretability

Model card Files Files and versions

sae-rm-checkpoints

Commit History

Update README.md

31d33e9
verified

Shunchang commited on Jun 14

Create README.md

86ae929
verified

Shunchang commited on Jun 14

Upload qwen-3-4b_layer28

0224000
verified

Shunchang commited on May 7

Upload qwen-3-4b_layer20

c418cb4
verified

Shunchang commited on May 7

Upload qwen-3-4b_layer4

a9e0b0a
verified

Shunchang commited on May 7

Upload llama-3-8b_layer28

8fb8d4a
verified

Shunchang commited on May 7

Upload llama-3-8b_layer20

59c7c94
verified

Shunchang commited on May 7

Upload llama-3-8b_layer4

12ce99e
verified

Shunchang commited on May 7

Upload llama-7b-poisoned_layer28

8c688a4
verified

Shunchang commited on May 7

Upload llama-7b-poisoned_layer20

d0cbaa1
verified

Shunchang commited on May 7

Upload llama-7b-poisoned_layer4

5132601
verified

Shunchang commited on May 7

Upload beaver-2-7b_layer28

e7e6ee0
verified

Shunchang commited on May 7

Upload beaver-2-7b_layer20

c879415
verified

Shunchang commited on May 7

Upload beaver-2-7b_layer4

2189059
verified

Shunchang commited on May 7

Upload qwen-3-4b_layer12

2cf6f26
verified

Shunchang commited on May 7

Upload llama-3-8b_layer12

4a3bd76
verified

Shunchang commited on May 7

Upload llama-7b-poisoned_layer12

8a37904
verified

Shunchang commited on May 7

Upload beaver-2-7b_layer12

e8e42d6
verified

Shunchang commited on May 7

initial commit

124cda9
verified

Shunchang commited on May 7