millicentli
/

llama3_inversion_llama3_multi

Model card Files Files and versions

This is the model used to invert Llama-3-8B activations using a Llama-3-8B model (multiple, not a single, activation).

The model is used in Do Activation Verbalization Methods Convey Privileged Information?. Read more of our paper for training information.

Downloads last month: 8

Inference Providers NEW

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for millicentli/llama3_inversion_llama3_multi

Base model

meta-llama/Llama-3.1-8B

Finetuned

meta-llama/Llama-3.1-8B-Instruct

Adapter

(2743)

this model

Paper for millicentli/llama3_inversion_llama3_multi

Do Activation Verbalization Methods Convey Privileged Information?

Paper • 2509.13316 • Published May 13