PracticalWork
/

Llama-3.2-1B-Instruct-tuned

Text Generation

Model card Files Files and versions

Llama-3.2-1B-Instruct-tuned / adapter_config.json

29thDay's picture

End of training

e285909 verified 7 months ago

history blame contribute delete

452 Bytes

	{
	"auto_mapping": null,
	"base_model_name_or_path": "meta-llama/Llama-3.2-1B-Instruct",
	"encoder_dropout": 0.0,
	"encoder_hidden_size": 128,
	"encoder_num_layers": 2,
	"encoder_reparameterization_type": "MLP",
	"inference_mode": true,
	"num_attention_heads": 32,
	"num_layers": 16,
	"num_transformer_submodules": 1,
	"num_virtual_tokens": 20,
	"peft_type": "P_TUNING",
	"revision": null,
	"task_type": "CAUSAL_LM",
	"token_dim": 2048
	}